MarkTechPost ★ 98 3 min

Sakana AI Launches Sakana Fugu: An Orchestration Model That Routes Tasks Across a Swappable Pool of Frontier LLMs

Agentic AIAI AgentsAI InfrastructureGenerative AILanguage ModelLarge Language ModelSoftware Engineering

🔗 https://www.marktechpost.com/2026/06/22/sakana-ai-launches-sakana-fugu-an-orchestration-model-that-routes-tasks-across-a-swappable-pool-of-frontier-llms/

📌 Sakana AI 推出 Sakana Fugu:單一端點即能在多模型間自動編排任務

TL;DR:Fugu 讓開發者只呼叫一次 API,內部會自動選擇、協調與驗證多個前緣 LLM,降低供應商鎖定風險。

🎣 一個看似單一模型的多代理系統
Sakana AI 今日發布的 Sakana Fugu,聲稱「對外只是一個模型」,實際上是由一群可交換的 LLM 組成的編排平臺。使用者只需向單一端點傳送請求,Fugu 會自行判斷是直接產出答案,還是召集多個專家模型組成團隊完成任務。這種「模型內部的多代理」概念,讓開發者免除自行撰寫多模型工作流的負擔。

🤔 為何需要這樣的編排層
目前許多應用直接繫結單一雲端提供商的 LLM,若供應商因政策或授權限制(例如報導中提到的 Anthropic Fable、Mythos 受出口管制)而無法使用,服務將瞬間中斷。Fugu 透過可交換的模型池(包括自身的遞迴例項)作為「對沖」機制,確保即使某家供應商被限制,仍能自動切換至其他可用模型。

🧩 核心架構與學習方式
Fugu 本身也是一個語言模型,專門學會呼叫「代理池」中的其他 LLM。池內模型可包括 OpenAI、Anthropic、以及自身的遞迴例項。編排流程分為三個關鍵步驟:

  1. 模型選擇:根據輸入任務型別,Fugu 判斷哪個模型最適合(或是否需要多模型合作)。
  2. 委派與驗證:Fugu 為每個子任務指派「Thinker」(思考)、 「Worker」(執行) 或 「Verifier」(驗證) 角色,讓模型間以自然語言互動。
  3. 結果合成:完成子任務後,Fugu 會將各模型的輸出合併,產生最終答案返回給呼叫端。

Fugu 內建兩種編排策略,分別對應 ICLR 2026 發表的兩篇論文:

  • Trinity:使用輕量級協調器,於多輪對話中動態分配 Thinker、Worker、Verifier 角色。
  • Conductor:透過強化學習訓練,探索自然語言協調策略與針對多模型池的專屬提示(prompt)。

⚠️ 效能測試與限制
報導中提到,Sakana AI 以自家編排系統對比其所編排的基礎模型,使用「SWE Bench Pro」作為測試平臺,結果顯示 Fugu 在 11 個測試專案中有 10 項取得最高分,且在四項程式碼基準測試中領先。值得注意的是,這些分數皆基於供應商自行報告的基線,未提供完整的實驗細節或統計資訊,讀者仍需自行驗證其廣泛適用性。

🎯 實務啟示

  • 簡化開發流程:只需管理單一 API 金鑰,即可自動受益於多家 LLM 的專長。
  • 降低供應商風險:在政策變動或服務中斷時,系統能自動切換模型,提升服務韌性。
  • 可擴充的模型池:新模型推出後可直接加入池中,無需重新設計工作流。

🔗 來源

#LLM #Orchestration #MultiAgent #AI #SakanaAI #Fugu #ModelSelection #ReinforcementLearning #AIResilience #SoftwareEngineering

google/gemma-4-31b-it:free 自動生成