2026-06-22 · Sakana AI Launches Sakana Fugu: An Orchestration Model That Routes Tasks Across a Swappable Pool of Frontier LLMs

📌 Sakana AI 推出 Sakana Fugu：單一端點即能在多模型間自動編排任務

TL;DR：Fugu 讓開發者只呼叫一次 API，內部會自動選擇、協調與驗證多個前緣 LLM，降低供應商鎖定風險。

🎣 一個看似單一模型的多代理系統
Sakana AI 今日發布的 Sakana Fugu，聲稱「對外只是一個模型」，實際上是由一群可交換的 LLM 組成的編排平臺。使用者只需向單一端點傳送請求，Fugu 會自行判斷是直接產出答案，還是召集多個專家模型組成團隊完成任務。這種「模型內部的多代理」概念，讓開發者免除自行撰寫多模型工作流的負擔。

🤔 為何需要這樣的編排層
目前許多應用直接繫結單一雲端提供商的 LLM，若供應商因政策或授權限制（例如報導中提到的 Anthropic Fable、Mythos 受出口管制）而無法使用，服務將瞬間中斷。Fugu 透過可交換的模型池（包括自身的遞迴例項）作為「對沖」機制，確保即使某家供應商被限制，仍能自動切換至其他可用模型。

🧩 核心架構與學習方式
Fugu 本身也是一個語言模型，專門學會呼叫「代理池」中的其他 LLM。池內模型可包括 OpenAI、Anthropic、以及自身的遞迴例項。編排流程分為三個關鍵步驟：

模型選擇：根據輸入任務型別，Fugu 判斷哪個模型最適合（或是否需要多模型合作）。
委派與驗證：Fugu 為每個子任務指派「Thinker」(思考)、「Worker」(執行) 或「Verifier」(驗證) 角色，讓模型間以自然語言互動。
結果合成：完成子任務後，Fugu 會將各模型的輸出合併，產生最終答案返回給呼叫端。

Fugu 內建兩種編排策略，分別對應 ICLR 2026 發表的兩篇論文：

Trinity：使用輕量級協調器，於多輪對話中動態分配 Thinker、Worker、Verifier 角色。
Conductor：透過強化學習訓練，探索自然語言協調策略與針對多模型池的專屬提示(prompt)。

⚠️ 效能測試與限制
報導中提到，Sakana AI 以自家編排系統對比其所編排的基礎模型，使用「SWE Bench Pro」作為測試平臺，結果顯示 Fugu 在 11 個測試專案中有 10 項取得最高分，且在四項程式碼基準測試中領先。值得注意的是，這些分數皆基於供應商自行報告的基線，未提供完整的實驗細節或統計資訊，讀者仍需自行驗證其廣泛適用性。

🎯 實務啟示

簡化開發流程：只需管理單一 API 金鑰，即可自動受益於多家 LLM 的專長。
降低供應商風險：在政策變動或服務中斷時，系統能自動切換模型，提升服務韌性。
可擴充的模型池：新模型推出後可直接加入池中，無需重新設計工作流。

🔗 來源

標題：Sakana AI Launches Sakana Fugu: An Orchestration Model That Routes Tasks Across a Swappable Pool of Frontier LLMs
作者／機構：Asif Razzaq / MarkTechPost
連結：https://www.marktechpost.com/2026/06/22/sakana-ai-launches-sakana-fugu-an-orchestration-model-that-routes-tasks-across-a-swappable-pool-of-frontier-llms/

#LLM #Orchestration #MultiAgent #AI #SakanaAI #Fugu #ModelSelection #ReinforcementLearning #AIResilience #SoftwareEngineering

同來源相關文章