詳細を見る
AIスタートアップのSakana AIは6月21日夜、複数のAIモデルを動的に束ねて最先端水準の性能を出すマルチエージェント基盤「Fugu(フグ)」を公開しました。開発者や企業、国家が特定ベンダーへの依存や地政学的な輸出規制から守られることを狙い、OpenAI互換の単一APIを通じて専門化したAIエージェント群へ問い合わせを動的に振り分ける仕組みです。
Fuguは巨大な単一モデルに頼る従来構造を回避し、優れた総合請負業者のように動きます。複雑な要求を受けると自ら全てを実行せず、問題を分解して専門の基盤モデル群に下請けさせ、その成果を検証したうえで最終出力を統合します。Sakanaは「Fugu自体がLLMであり、エージェント群の各LLMや自分自身を再帰的に呼び出すよう訓練されている」と説明しています。
背景には、6月12日にAnthropicが米政府の輸出規制命令を受け、最上位モデルのClaude Fable 5とMythos 5への一般アクセスを停止した事情があります。CEOで共同創業者のDavid Ha氏はXで「単一企業のモデルに国家インフラを頼るのは巨大なリスクだ。集合知こそ権力集中への実用的な備えになる」と述べ、Fuguが交換可能なエージェント群でベンダー制限を回避すると強調しました。
性能面でも存在感を示しています。コーディング能力を測るLiveCodeBenchではFugu Ultraが93.2、通常版Fuguが92.9を記録し、Claude Fable 5の89.8を上回りました。ソフトウェア課題を扱うSWE-Bench ProではUltraが73.7で、Claude Opus 4.8(69.2)やGPT-5.5(58.6)を明確に上回っています。
一方で価格は高めです。商用のプロプライエタリAPIとして提供され、どのモデルを選ぶかは利用者から意図的に隠されます。Fugu Ultraは100万トークンあたり入力5ドル・出力30ドルの固定料金で、単一モデルAPIと比べ高価な部類に入ります。月額は20ドルから200ドルの3段階で、EUとEEAではGDPR対応のため当面利用できません。
コミュニティの反応は分かれています。ある開発者は「単一の明快なプロンプトなら直接モデルを使うだろうが、委任や検証、調査ループを伴う複雑な作業ほどFuguが活きる」と評価しました。他方で「これは閉じたモデル群の上に乗る閉じたオーケストレーターにすぎず、AI主権とは言えない」との批判もあり、単一の巨大モデルがなお優位とみる声も残っています。