Stanfordの分散型DeLMが司令塔なしで多エージェント費用を半減

2026年06月16日 DeepSeek Gemini Claude ワークフロー GPT-5 Sonnet

中央制御の限界

主エージェントが通信ボトルネック

情報の希釈・欠落・歪曲のリスク

サブタスク増加で協調が遅延

DeLMの仕組み

検証済み知見の共有コンテキスト

エージェントが自律的にタスク取得

失敗・制約も共有し重複探索を回避

性能と意義

SWE-bench Verifiedで精度10.5%向上

タスク当たり費用を約50%削減

出典：VentureBeat

詳細を読む

米Stanford大の研究者が2026年6月、中央オーケストレーターを持たない新しいマルチエージェント基盤DeLM（分散型言語モデル）を論文で発表しました。複数のAIエージェントが主エージェントを介さず直接協調し、ソフトウェア開発のベンチマークで費用を約50%削減しながら精度を高めた点が注目されています。

従来のマルチエージェント構成では、主エージェントがタスクを分割して各サブエージェントに割り当て、結果を集約・要約してから次の指示を出します。研究者のMao氏とMirhoseini氏は、この方式ではサブタスクが増えるほど主エージェントが通信と統合のボトルネックになると指摘します。さらに有用な情報が希釈・省略・歪曲され、進捗が失われる恐れもあります。

DeLMはこの前提を覆し、並列エージェント・共有コンテキスト・タスクキューの三要素で構成されます。共有コンテキストは検証済みの知見や失敗、制約をまとめた「gist（要約）」の保管庫として機能し、後続のエージェントが直接読み取れます。各エージェントはキューから自律的にタスクを取得し、互いの進捗を非同期に参照しながら作業を進めます。

性能面では、実際のソフトウェア開発課題を評価するSWE-bench Verifiedで最強のベースラインより10.5%高い精度を示し、タスク当たりの費用を約50%削減しました。長文脈の多文書質問応答LongBench-v2でも、GPT-5.4やClaude Sonnet、Gemini Flash、DeepSeek-V4-Proを含む4系統のモデルで最高精度を記録しています。

高性能の理由の一つは失敗の共有です。通常の並列実行では誤った経路が各エージェント内に留まり、他のエージェントが同じ袋小路をたどって時間と費用を浪費します。DeLMでは失敗した仮説や検証済みの制約が共有状態に書き込まれ、後続のエージェントが制約として読み取り無駄な探索を避けられます。

また共有情報は「展開可能（unfoldable）」な設計で、既定では短い要約だけを見せ、必要に応じて詳細な根拠まで掘り下げられます。これにより文脈窓の圧迫を抑えつつ精度を保てます。企業の開発者にとってDeLMは、すべてのワークフローに中央制御が必要だという常識に再考を迫る成果と言えるのではないでしょうか。