a16zが提唱、データエージェントに不可欠な「コンテキスト層」

エージェント失敗の本質

業務定義の欠如が主因
収益の定義すら組織で不統一
セマンティック層は陳腐化
データソースの正解が不明確

コンテキスト層の構築手順

全データソースへの接続が前提
LLMで初期コンテキスト自動生成
暗黙知は人間が補完
APIやMCPでエージェントに接続
詳細を読む

Andreessen Horowitza16z)は、企業のデータエージェントが基本的な質問にすら正確に答えられない原因として、ビジネスコンテキストの欠如を指摘しました。MITの2025年報告でもAI導入の大半が失敗していると警告されています。

問題の核心はテキストtoSQLの精度だけではありません。「先四半期の収益成長率は?」という単純な質問でも、収益の定義がARRか実行レートかで異なり、会計年度の区切りも企業ごとに違うため、エージェントは正しいデータを特定できないのです。

従来のセマンティック層はBI向けの指標定義には有効でしたが、退職した担当者が更新を放置し、新規プロダクトラインが反映されないなどの問題が頻発しています。エージェントの自律動作には、より包括的なコンテキスト基盤が必要です。

a16zが提唱するコンテキストは5段階で構築します。まず全データソースへのアクセスを確保し、LLMでクエリ履歴やdbtモデルから自動的にコンテキストを収集します。次に人間が暗黙知を補完し、APIやMCPでエージェントに接続します。

市場ではDatabricksやSnowflakeなどのデータ基盤企業、既存のAIデータ分析企業、そして新興の専用コンテキスト層企業が競合しています。OpenAIも自社内データエージェントの構築過程を公開しており、この領域の重要性が広く認識され始めています。