クエリログ活用でAIのSQL誤り6割超を解消
詳細を読む
データ統合プラットフォームのDataHubは、AIエージェントのSQL精度を改善する新機能「Context Intelligence」を発表しました。過去のSQLクエリ履歴を解析し、業務上の意味を構造化した「セマンティックアンカー」を生成することで、エージェントがテーブル結合やルーティングで誤る問題に対処します。MCP、LangChain、GoogleのAgent Development Kit、CrewAIの4つのフレームワークに対応しています。
導入事例として注目されるのが、デジタルコラボレーションツールのMiroです。同社がSnowflake環境にAIエージェントを直接接続したところ、1万超のテーブルに対して正答率は35%未満でした。スキーマ情報だけではどのテーブルがどの業務上の質問に対応するか判別できず、エージェントが誤ったJOINを生成していたのです。
Miroはデータを明確に定義された「データプロダクト」に整理し、DataHubの文脈レイヤーを介してエージェントがアクセスする構成に変更しました。ユーザーのリクエストはまずDataHubのMCPで適切なデータ資産にマッピングされ、その後SnowflakeのMCPでSQL生成が行われます。メタデータ、エンティティ関係、クエリ履歴、業務意図といった意味的シグナルにより、スキーマだけに頼らない正確なルーティングが可能になりました。
DataHubはLinkedInで約6年間の社内開発を経て2020年にオープンソース化されたプロジェクトで、現在は1万5000人以上のコントリビューターと3000以上の本番環境での導入実績があります。今回の機能は新規開発ではなく、長年のリネージ追跡で培われたクエリログ解析基盤の上に構築されています。
業界アナリストのConstellation Research・Michael Ni氏は、文脈の制御権を握る者がデータ・エージェント・意思決定の全レイヤーを支配すると指摘し、文脈管理を次の主要プラットフォーム戦争と位置づけています。DataHubはベンダー中立を掲げ、SnowflakeのセマンティックビューやMicrosoft Fabric IQなど既存のエンドポイントに文脈を供給する戦略を採っています。