RAG代替手法DCI、検索コスト30%削減
詳細を読む
複数大学の研究チームが、AIエージェントの情報検索において従来のRAG(検索拡張生成)を代替する新手法「Direct Corpus Interaction(DCI)」を発表しました。DCIはベクトルデータベースを介さず、grep・find・sedなどの標準的なコマンドラインツールでコーパスを直接検索する仕組みです。論文によれば、従来のRAGでは埋め込みモデルによる類似度検索が「エージェントが見られる情報を早い段階で決めてしまう」ボトルネックになっていました。
DCIでは、エージェントがターミナル環境でシェルパイプラインを組み合わせ、正規表現による厳密な文字列検索や複数条件の絞り込みを実行します。これにより、エラーコードやファイルパスなど意味的類似検索では捉えにくい長尾の詳細情報を正確に抽出できます。さらに、埋め込みインデックスの再構築が不要なため、日次レポートやログなど常に変化するデータにもリアルタイムで対応します。
ベンチマーク評価では、Claude Sonnet 4.6を基盤とするDCI-Agent-CCがBrowseComp-Plusで精度80.0%を達成し、従来のベクトル検索手法の69.0%を大きく上回りました。同時にAPIコストは1,440ドルから1,016ドルへと約30%削減されています。軽量版のDCI-Agent-Liteも、GPT-5.4 nanoモデルで従来のo3モデル+検索の組み合わせに匹敵する性能を600ドル以上安く実現しました。
一方で課題も明確です。コーパス規模が10万件から40万件に拡大すると精度が大幅に低下し、ツール呼び出し回数も増加します。研究チームは「DCIは既存のベクトル検索の完全な代替ではなく補完」と位置づけ、意味検索で候補を広く取得し、DCIで精密な検証を行うハイブリッド構成を推奨しています。コードはMITライセンスでGitHubに公開されており、実務での検証が可能です。