GitHubが社内データ分析AIエージェントQubotを自社開発

自然言語で分析

全社員が自然言語でデータ照会
数秒で回答する探索型分析
SlackとVS Code、CLIで利用
ダッシュボードの代替ではない探索用途

文脈層が要

銅銀金の三層データに文脈付与
構造化文脈で精度と3倍速を両立
KustoとTrinoを自動切替

成果と展開

数百人が数千件の照会を実行
詳細を読む

GitHubは2026年6月19日、社内データ分析AIエージェントQubotの開発手法を自社ブログで公開しました。Qubotは同社のCopilotを基盤とし、全社員がデータウェアハウスに対し自然言語で質問すると数秒で回答を得られる仕組みです。専任のデータアナリストに頼らず、各チームが自律的にデータを探索できる点が特徴です。

Qubotはレポート作成やダッシュボードの代替ではなく、探索的な問いに答えるための道具と位置づけられています。たとえば「この機能で最も継続率が高い利用者層はどれか」といった質問に対応します。データに不慣れなチームでも素早く習熟でき、維持コストはほぼゼロだといいます。

アーキテクチャはユーザーインターフェース、文脈層、クエリエンジンの三要素で構成されます。利用者はSlack、VS Code、Copilot CLIから接続でき、Slackで質問するとCopilot Cloud Agentが起動して回答を返します。結果はスレッドで対話的に深掘りでき、Markdown形式のレポートとしてプルリクエストにも保存されます。

成否を分けたのが文脈層です。データウェアハウスは生イベント(銅)、整形済みの事実と次元(銀)、業務向けに整えた金の三段階に分かれ、それぞれに製品チームやデータ分析チームが文脈を付与します。同社の実験では、構造化された質の高い文脈が回答精度を高めるだけでなく、正答到達を3倍速くしたとされます。

クエリエンジンはKustoとTrinoの二つをMCPサーバー経由で接続します。Kustoは直近データの探索に、Trinoは複雑な結合や履歴分析に適しており、Qubotは質問内容に応じて両者を自動で切り替えます。利用者はどちらを使うか意識する必要がありません。

導入は社内で広がり、数百人の社員が数千件の照会を実行しています。データ分析チームへの問い合わせは大幅に減り、各チームが自律的にデータを扱えるようになりました。製品チームや業務チームが文脈提供に参加するハブ&スポーク型の運営が成功した好例だと同社は評価しています。