MIT、チャート解釈AI向け100万件超のデータセット公開

ChartNetの特徴

100万件超の合成チャート画像を収録
コード・テキスト・数表を同時収録
自動品質チェックで正確性を担保
人間専門家による注釈データも併載

小規模モデルの性能向上

小型オープンソースモデルが大規模商用モデルを凌駕
データ抽出・要約・質問応答の全タスクで精度改善
限られた予算の企業でもAI活用が可能に
詳細を読む

MITMIT-IBMコンピューティング研究ラボの研究チームは2026年6月3日、ビジョン言語モデル(VLM)にチャート解釈能力を教えるための大規模データセット「ChartNet」を発表しました。金融レポートや市場分析に頻出するチャートの読み取りは企業にとって重要な課題ですが、最新のVLMでも視覚・数値・言語の統合的理解が求められるため精度が不十分でした。ChartNetはこの課題に正面から取り組む資源です。

ChartNetには100万件を超える高品質なチャート画像が収録されています。各画像にはチャート生成に使われたコード、テキスト説明、数値テーブル、そして質問応答ペアが付属しており、モデルがチャートに含まれる多様な情報を関連づけて学習できる設計です。1枚のチャートから数百のバリエーションを自動生成する2段階パイプラインにより、大規模かつ多様なデータを実現しました。

注目すべきは実験結果です。ChartNetで訓練した小型のオープンソースモデルが、桁違いに大きな商用モデルをデータ抽出・要約・質問応答の各タスクで上回りました。IBMのGranite Visionシリーズをはじめ、複数のモデルで一貫した精度向上が確認されています。これは膨大な計算資源を持たない中小企業にとって、AIによるチャート分析を現実的な選択肢にする成果です。

この研究はIEEE CVPRカンファレンスで発表されます。研究チームは今後、より複雑なチャートデータの追加やコミュニティからのフィードバック反映を通じてChartNetを拡張する計画です。ビジネストレンド分析や科学論文の図表解釈など、チャート理解が求められるあらゆる業務での活用が期待されます。