GitHub Copilot、ユーザーの操作データをAI学習に活用へ
データ活用の概要
4月24日から学習利用開始
Free・Pro・Pro+が対象
Business・Enterpriseは対象外
設定画面からオプトアウト可能
収集データの範囲
入出力やコード断片を収集
ファイル名やリポジトリ構造も対象
フィードバックや操作履歴を活用
Microsoft関連会社とデータ共有
出典:GitHub公式
詳細を読む
GitHubは2026年4月24日より、Copilot Free、Pro、Pro+ユーザーの操作データをAIモデルの学習に活用する方針を発表しました。対象データには入出力、コード断片、関連コンテキストが含まれ、ユーザーはオプトアウトにより学習利用を拒否できます。
収集対象となるデータは、ユーザーが受け入れまたは修正した出力、Copilotに送信された入力やコード断片、カーソル周辺のコードコンテキスト、コメントやドキュメント、ファイル名やリポジトリ構造、Copilot機能との操作履歴、提案に対するフィードバックなど多岐にわたります。
Copilot BusinessおよびEnterprise、企業所有リポジトリのデータは対象外です。また、オプトアウト済みユーザーのデータも学習に使用されません。プライベートリポジトリの保存データは対象外ですが、Copilot利用中に処理されるデータはオプトアウトしない限り学習に使われる可能性があります。
GitHubはこの方針の背景として、Microsoft社員の操作データを学習に取り入れた結果、複数言語での提案受入率が向上したことを挙げています。実際の開発ワークフローから得られるデータにより、より正確で安全なコードパターンの提案やバグの早期発見が可能になるとしています。
収集データはMicrosoftを含むGitHub関連会社と共有される一方、サードパーティのAIモデルプロバイダーや独立したサービス事業者には提供されません。以前にデータ収集をオプトアウトしていたユーザーの設定はそのまま維持され、改めてオプトインしない限り学習には使用されません。