GitHub、2月に6件の大規模障害が発生
主要インシデント概要
ActionsとCodespacesが約6時間停止
キャッシュ設定変更で2度の連鎖障害
Copilot含む複数サービスに波及
Dependabotが自動PR作成の10%失敗
原因と再発防止策
セキュリティポリシー誤適用が主因
キャッシュ書込み増幅で接続枯渇
監視強化と自動ロールバック追加
根本原因と対策をブログで公開
出典:GitHub公式
詳細を読む
GitHubは2026年2月に6件の大規模インシデントが発生し、開発者のワークフローに広範な影響を及ぼしたことを可用性レポートで報告しました。同社は根本原因と再発防止策を別途ブログ記事でも公開しています。
最大の障害は2月2日に発生したGitHub ActionsホステッドランナーとCodespacesの約6時間にわたる停止です。テレメトリ消失をきっかけにバックエンドストレージへのセキュリティポリシーが誤って適用され、VM操作が全面的に失敗しました。
2月9日にはキャッシュ設定変更に起因する障害が2度発生し、合計約2時間43分にわたってgithub.comやAPI、Git操作、Copilotなどが利用困難になりました。非同期・同期双方のキャッシュ書き込みが共有インフラを圧迫し、接続枯渇を引き起こしています。
2月12日にはCodespacesの障害が欧州・アジア・豪州で発生し、ピーク時には作成・再開の90%が失敗しました。認証クレーム変更がネットワーク依存関係に波及したことが原因で、アラートの重大度設定が不適切だったため検知が遅れています。
GitHubはこれらの障害を受け、監視・アラートの強化、キャッシュ機構の最適化、自動フェイルオーバーの改善、ポリシー変更時の安全なロールアウト手順の整備など、短期・長期のレジリエンス向上策を進めていると表明しています。