Karpathy提唱「9の行進」が示すAI信頼性の壁
信頼性の複利計算
10段階の処理で成功率急落
90%精度では1日6.5回の障害発生
99.9%で10日に1回の障害水準
共有依存関係の障害が支配的に
9つの改善レバー
ワークフローDAGで自律性を制約
全境界でJSON Schema契約を強制
リスクに応じた段階的ルーティング
本番評価パイプラインの常時運用
出典:VentureBeat
詳細を読む
Andrej Karpathy氏が提唱した「9の行進(March of Nines)」は、AIシステムの信頼性を90%から99%、99.9%へと高めるには、各段階で同等の工数が必要になるという法則です。エンタープライズ導入の成否を分ける重要な指標として注目されています。
エージェント型ワークフローでは、意図解析・検索・計画・ツール呼び出し・検証など複数ステップの失敗が複利的に蓄積します。各ステップの成功率が90%でも、10段階のワークフロー全体では成功率がわずか約35%に低下し、1日あたり約6.5回の障害が発生する計算になります。
信頼性向上の第一歩は、測定可能なSLO(サービスレベル目標)の定義です。ワークフロー完了率、ツール呼び出し成功率、スキーマ準拠率、ポリシー遵守率、p95レイテンシなどの指標を設定し、ティアごとにエラーバジェットを管理することが推奨されています。
記事では信頼性を高める9つのレバーが提示されています。明示的なワークフローグラフによる自律性の制約、全境界でのJSON Schema契約の強制、構文・意味・ビジネスルールの多層バリデーション、不確実性シグナルに基づくリスクルーティングなどが含まれます。
McKinseyの2025年調査によると、AIを利用する組織の51%が何らかの悪影響を経験し、約3分の1がAIの不正確さに起因する問題を報告しています。企業が後半の「9」を求める背景には、信頼性のギャップがそのままビジネスリスクに直結するという現実があります。