AIエージェントが自らの運用規則を改善、性能向上

2026年06月22日リスクコーディング医療エージェントプロンプト基盤モデル

自己改善の仕組み

上海AI研究所が新枠組み発表

実行ログから失敗を分析

三段階の反復ループで規則更新

回帰テスト合格分のみ採用

効果と適用範囲

最大60%の相対的性能向上

モデル固有の弱点を狙い撃ち修正

計算コスト増という代償

医療や法務など高リスク領域は不向き

出典：VentureBeat

詳細を読む

上海人工知能研究所は2026年6月、AIエージェントが自らの運用規則（ハーネス）を改善する新枠組み「Self-Harness」を発表しました。エージェントが自身の実行ログを点検し、モデル固有の失敗パターンを見つけて修正案を生成、性能を検証してから採用する仕組みです。検証実験では、対象モデルに応じて33〜60%の相対的な性能向上を確認したとしています。

ハーネスとは、基盤モデルを取り巻く制御層を指します。システムプロンプトやツール、メモリ、検証ルール、障害復旧手順などが含まれ、エージェントの失敗の多くはモデル本体ではなくこのハーネスに起因します。従来は技術者が勘や限られた失敗例を頼りに手作業で調整しており、モデルの更新ペースに追従しづらいという課題がありました。

Self-Harness は三段階の反復ループで動きます。まず一連のタスクを実行して失敗の傾向を抽出し、次に各失敗に対応した最小限の修正案を複数生成します。最後に回帰テストで評価し、別のタスクで性能を下げずに改善した修正だけを次版に統合する流れです。人間の技術者や外部の強力なモデルに頼らない点が特徴です。

具体例も示されました。あるモデルは設定の探索を延々と続けて時間切れになっていましたが、Self-Harness が50回のツール呼び出しで方針転換を強制する規則を書き加えました。別のモデルには重複コマンドを禁じる規律を、さらに別のモデルにはシェル間で環境変数を保持する規則を追加するなど、症状に応じた対策を自動で組み込んでいます。

一方で代償もあります。論文の筆頭著者ハンファン・チャン氏は、繰り返しの修正案生成と並列評価によりAPIトークン消費や処理時間、評価基盤のコストが増えると指摘します。さらに自動更新の良否は評価パイプラインの精度に依存するため、厳密な検証器が欠かせません。コーディングや社内業務自動化、DevOps など失敗を測定しやすい領域が適し、医療や安全性が問われる分野は避けるべきだとしています。

チャン氏は、技術者の役割がプロンプト調整から「フィードバック設計者」へ移ると予測します。基盤モデルが高度化してもハーネスは消えず、その役割はモデルをより豊かな外部環境へつなぐ方向に広がるとの見方です。人間による評価が及ぶ限り、フィードバックの担い手として人の関与は欠かせないと結んでいます。