Hugging FaceがAIエージェント用語集を公開

2026年05月25日 Claude Claude Code Codex エンジニア推論ポリシー

主要用語の整理

ハーネスはモデル実行層

スキャフォールドは振る舞い定義層

エージェント=モデル+ハーネスの定式化

コンテキストエンジニアリングの体系化

訓練と実装の概念

ポリシーは行動確率分布を定義

スキルはツールより高次の再利用単位

サブエージェントによる自律的分業

RL環境・報酬設計の用語も網羅

出典：Hugging Face

詳細を読む

Hugging Faceは2026年5月25日、AIエージェント分野で混乱しがちな専門用語を整理した用語集「Harness, Scaffold, and the AI Agent Terms Worth Getting Right」を公開しました。ICLR 2026での議論をきっかけに、ハーネスやスキャフォールドといった用語の定義が人によって異なる問題を解消することを目的としています。

用語集の核心は、エージェントを構成する要素の分離です。モデルはテキストを入出力するLLMそのもので、単体ではループも記憶も持ちません。スキャフォールドはシステムプロンプトやツール定義、コンテキスト管理などモデルの振る舞いを規定する層です。ハーネスはモデルを呼び出しツールコールを処理し停止条件を判断する実行層で、「Agent = Model + Harness」という定式が示されています。

実務に直結する概念も体系化されています。コンテキストエンジニアリングは各ステップでモデルが参照する情報を設計する技術で、短期記憶と長期記憶の管理を含みます。スキルはツール（単一アクション）より高次の再利用可能な知識パッケージで、バグ調査から修正までの一連の手順を束ねるものです。サブエージェントは別のエージェントから呼ばれ、独自に推論しツールを使い結果を返す自律的な単位として定義されています。

訓練領域の用語も整理されています。RL環境はエージェントが行動を入力し観察を受け取る対話対象、トレーナーは多数のエピソードを実行し報酬に基づきモデルの重みを更新する仕組みです。報酬はテスト合否のような検証可能なものからLLM-as-judgeのような学習型まで分類され、ルーブリックによる多次元評価も紹介されています。

Claude CodeやCodex、Cursorといった製品は同じモデルを使っていてもハーネスの設計次第で体験が大きく変わると指摘されており、エージェント開発者にとって各層の役割を正確に理解する重要性が強調されています。用語の統一的な定義はまだ存在しないものの、議論を円滑にする実用的な共通言語として活用できる内容です。