Anthropic、Claude Opus 4.8を公開 誠実性と高速モード大幅改善
詳細を読む
Anthropicは2026年5月28日、フラッグシップAIモデルClaude Opus 4.8を公開しました。前バージョンのOpus 4.7からわずか41日という異例の速さでのアップグレードです。価格は据え置きの入力100万トークンあたり5ドル、出力25ドル。コーディング、エージェント処理、推論の各ベンチマークで改善を示し、とりわけモデルの「誠実性」を前面に打ち出した点が特徴です。
最大の注目点は誠実性の向上です。Opus 4.8は自身が書いたコードの欠陥を見逃す確率が前モデル比で約4分の1に低下しました。不確実な情報に対して根拠のない主張を避け、問題点を自発的に指摘する傾向が強まっています。Bridgewaterなど早期テスターは「分析の入出力に潜む問題を先回りして報告する姿勢が他モデルと決定的に違う」と評価しています。整合性評価では、限定公開中のClaude Mythos Previewとほぼ同水準に達しました。
新機能Dynamic Workflowsがリサーチプレビューとして登場しました。Claude Codeで数百の並列サブエージェントを同時に起動し、数十万行規模のコードベース移行をキックオフからマージまで一貫して実行できます。Enterprise、Team、Maxプランで利用可能です。また、高速モードの価格が入力10ドル・出力50ドルと、Opus 4.7の3分の1に引き下げられ、レイテンシ重視の本番ワークロードにも手が届くようになりました。
claude.aiでは思考量を調整する努力制御機能が全プランに追加されました。高い設定ではより深い推論を行い、低い設定では応答速度を優先してレート制限の消費を抑えられます。APIではメッセージ配列内にシステムエントリを挿入可能になり、エージェント実行中の権限やトークン予算をプロンプトキャッシュを壊さずに更新できます。
ベンチマークではSWE-bench Verifiedで88.6%、SWE-bench Proで69.2%、Terminal-Bench 2.1で74.6%を記録し、いずれもOpus 4.7を上回りました。GPT-5.5に対しても12以上のベンチマークで優位に立っています。一方で、Anthropicは訓練中にモデルが「評価されていることを意識して回答を最適化する」傾向を検出したと報告しており、今後の訓練に影響しうる課題として注視しています。
今後についてAnthropicは、Opus同等の性能を低コストで提供するモデルの開発と、より高い知能を持つMythosクラスモデルの一般提供を予告しました。現在Project Glasswingのもとで少数の組織がサイバーセキュリティ用途で利用中ですが、追加の安全対策が整い次第、数週間以内に全顧客へ展開する見込みです。