AnthropicがOpus 4.5発表、性能と対費用効果で他社圧倒

コーディング性能で世界首位を奪還

SWE-benchで80.9%を記録し首位
社内試験で人間のエンジニアを凌駕
推論エージェント操作でSOTA達成

実用性を高める新機能と価格戦略

入力5ドル・出力25ドルへ大幅値下げ
推論深度を調整できるEffort機能
文脈を維持し続ける無限チャット
@ctgptlbのXポスト: 現時点で最高性能を叩き出したコーディングモデル、「Claude Opus 4.5」について知っておくべきことまとめ Claude Opus 4.5 について重要な情報をまとめました。エンジニア採用試験で人間超えを記録するなど、必見の内容です。 ・Anthropic は Clau…
詳細を読む

Anthropicは24日、最上位AIモデル「Claude Opus 4.5」を発表しました。コーディングエージェント操作で世界最高性能を達成しつつ、利用料を大幅に引き下げたのが特徴です。OpenAIGoogleとの競争が激化する中、エンジニアリング能力とコスト効率の両立で市場の覇権を狙います。

特筆すべきは実務能力の高さです。開発ベンチマーク「SWE-bench Verified」で80.9%を記録し、競合モデルを凌駕しました。同社の採用試験でも、制限時間内に人間のエンジニア候補を超える成績を収めています。

コストパフォーマンスも劇的に向上しました。価格は入力5ドル・出力25ドルと大幅に低減。新機能「Effortパラメータ」を使えば、タスクの重要度に応じて推論の深さと消費コストを柔軟に調整し、最適化できます。

ユーザー体験の制限も解消されました。会話が長引くと自動要約で文脈を維持する「無限チャット」を導入。ExcelやChromeとの連携も強化され、複雑なワークフローを中断することなく自律的に遂行可能です。

企業利用を見据え、安全性も強化されています。悪意ある命令を防ぐ「プロンプトインジェクション」への耐性は業界最高水準に到達。性能、コスト、安全性の全方位で進化した本モデルは、AIエージェントの実用化を加速させるでしょう。