Anthropic、最上位モデルClaude Opus 4.7を一般公開

性能と主要ベンチマーク

GDPVal-AAでElo 1753を記録
SWE-bench Proで64.3%達成
GPT-5.4やGemini 3.1 Proを上回る成績
画像解像度が3倍以上に向上

安全対策と提供形態

サイバーセキュリティ用自動検知を搭載
正規セキュリティ専門家向け認証制度を新設
価格は据え置きで主要クラウドに対応
新たにxhigh思考レベルを追加
詳細を読む

Anthropicは2026年4月16日、大規模言語モデルの最新版Claude Opus 4.7を一般公開しました。同社によると、前世代のOpus 4.6から高度なソフトウェアエンジニアリング能力が大幅に向上し、複雑で長時間にわたるタスクを高い精度で自律的に処理できるようになっています。価格はOpus 4.6と同じ入力100万トークンあたり5ドル、出力100万トークンあたり25ドルで、APIのほかAmazon Bedrock、Google Cloud Vertex AI、Microsoft Foundryで利用可能です。

主要ベンチマークでは、知識労働を評価するGDPVal-AAでEloスコア1753を記録し、OpenAIGPT-5.4(1674)やGoogleGemini 3.1 Pro(1314)を上回りました。エージェントコーディング評価のSWE-bench Proでは64.3%のタスクを解決し、Opus 4.6の53.4%から大きく改善しています。ただし、エージェント検索やマルチリンガルQAなど一部の領域ではGPT-5.4がなお優位であり、全分野で圧倒する結果ではありません。

視覚処理面では、画像の最大解像度が長辺2,576ピクセル(約375万画素)まで拡大され、従来比3倍以上の高解像度入力に対応しました。XBOWの視覚精度ベンチマークでは成功率が54.5%から98.5%に跳ね上がり、画面操作エージェントや複雑な図面からのデータ抽出といった用途の実用性が大きく高まっています。また、自身の出力を検証してから報告する「自己検証」行動が確認されており、ハルシネーションの抑制にも寄与しています。

安全面では、同社が先日発表した高性能モデルMythos Previewセキュリティ上の理由で限定提供のままですが、Opus 4.7にはサイバー攻撃に関する高リスクな要求を自動検知・ブロックする仕組みが組み込まれました。脆弱性調査やペネトレーションテストなど正当な目的で利用したいセキュリティ専門家向けには、新たに「Cyber Verification Program」が設けられています。

開発者向けの新機能も複数追加されています。思考の深さを調整する「effort」パラメータにxhighレベルが加わり、性能とレイテンシのバランスをより細かく制御できます。APIではタスクバジェット機能がパブリックベータとして提供され、トークン消費量に上限を設定できるようになりました。早期テスターのIntuit、ReplitNotionCursorなど多数の企業が、コード品質やワークフロー効率の改善を報告しています。