MiniMax M3、低コストで主要モデル超え
詳細を読む
中国のAIスタートアップMiniMaxは6月1日、大規模言語モデル「M3」を公開しました。100万トークンの文脈長とネイティブな多モーダル機能を備え、主要ベンチマークの一部でGPT-5.5やGemini 3.1 Proを上回りながら、価格は米大手プロプライエタリモデルのわずか8〜20%に抑えた点が最大の特徴です。月額20ドルからのサブスクリプションで提供されます。
性能面では、自律エージェント指標のSWE-Bench Proで59.0%を記録し、GPT-5.5やGemini 3.1 Proを上回りました。BrowseCompでは83.5%を獲得し、Claude Opus 4.7の79.3%を超えています。一方で、先週公開されたClaude Opus 4.8には同指標で69.2%対59.0%と差をつけられ、複雑な推論を要する領域では依然としてクローズドモデルが優位を保っています。
低コストを支えるのが、新開発のMiniMax Sparse Attention(MSA)です。従来のTransformerは入力が長くなるほど計算量が二乗で増えますが、MSAは事前選別でKVブロックを効率処理することでこれを回避します。100万トークン処理時の演算負荷は前世代の20分の1に低下し、デコードは15倍に高速化しました。
同社はM3をオープンウェイトライセンスで10日以内に公開する方針です。これにより企業は自社ハードウェア上でローカル実行でき、公開API経由でのデータ漏洩リスクを排除できます。独自のファインチューニングや内部アーキテクチャの改変も可能になり、汎用モデルを専有資産に転換できる点が、コンプライアンス重視の企業に響きます。
製品面では、AIエージェント「MiniMax Code」がエージェントチーム機能を提供します。生成役と検証役が敵対的に協調する「Producer+Verifier」ループにより、人手の監督なしで数日間自律稼働が可能です。実際の検証では、ICLR2025受賞論文の再現に約12時間自律で取り組み、18件のコミットと23の実験図を生成したと報告されています。
DeepSeek-V4 Pro Maxと比べてもM3はコード合成で優位を保ち、SWE-Bench Proで59.0%対55.4%と僅差で上回りました。次世代のエージェント開発は、巨大なデータセットだけでなく、効率的なアーキテクチャ設計が鍵を握ることをM3は示しています。