Cohere、218B言語モデルをOSSで初公開
詳細を読む
カナダのAI企業Cohereは2026年5月20日、218億パラメータの大規模言語モデルCommand A+を発表しました。同社として初めてApache 2.0ライセンスで公開され、企業や開発者が商用目的で自由に利用・改変・再配布できます。「Attention Is All You Need」の共著者でもあるCEOのAidan Gomez氏が主導した今回のリリースは、企業が自社環境でAIを完全に制御する「ソブリンAI」構想の具体化です。
Command A+の最大の特徴は、Sparse Mixture-of-Experts(MoE)アーキテクチャにあります。218Bの総パラメータのうち、推論時に稼働するのはわずか25Bです。これにより、OpenAIやAnthropicの数兆パラメータ規模のモデルと比較して、大幅に少ない計算資源で動作します。
さらに注目すべきはロスレス量子化技術です。MoEエキスパート部分のみを4bitに圧縮し、注意機構は高精度のまま維持する手法により、ほぼ性能を損なわずに圧縮を実現しました。その結果、NVIDIA B200 1基またはH100 2基で動作可能となり、出力速度は前世代比で最大63%向上、レイテンシは17%低減しています。
ベンチマーク性能も大幅に改善されています。複雑な推論テストτ²-Bench Telecomで37%から85%へ、数学のAIME 25で57%から90%へと飛躍しました。エージェント型コーディングではDeepSeekやGLMに後れを取るものの、25Bの稼働パラメータでこの成績は際立っています。
企業利用で重要なネイティブ引用生成機能も搭載されています。外部ツールから取得した情報について、出典元を明示的にリンクする仕組みです。金融・医療・法務など規制の厳しい業界では、ハルシネーションのリスク低減に直結します。マルチモーダル対応や128Kトークンのコンテキスト長、48言語対応の新トークナイザにより、グローバル企業の多様なニーズに応えます。
Apache 2.0での公開は、これまでCC-BY-NC 4.0で非商用に限定していたCohereの方針転換を意味します。企業は自社サーバーやエアギャップ環境でモデルを自由にファインチューニング・デプロイでき、ベンダー依存から完全に解放されます。Hugging FaceやvLLMとの即日連携も実現しており、オープンソースAIエコシステムの成熟を示すリリースといえます。