Z.aiの公開重みGLM-5.2、低コストでGPT-5.5を上回る

性能と価格

SWE-benchでGPT-5.5超え
API出力料金は6分の1
MITライセンスで無制限利用
1Mトークンの長文脈対応

技術と展開

IndexShareで計算量2.9倍削減
Claude CodeなどでDay1対応
開発者から高評価
詳細を読む

中国のAIスタートアップZ.aiは6月16日、7530億パラメータの公開重みモデルGLM-5.2を即日リリースしました。長時間にわたる自律的なコーディングや開発作業に特化して設計され、Hugging FaceやZ.aiのAPI、20以上のサードパーティ開発環境で利用できます。月額12.6ドルからの料金体系と100万トークンの文脈長を備え、企業のAI活用を狙います。

最大の特徴はMITライセンスでの重み公開です。企業はモデルを自由にダウンロードし、改変・微調整したうえで自社インフラ上やローカルで運用できます。先週、トランプ政権がAnthropicClaude Fable 5への外国人アクセスを禁じる輸出規制を発令し、同社がモデルを全面停止した経緯もあり、地理的な制約を回避できる選択肢として注目されます。

ベンチマークでも存在感を示します。長時間タスクを測るSWE-bench Proで62.1点を記録し、GPT-5.5の58.6点を明確に上回りました。MCP-AtlasやFrontierSWEではClaude Opus 4.8と接戦を演じ、設計タスクのDesign Arenaでは1位を獲得しています。一方でTerminal-Bench 2.1の生スコアでは上位2モデルにわずかに及びません。

技術面ではIndexShareと呼ぶ最適化を導入しました。4つのスパースアテンション層ごとに同一のインデクサーを再利用することで、100万トークン時のトークンあたり計算量を2.9倍削減します。さらに思考の強度を「Max」「High」で切り替えられ、Highでは性能をほぼ保ちつつ出力トークン量を半減できます。

コスト優位は鮮明です。API料金は入力100万トークンあたり1.4ドル、出力4.4ドルで、出力30ドルのGPT-5.5や25ドルのClaude Opus 4.8を大きく下回ります。開発者向けにはGLM Coding Planも用意し、Claude CodeやCline、Kilo Codeなど主要なコーディングツールに即日対応しました。Cline IDEは「オープン重みの復活」と評し、開発者コミュニティから歓迎されています。