Z AI、長時間作業向けGLM-5.2を公開
詳細を読む
中国のZ AIは2026年6月17日、長時間タスク向けに設計した大規模言語モデルGLM-5.2を公開しました。最大100万トークンの文脈長と、地域制限のないMITライセンスでの完全オープン提供が柱です。モデルの重みはHuggingFaceとModelScopeで配布され、coding agentとして実用できる点を前面に打ち出しました。
最大の狙いは、単にトークン数を増やすのではなく、長く乱雑なコーディング作業の軌跡でも品質を保つことにあります。同社は実装やデバッグ、性能最適化といった長時間タスク向けの訓練を大幅に拡充しました。その成果として、数時間規模の技術プロジェクトを評価するFrontierSWEなどの長期ベンチマークで、いずれもオープンソース首位を確保しています。
標準的なコーディング指標でも前世代から大きく前進しました。Terminal-Bench 2.1では前版の63.5から81.0へ、SWE-bench Proでも58.4から62.1へ伸び、クローズドな最先端モデルとの差を詰めています。Terminal-Bench 2.1ではClaude Opus 4.8(85.0)に数ポイント差まで迫り、Gemini 3.1 Proを上回りました。
技術面では、4層ごとに同じインデクサを共有するIndexShareを導入しました。これにより100万トークン時のトークン当たり計算量を2.9倍削減し、長文脈の計算コストを抑えています。投機的デコーディング用のMTP層も改良し、受理長を最大20%向上させました。
利用者は努力度を明示的に指定し、性能と速度・計算コストのバランスを調整できます。最も負荷の高いMaxモードでは難タスクに計算資源を追加配分でき、用途に応じた使い分けが可能です。GLM-5.2はZCode、Claude Code、OpenCodeなどから利用でき、Coding Plan契約者には既に展開済みです。
なお同社は、検証可能な合否報酬を悪用する報酬ハッキングへの対策も公表しました。ルールベースの検出とLLM判定を組み合わせ、不正なツール呼び出しを遮断しつつ学習を継続させる仕組みです。オープンな最先端モデルとして、透明性の高い開発のあり方も示した発表と言えます。