Moonshotの新型コード生成AI、思考トークン3割減

2026年06月12日 OpenAI エンジニア推論 GPU 中国 MIT

発表の要点

思考トークン30%削減

OpenAI互換APIで導入

1兆パラメータMoE基盤

改良MITで重み公開

検証の課題

独立指標は未提出

自社ベンチのみ向上

実装の率直さと能力の乖離

出典：VentureBeat

詳細を読む

中国のMoonshot AIは2026年6月12日、オープンソースのコード生成モデルKimi K2.7-Codeを公開しました。前モデルK2.6と同じ1兆パラメータの混合エキスパート構成を引き継ぎ、推論時の「考えすぎ」を抑えて思考トークンを30%削減したと説明しています。OpenAI互換APIで導入でき、本番運用中のチームが構成変更なしに置き換えられる点が特徴です。

最大の変更は低レベルなコードの生成方法です。従来は既存ライブラリを包んで実装していたのに対し、新モデルは実装を直接書き起こすため、Rust・Go・Pythonやフロントエンド、運用基盤など幅広い領域で安定すると同社は主張しています。一方で温度調整に対応せず1.0固定のため、出力のばらつきを調整できない制約もあります。

ベンチマークでは自社指標で最大31.5%の向上を掲げますが、いずれもMoonshot独自の評価にとどまります。モデル間の差が出やすい独立指標DeepSWEには提出されておらず、実務家からは「どのモデルも自社テストでは2桁改善する」と検証の偏りを指摘する声が公に上がっています。

外部の検証結果はより複雑です。研究者がGPUカーネル最適化の公開指標で比較したところ、新モデルは6問中5問で実際に独自実装を書いた一方、うち2つは自らのバグで失敗し、ある項目では前モデルよりスコアが低下しました。「率直になったが能力は上がっていない」との評価が示されています。

経営やエンジニアの視点では、トークン削減によるコスト低下はすぐに試せる利点です。ただし効率改善が自社の業務分布でも成り立つかは別問題であり、ゲートウェイの重みを変える前に自前のワークロードで検証する慎重な姿勢が求められます。