xAIがGrok 4.3と音声クローン機能を発表

2026年05月01日 xAI Gemini Grok シミュレーション数学 GPT-5

Grok 4.3の特徴

常時推論型の設計

100万トークンの文脈長

法務・金融ベンチで首位

エージェント性能が大幅向上

価格と音声機能

入力$1.25/百万トークンの低価格

前モデルから最大60%値下げ

120秒の音声で声クローン生成

音声エージェントAPI同時公開

出典：VentureBeat

詳細を読む

xAIは2026年5月1日、独自の大規模言語モデル「Grok 4.3」と音声クローニングスイートを発表しました。Grok 4.3は推論を常時有効にした設計を採用し、100万トークンのコンテキストウィンドウを備えています。API価格は入力100万トークンあたり1.25ドル、出力2.50ドルと、前モデルのGrok 4.2から入力で約40%、出力で約60%の値下げとなりました。

第三者ベンチマークでは、法務分野のCaseLaw v2で79.3%の正解率を達成して1位を獲得し、企業財務分野のCorpFinでも首位に立ちました。エージェント型タスクの指標であるGDPval-AAベンチマークではElo 1500を記録し、Gemini 3.1 ProやGPT-5.4 miniを上回っています。一方で汎用コーディングや数学では弱点が残り、ProofBenchのスコアは11%にとどまりました。

新たに提供が始まったCustom Voices機能は、120秒の音声サンプルからユーザーの声を高精度にクローンできるサービスです。話し方のパターンも再現でき、カスタマーサポート風の口調で録音すればそのスタイルが反映されます。ただし利用は米国内に限定され、イリノイ州はプライバシー規制により対象外です。音声エージェントAPIは1時間あたり3ドルで提供されます。

xAIは低価格を最大の差別化要因と位置づけており、Abacus AIのCEOは「Sonnet 4.6と同等の性能で5倍安く速い」と評価しました。ただし、エージェント動作の安定性に課題が指摘されており、シミュレーション上で行動を取らず停止する「ナルコレプシー」問題が報告されています。また過去のGrokモデルで発生した不適切コンテンツ生成の前例もあり、企業導入には慎重な評価が求められます。