拡散型言語モデルでNVIDIAが推論6倍速を実現

3つの推論モードを統合

自己回帰と拡散生成を1モデルに統合
自己投機モードで精度維持と高速化を両立
3B・8B・14Bの3サイズで提供
商用利用可能なライセンスで公開

速度と精度の両立

拡散モードでAR比2.6倍の生成効率
自己投機で最大6.4倍の高速化を達成
8BモデルがQwen3 8Bを精度1.2%上回る
B200で毎秒約865トークンを記録

NVIDIAは2026年5月23日、自己回帰(AR)と拡散(Diffusion)の両方の生成方式を1つのモデルに統合した言語モデルファミリー「Nemotron-Labs Diffusion」を公開しました。3B・8B・14Bのテキストモデルと8Bのビジョン言語モデルをHugging Face上で提供し、商用利用可能なライセンスで配布しています。

従来の大規模言語モデルはトークンを1つずつ逐次生成する自己回帰方式を採用しており、GPUの演算能力を十分に活用できないという課題がありました。Nemotron-Labs Diffusionは複数トークンを並列に生成し、段階的に修正する拡散方式を導入することで、この制約を突破します。生成済みトークンの修正も可能なため、誤りの伝播を抑制できます。

同モデルは3つの推論モードを備えています。従来通りの自己回帰モード、32トークン単位でブロック生成する拡散モード、そして拡散で下書きし自己回帰で検証する自己投機モードです。自己投機モードでは温度0で自己回帰と同一の出力品質を維持しながら、大幅な高速化を実現します。

性能面では、8BモデルがQwen3 8Bに対し平均精度で1.2ポイント上回りました。推論速度はハードウェア非依存の指標であるTPF(tokens per forward pass)で、拡散モードがAR比2.6倍、自己投機モードが最大6.4倍を達成しています。NVIDIA B200上のベンチマークでは毎秒約865トークンの生成速度を記録しました。

学習にはNVIDIAのNemotron事前学習データセットから1.3兆トークン、ファインチューニングに450億トークンを使用しています。推論エンジンSGLangでの対応が進んでおり、設定1行の変更で3モードを切り替え可能です。学習コードもMegatron Bridgeフレームワーク経由で公開されており、開発者はすぐに利用を開始できます。

Gemini Omni、自撮りから本人も見抜けない偽動画を生成

動画生成の実力と課題

Veo後継の動画生成モデル
写真・動画・テキストを入力に対応
一貫性は向上も不自然な変化が残存
編集指示への応答精度は改善途上

ディープフェイクの衝撃

自撮りから食事や旅行の偽映像を生成
家族も見抜けない精度を実証
月額20ドルで約20本生成可能
SNS上で通用するレベルに到達

Googleが新たにリリースしたGemini Omniは、写真・動画・テキストなどあらゆる入力から動画を生成できる「anything-to-anything」モデルです。動画生成・編集プラットフォームFlow上で利用可能で、従来のVeoモデルの後継として位置づけられています。The Vergeの記者が実際にハンズオンレビューを行い、その実力と課題を検証しました。

レビューでは、ぬいぐるみの鹿を主人公にした冒険動画を生成するテストが行われました。キャラクターの一貫性はVeoから明確に改善され、プロンプトに忠実な映像が生成される場面も増えています。一方で、スカイダイビング中にぬいぐるみの向きが突然変わるなど、不自然な「AIジャンプスケア」も依然として残っています。蜂蜜の瓶が場面ごとに形状を変えるといった、オブジェクトの一貫性の問題も確認されました。

最も衝撃的だったのはディープフェイクの精度です。記者が無表情の自撮り動画を入力し、パスタを食べる映像やエッフェル塔前でバゲットをかじる映像を生成させたところ、10年間毎日顔を見ている夫でさえ本物と区別できないレベルの結果が得られました。AIの痕跡はフォークの不自然な音や背景人物の重複など細部に残るものの、SNS上では十分に通用する品質です。

動画生成にはクレジット制が採用されており、1本あたり15〜40クレジットを消費します。月額20ドルのAI Proプランで1,000クレジットが付与されますが、記者は約20本の生成と数回の編集で残り145クレジットまで減少しました。特定のビジョンに近づけるための試行錯誤を考えると、コストは決して安くありません。

テキストによる編集指示機能もVeoから改善されていますが、完璧とは言えません。鹿のぬいぐるみから角を除去するよう指示すると、該当シーンでは除去されたものの他のシーンに角が追加されるという矛盾が生じました。記者は「不気味の谷に深く入り込んでいる」と評しつつ、Googleアカウントとクレジットカードがあれば自宅の動画をハワイ旅行に変えられる時代になったと結んでいます。

マスク氏、地上太陽光からAI向け宇宙発電へ転換

SpaceX上場書類の内容

宇宙太陽光は地上の5倍超の発電量
テラワット級のAI電力需要を予測

地上ではガス発電に依存

xAI無許可ガスタービン数十基を稼働
28億ドル分の追加購入計画
テスラ製蓄電池は導入も太陽光は未採用

実現への課題

軌道打上げコストが地上設置を大幅に上回る
宇宙環境でのチップ保護が困難

イーロン・マスクが率いるSpaceXIPO申請書類で、AI向け電力の将来像として宇宙太陽光発電を中核に据える構想が明らかになりました。書類によると、宇宙空間の太陽光パネルは24時間照射により地上の5倍以上のエネルギーを生成でき、地上のデータセンターが直面する電力不足や住民反対を回避できるとしています。マスク氏はAI計算需要が年間テラワット規模で成長すると見積もり、既存の業界予測を大幅に超える電力が必要になると主張しています。

一方で現実のxAIデータセンターは、クリーンエネルギーとは程遠い状況です。ミシシッピ州の施設では大気汚染許可なしで数十基の天然ガスタービンを稼働させ、さらに28億ドル相当の追加購入を計画しています。テスラ製の大型蓄電池Megapackには6億9700万ドルを投じていますが、テスラ太陽光パネルは目立った規模では導入されていません。

この姿勢は、テスラが掲げてきた「化石燃料からの脱却」という理念と矛盾します。テスラの初代マスタープランでは「採掘・燃焼型の炭化水素経済から太陽光電力経済への移行を促進する」ことが目的とされていました。わずか3年前に発表されたマスタープラン第3弾でも「化石燃料の廃止計画」が示されています。にもかかわらず、xAIは化石燃料への依存を深めています。

実現のハードルも高いと指摘されています。サーバーを軌道上に打ち上げるコストは地上設置を大きく上回り、Starlink衛星の電力コストは一般的なデータセンターの数倍に達します。宇宙放射線からチップを守る技術的課題や、AI学習の分散処理が複数衛星間で可能かどうかも不透明です。マスク氏は現在のデータセンターを暫定措置と位置づけ、数年内にギガワット級のサーバーを軌道上に展開する構想を描いていますが、その成否は未知数です。

FerrariがIBMのAIでF1ファンアプリを刷新

アプリ刷新の全体像

IBMとの提携でアプリ全面改修
AI生成レース要約や予測機能を追加
レース週末のエンゲージメント62%増

AIによるパーソナライズ

ファンの閲読傾向やメッセージ感情をAI分析
コンテンツ配信を個人最適化
イタリア語対応など基本的な改善も実施

多様化するファン層への対応

新規ファンの75%が女性・Z世代中心
5年計画で全ファンに専用体験を提供

Scuderia FerrariIBM提携し、AI技術を活用してF1公式ファンアプリを全面刷新しました。IBMのスポーツ・エンターテインメント部門VP、カメリン・スタンハウス氏によると、F1の持つ膨大なレースデータをAIで処理し、ファンが楽しめるコンテンツに変換することが提携の核です。Ferrariは「ファン開発責任者」という新ポストも設置し、パーソナライズされた体験の構築に本格的に取り組んでいます。

刷新されたアプリには、AIが生成するレース要約、ファン同士が対戦できるゲーム、チームやドライバーの舞台裏ストーリー、予測機能、質問に答えるAIコンパニオンなどが搭載されました。イタリア企業であるにもかかわらずイタリア語に未対応だったアプリの多言語化も実現しています。

IBM参画後、レース週末のアプリエンゲージメントは62%増加しました。Ferrariファン開発責任者のステファノ・パラード氏は、AIでファンの閲読傾向やメッセージの感情を分析し、コンテンツ戦略に反映していると説明しています。単なるレース情報アプリから、年間を通じてファンが滞在するプラットフォームへの転換を目指しています。

F1のファン層は急速に多様化しており、2025年の調査では新規ファンの75%が女性で、その多くがZ世代です。パラード氏は「30年来のファンでも30日目のファンでも、自分のために作られたと感じる体験を届けたい」と語り、今後5年間でさらなるパーソナライズと没入型体験の強化を進める方針を示しました。

ミリ波レーダーとMLで花粉媒介昆虫を非侵襲的に識別

ミリ波レーダーの仕組み

羽ばたきのマイクロドップラー信号を解析
ミリ波が昆虫サイズに最適な波長
70以上の特徴量を機械学習で分類

識別精度と今後の展望

5種の花粉媒介昆虫を85%の精度で種レベル識別
ハチとスズメバチの科レベル識別は96%達成
携帯型の現場投入モデルを開発予定
害虫・侵略的外来種の追跡にも応用可能

デンマーク工科大学のAdam Narbudowicz准教授らの研究チームが、ミリ波レーダー機械学習を組み合わせて花粉媒介昆虫を非侵襲的に識別・追跡する手法を開発しました。従来の昆虫モニタリングでは捕獲・殺処分が必要でしたが、この技術により昆虫を傷つけずに種レベルの分類が可能になります。研究成果は2026年4月28日付でPNAS Nexus誌に発表されました。

この手法は、昆虫の羽ばたきが生み出すマイクロドップラー信号に着目しています。単一時点のレーダー反射では昆虫の検出は困難ですが、長時間にわたり信号を積分することで検出を実現しました。ミリ波は昆虫のサイズに適した波長であり、5G通信などでも利用される技術です。

研究チームはトリニティ・カレッジ・ダブリンのキャンパスで捕獲したミツバチやスズメバチなど5種の花粉媒介昆虫を対象に実験を行いました。個体をミリ波アンテナ上の小型円筒に入れてレーダー信号を記録し、その後放虫しています。機械学習モデルは羽ばたき周波数や反射強度など70以上の特徴量を解析します。

その結果、5種の昆虫を種レベルで85%の精度で分類でき、ハチ科とスズメバチ科の区別では96%の精度を達成しました。検出時間が長いほど精度は向上し、0.1秒の75%から1秒で84%へと改善しています。使用する電波の出力は昆虫に害を与えないレベルです。

今後、研究チームは携帯型で現場に設置可能な装置の開発を目指しています。さらに、世界中の昆虫のレーダー信号データベースを構築し、温度や湿度などの環境データと組み合わせることで、花粉媒介昆虫の行動変化の監視にも活用する構想です。害虫や侵略的外来種の追跡への応用も期待されています。