Google I/O、Gemini 3.5とAI基盤を発表

Gemini 3.5の性能

Gemini 3.5 Flashがフラッグシップ級の性能を低コストで実現
コーディングエージェント向けベンチマークで3.1 Proを上回る成績
他のフロンティアモデルの4倍高速・半額以下の価格
Gemini 3.5 Proは来月一般提供予定

AIエージェント戦略

Gemini Sparkは24時間バックグラウンド稼働の個人用AIエージェント
Search向け情報エージェントがウェブを常時監視し自動通知
OpenClawの成功を受けGoogle独自のエコシステムで勝負

開発者基盤の刷新

Antigravity 2.0がデスクトップアプリ・CLI・SDKの3形態で登場
AI StudioからネイティブAndroidアプリを直接ビルド可能に

Google I/O 2026が2026年5月20日に開催され、Googleは新モデル・AIエージェント開発者プラットフォームを含む100以上の新機能を発表しました。最大の目玉はGemini 3.5 Flashの一般提供開始で、フラッグシップモデルに匹敵する性能を従来の半額以下のコストで実現します。同社はAIエージェントを軸とした製品戦略への本格転換を打ち出しました。

エージェント分野では、24時間バックグラウンドで動作する個人向けAIエージェントGemini Sparkが発表されました。Gemini 3.5を搭載し、Gmail・Drive・Photosなど自社サービスに加えDropbox・Uber・Spotifyなど30以上の外部パートナーとも連携します。端末の電源が切れていてもクラウドで稼働し続ける点が、競合するOpenClawと同様のアプローチです。まず米国のUltraプラン加入者向けにベータ提供が始まります。

The Vergeの分析によれば、Googleは9億人超の月間ユーザーと自社サービス群という圧倒的な配信基盤を持つため、AIエージェント競争で最も有利な立場にあります。OpenClawWhatsAppやTelegramとの連携で急成長した戦略を取り込みつつ、自社エコシステムへの深い統合で差別化を図る構えです。「Googleエージェントを実用化できなければ、誰にもできない」という指摘は、同社への期待と責任の大きさを表しています。

開発者向けには、エージェントファーストの開発プラットフォームGoogle Antigravityが大幅に拡張されました。デスクトップアプリのAntigravity 2.0、ターミナル向けのAntigravity CLI、プログラマティックなAntigravity SDKの3形態で提供されます。サブエージェント・フック・非同期タスク管理といった新しいプリミティブが追加され、数日かかったエンジニアリング作業を数時間に短縮できるとしています。

モバイル分野では、AI StudioからネイティブAndroidアプリを直接作成・Google Playのテストトラックに公開できる機能が発表されました。プロンプトだけでウィジェットを生成する「Generative UI」構想も示され、非エンジニアでもスマートフォンアプリを自作できる時代の到来が近づいています。AppleiOS 27でショートカットのAI生成を検討中と報じられており、モバイルにおけるバイブコーディングが次のトレンドになりそうです。

GitHub内部3800件がVS Code拡張経由で流出

侵害の経緯と影響

VS Code拡張機能経由で従業員端末が侵害
内部リポ約3800件が窃取対象
TeamPCP(UNC6780)が犯行声明
窃取データを5万ドルから販売開始

連鎖するサプライチェーン攻撃

npm639バージョンに偽造署名付きマルウェア
Microsoft公式Python SDKも汚染
Nx Console拡張機能も前日に侵害
攻撃ツールがオープンソース化され模倣犯拡大

2026年5月20日、GitHubは従業員の端末にインストールされた汚染済みVS Code拡張機能を起点に、約3800件の内部リポジトリへの不正アクセスが発生したことを公式に認めました。脅威グループTeamPCP(Google Threat Intelligence GroupがUNC6780として追跡)が犯行を主張し、窃取したリポジトリを5万ドルから売り出しています。GitHubは「攻撃者の主張は調査結果と概ね一致する」と述べています。

この侵害は孤立した事件ではありません。同時期にTeamPCPによるサプライチェーン攻撃が複数の経路で展開されました。5月19日にはAlibaba系の@antvエコシステムで639の悪意あるnpmパッケージバージョンが検出され、合計で週間1600万ダウンロードに影響が及ぶ規模です。この攻撃波では、Sigstore署名証明書を実行時に偽造する手法が初めて導入されました。

さらに同日、Microsoftの公式Python SDK「durabletask」もPyPI上で3つの悪意あるバージョンが公開されました。過去のTeamPCP攻撃で侵害されたGitHubアカウントが悪用され、AWS、Azure、GCPなど90以上の開発ツール設定から認証情報を窃取するペイロードが仕込まれていました。月間40万ダウンロード以上のパッケージが対象です。

前日の5月18日には、220万インストールのVS Code拡張機能Nx Consoleも侵害され、GitHub、npm、AWSなどのトークンに加え、Claude Codeの設定ファイルまで窃取対象となっていました。Trend Micro、StepSecurity、Snykの調査では、TeamPCPは2026年3月以降少なくとも7波の攻撃を実施したと確認されています。

企業にとって深刻なのは、攻撃チェーン全体がMicrosoftエコシステム内で完結している点です。VS Code拡張機能のマーケットプレイスに対するセキュリティ審査の不備は以前から指摘されており、今回の事態はその懸念が現実化した形です。GitHubは最重要認証情報の即時ローテーションを実施しましたが、流出した内部リポジトリにはインフラ設定やデプロイスクリプトが含まれており、二次被害のリスクが残ります。

OpenAIモデルが80年未解決の数学予想を自律的に反証

エルデシュ予想の反証

1946年提起の単位距離問題に進展
正方格子が最適とする通説を覆す構成発見
代数的整数論の手法で多項式的改善達成
外部数学者グループが証明を検証済み

汎用推論モデルの成果

数学特化でない汎用推論モデルが自律的に証明
異分野の知識を橋渡しする能力を実証
フィールズ賞受賞者ガワーズがAI数学の画期的成果と評価

過去の失敗と今回の違い

7か月前のGPT-5による誤った成果主張の教訓
今回は査読付き証明数学者の支持を確保

OpenAIは2026年5月20日、同社の汎用推論モデルが離散幾何学の中心的な未解決問題である「平面単位距離問題」に関するエルデシュ予想を反証したと発表しました。1946年にポール・エルデシュが提起したこの問題は、平面上のn個の点のうち距離がちょうど1となるペアの最大数を問うもので、約80年間にわたり正方格子構成が本質的に最適と信じられていました。

今回の証明は、代数的整数論の手法を幾何学の問題に適用するという予想外のアプローチで達成されました。具体的には、ガウス整数をより複雑な代数体に置き換え、無限類体塔やゴロド・シャファレヴィッチ理論を用いて、従来の構成を多項式的に上回る新たな点配置の無限族を構成しています。プリンストン大学のウィル・サウィン教授による精密化では、指数の具体的な値も示されました。

この成果が注目される理由は、数学専用に訓練されたシステムではなく、汎用的な推論モデルが自律的に証明を導いた点にあります。フィールズ賞受賞者のティム・ガワーズは「AI数学の画期的成果」と評し、数論学者のアルル・シャンカールは「現在のAIモデルは人間の数学者の補助を超え、独創的な着想を持ちそれを実現する能力がある」と述べています。

OpenAIにとって今回の発表には特別な意味があります。7か月前、同社の元副社長ケヴィン・ワイルがGPT-5による10件のエルデシュ問題解決を主張しましたが、既存の文献に存在する解を再発見しただけだったことが判明し、競合他社から批判を浴びました。今回はその反省を踏まえ、ノガ・アロン、メラニー・ウッド、トーマス・ブルームら著名数学者による検証と支持を事前に確保しています。

この成果は数学にとどまらず、AIの研究能力の将来を示唆しています。長い論証の一貫性を保ち、異分野の知識を結びつけ、専門家の精査に耐える成果を生み出す能力は、生物学・物理学・工学・医学など広範な分野での応用が期待されます。ブルームは「AIは我々が何世紀もかけて築いた数学の大聖堂をより深く探索する手助けをしている」と語りました。

Anthropic、xAIに月額12.5億ドル契約

契約の全体像

月額12.5億ドルで2029年5月まで
Colossus 1の300メガワット全量確保
総額400億ドル超のxAI収益見込み
90日前通知で双方解約可能

xAIの戦略転換

余剰計算資源の外販モデル確立
Grok利用者減少が背景
自社利用と外販の二刀流「ネオクラウド
SpaceXのS-1提出で契約詳細判明

AnthropicxAIのColossus 1データセンター(テネシー州メンフィス近郊)の計算資源300メガワット分を全量確保する契約を結びました。月額12.5億ドル(約1,900億円)を2029年5月まで支払い、総額は400億ドルを超える見通しです。最初の2か月間はxAI側の立ち上げ完了に伴い割引料金が適用されます。

契約の詳細はSpaceXがSECに提出したS-1書類から明らかになりました。書類では「未使用の計算インフラ能力を収益化する」取引と説明されており、90日前の通知でいずれの当事者も契約を解除できる条件が付されています。SpaceXは「同様のサービス契約を追加で締結する見込み」とも記載しています。

この動きはxAIAI市場での独自の立ち位置をもたらしています。通常、AI企業は自社用にデータセンターを構築するか、他社向けにクラウドサービスを提供するかのいずれかですが、xAIは両方を同時に行う「ネオクラウド」と呼ばれる新興モデルを採用しました。自社の利用量が容量を下回る際にクラウドプロバイダーとして機能することで、インフラコストを相殺する狙いがあります。

背景にはxAIの旗艦AIアシスタントGrokの利用者数が2026年に入り大幅に減少している事実があります。余剰となったサーバーを競合であるAnthropicに販売する形となりました。SpaceXは「二重収益化戦略が投下資本の回収に複数の道筋を提供する」と主張していますが、株式公開を控えたxAI過剰投資した計算資源の収益化を急いでいる構図が浮かび上がります。

Cohere、218B言語モデルをOSSで初公開

高効率なMoE構造

218B中25Bのみ稼働
4bit量子化でほぼ性能劣化なし
H100わずか2基で推論可能

企業向け実用機能

出典を明示する引用生成
48言語対応の新トークナイザ
128Kコンテキストで文書処理

完全オープンソース化

Apache 2.0で商用利用自由
自社環境での独立運用が可能

カナダのAI企業Cohereは2026年5月20日、218億パラメータの大規模言語モデルCommand A+を発表しました。同社として初めてApache 2.0ライセンスで公開され、企業や開発者が商用目的で自由に利用・改変・再配布できます。「Attention Is All You Need」の共著者でもあるCEOのAidan Gomez氏が主導した今回のリリースは、企業が自社環境でAIを完全に制御する「ソブリンAI」構想の具体化です。

Command A+の最大の特徴は、Sparse Mixture-of-Experts(MoE)アーキテクチャにあります。218Bの総パラメータのうち、推論時に稼働するのはわずか25Bです。これにより、OpenAIAnthropicの数兆パラメータ規模のモデルと比較して、大幅に少ない計算資源で動作します。

さらに注目すべきはロスレス量子化技術です。MoEエキスパート部分のみを4bitに圧縮し、注意機構は高精度のまま維持する手法により、ほぼ性能を損なわずに圧縮を実現しました。その結果、NVIDIA B200 1基またはH100 2基で動作可能となり、出力速度は前世代比で最大63%向上、レイテンシは17%低減しています。

ベンチマーク性能も大幅に改善されています。複雑な推論テストτ²-Bench Telecomで37%から85%へ、数学のAIME 25で57%から90%へと飛躍しました。エージェントコーディングではDeepSeekやGLMに後れを取るものの、25Bの稼働パラメータでこの成績は際立っています。

企業利用で重要なネイティブ引用生成機能も搭載されています。外部ツールから取得した情報について、出典元を明示的にリンクする仕組みです。金融・医療・法務など規制の厳しい業界では、ハルシネーションリスク低減に直結します。マルチモーダル対応や128Kトークンのコンテキスト長、48言語対応の新トークナイザにより、グローバル企業の多様なニーズに応えます。

Apache 2.0での公開は、これまでCC-BY-NC 4.0で非商用に限定していたCohereの方針転換を意味します。企業は自社サーバーやエアギャップ環境でモデルを自由にファインチューニングデプロイでき、ベンダー依存から完全に解放されます。Hugging FaceやvLLMとの即日連携も実現しており、オープンソースAIエコシステムの成熟を示すリリースといえます。

OpenAI、9月にもIPO申請へ

IPO準備の現状

数日〜数週間内に秘密裏のIPO申請を計画
Goldman SachsとMorgan Stanleyが主幹事
Musk訴訟棄却の翌日に動き加速

競合SpaceXとの対決構図

SpaceXIPO申請を今週公開予定
xAI買収AI分野の直接競合
Altman対Musk、市場での新たな戦い
どちらが大型IPOとなるかに注目集まる

OpenAIが2026年9月を目標に新規株式公開(IPO)の準備を進めていることが明らかになりました。Wall Street Journalの報道によると、CEOのSam Altman氏は数日から数週間以内に規制当局へ秘密裏にIPO書類を提出する見通しです。主幹事にはテック企業IPOの実績豊富なGoldman SachsとMorgan Stanleyを起用しています。

この動きは、Elon Musk氏がOpenAIの組織構造や経営陣、財務を脅かす訴訟で敗訴した翌日に報じられました。共同創業者であるMusk氏による法的攻撃が退けられたことで、IPOに向けた最大の障壁が取り除かれた形です。

一方、Musk氏が率いるSpaceXも今週中にIPO申請書類を公開する見込みです。SpaceXは2026年2月にMusk氏のAIモデル開発企業xAI買収しており、OpenAIと直接競合する立場にあります。両社のIPOは市場で大きな注目を集めることが確実視されています。

OpenAIIPOは大型案件になるとの見方が大勢を占めています。ChatGPTの爆発的普及を背景に企業価値は急伸しており、AI業界最大のIPOとなる可能性があります。Altman氏とMusk氏の対立は、法廷から金融市場へと舞台を移すことになります。

Google検索がAI化、AI検索企業も急成長

Google検索の全面刷新

AI Mode月間利用者10億人突破
検索結果からミニアプリを自動生成
検索ボックスがグローバル展開開始

AI検索スタートアップの台頭

Exa Labsが22億ドル評価で2.5億ドル調達
Parallel Web Systemsも20億ドル評価で資金獲得
AmazonRedditAI検索機能を強化
ChatGPTGoogleの隙間を狙う新興勢力

検索市場の構造変化

従来の「10本の青リンク」が後退
広告ビジネスモデルへの影響が焦点に

GoogleがI/O 2026で検索の全面的なAI化を発表しました。同社の検索VP、リズ・リード氏は「Google検索はAI検索だ」と宣言。AI Modeの月間利用者は10億人を超え、四半期ごとに倍増しています。さらにAI検索スタートアップへの大型投資も相次ぎ、検索市場全体が激しく動き始めています。

Google検索の変革の柱は、Gemini 3.5 Flashを搭載したエージェント検索です。従来のAI Overviewに加え、AI Modeでは質問に応じて生成UIやカスタムミニアプリを自動作成します。たとえば週末の外出計画を尋ねると、レビューや地図、カレンダー連携を備えたダッシュボードが生成されます。これらのアプリは共有やカスタマイズも可能です。

検索ボックスも25年の歴史で最大の変更を受けました。入力に応じて動的に拡張し、Geminiがユーザーの意図を推測して補完します。AI Overviewの下部にはAI Modeへの誘導が表示され、従来のオーガニック検索結果はますます「脚注」のような存在になりつつあります。

一方、AI検索スタートアップも急成長しています。Andreessen Horowitzが支援するExa Labsは22億ドルの評価額で2.5億ドルを調達。元Twitter CEOのパラグ・アグラワル氏率いるParallel Web SystemsSequoia主導で20億ドル評価の1億ドルラウンドを完了しました。

ChatGPTが依然としてAI検索のインターフェース層を支配していますが、OpenAI検索を最優先にできず、Googleには広告収益の保護という制約があります。この隙間が新興企業の参入余地となっています。AmazonReddit、LinkedInといった既存プラットフォームもAI検索機能を強化しており、買収候補としてスタートアップに注目しています。

Google検索市場で圧倒的なシェアを維持しており、AI化による利用増をその正当性の根拠としています。しかし、従来の「10本の青リンク」が後退し、AI生成コンテンツが主役となる構造変化は、ウェブ全体のエコシステムに大きな影響を及ぼす可能性があります。検索の未来をめぐる競争は、いよいよ本格化しています。

Ramp、Codex活用でコードレビューを数分に短縮

コードレビューの革新

CodexがPRを数分でレビュー
人間が見落とす問題も自動検出
コードレビュー必須ツールに昇格

オンコール業務の自動化

On-Call Assistantの開発を推進
複雑なインシデント調査をGPT-5.5が支援
ビジネスロジックの把握を効率化

エンジニアの役割変化

コード記述者からオーケストレーターへ転換
AI活用スキルが競争力の源泉に

フィンテック企業Rampのエンジニアリングチームが、OpenAICodexGPT-5.5を組み合わせたコードレビュー体制を本格導入しました。従来は最初のレビューまで数時間かかっていたプルリクエストが、数分で実質的なフィードバックを得られるようになっています。

Ramp AI Developer Experience チームを率いるAustin Ray氏によると、Codexコードレビューは「業界のゴールドスタンダード」であり、エンジニアが指名で利用を求めるほど信頼されています。他のAIレビューツールとの違いは、コードベース全体に対して深く推論する能力にあり、多くの人間レビュアーが時間的に実現できない水準の網羅性を発揮します。

同チームはCodexを活用し、オンコールローテーション業務を支援するエージェント型ツール「On-Call Assistant」の開発も進めています。オンコール業務では大量のビジネスロジックやドメイン知識、並行処理のバグなど複雑な要素を同時に扱う必要がありますが、GPT-5.5の推論能力がその負荷を大幅に軽減しているとRay氏は述べています。

Ray氏は他の技術リーダーに向け、AIツール導入のアドバイスも示しました。まずエンジニアと一緒にCodexを実際に使うセッションを行い、初回体験の質を高めること。そしてベンダーとのフィードバックループ投資し、継続的に改善することが重要だと強調しています。

Ray氏は「エンジニアはオーケストレーターになる」と展望を語ります。すべてのコードを自分で書くスキルではなく、AIツールをいつ信頼しいつ修正を求めるかの判断力が、今後のエンジニアの競争力を決定づけるとの見解を示しました。

Corti医療音声認識、誤り率1.4%でOpenAIに圧勝

汎用AIとの精度格差

医療用語の誤り率1.4%を達成
OpenAIは17.7%、最大93%の改善
臨床エンティティ再現率98.3%
汎用モデルの再現率は最高44.3%

レガシー製品も凌駕

Dragon Medical Oneを19%上回る精度
独語2.4%・仏語3.9%の多言語対応

垂直特化AIの台頭

6週間で3つのベンチマーク制覇
開発者登録が前四半期比30%増

デンマーク・コペンハーゲン発の医療AI企業Cortiは2026年5月20日、臨床特化型の音声認識モデル「Symphony for Speech-to-Text」を正式リリースしました。英語の医療用語における単語誤り率(WER)はわずか1.4%で、OpenAIの17.7%、ElevenLabsの18.1%、Whisperの17.4%を大幅に下回り、最大93%の精度改善を示しています。

同モデルの強みは、投薬量・測定値・日付などの臨床エンティティの再現率にも表れています。Cortiは98.3%を達成した一方、汎用モデルの最高値は44.3%にとどまりました。この54ポイントの差は、AIスクライブが医療現場で信頼されるか、医療過誤リスクとなるかの分水嶺です。

レガシー製品との比較でも優位性は明確です。医療音声認識の業界標準Dragon Medical Oneに対し、実臨床の英語ディクテーションでWER 4.6%対5.7%と19%の相対改善を達成しました。さらにスイスの多言語環境ではドイツ語2.4%、フランス語3.9%と、次点のシステムを大きく引き離しています。

Cortiの共同創業者兼CEOであるAndreas Cleve氏は、エージェントAI時代における音声認識の役割変化を強調しています。従来の音声認識は静的な文書生成が目的でしたが、自律型AIエージェントが臨床判断を支援する時代では、音声データは下流のAI推論の基盤となります。誤認識はすべての後続処理に波及するため、臨床グレードの精度が不可欠です。

今回の発表は、医療コーディングや臨床推論ベンチマークに続く6週間で3件目の成果です。汎用モデルが規制産業で天井に達しつつあるなか、垂直特化型AIラボの優位性を裏付けるデータが蓄積されています。Cortiのプラットフォームは英国NHSを含む医療機関を通じ、年間1億人以上の患者にサービスを提供しており、開発者登録は前四半期比30%増と勢いを増しています。

企業AIエージェントの失敗原因は「意思決定文脈」の欠如

RAGの限界と課題

RAGは文書検索のみで意思決定文脈を返せない
取得情報の適用可否をエージェントが判断できず
多段階ワークフロー誤りが複利的に蓄積

意思決定文脈グラフの仕組み

適用可能性・時間・決定経路の3原則で構造化
ニューロシンボリックAIで非構造データを自動整理
検証済み行動を凍結し非回帰性を担保

企業導入への展望

99.999%の信頼性を目指す設計思想
自動オントロジー生成の実用性が今後の焦点

企業向けAIエージェントがパイロット段階から先に進めない根本原因として、「意思決定文脈」の欠如が指摘されています。Neo4jエコシステムスタートアップRippletideは、この課題を解決する意思決定文脈グラフというフレームワークを開発しました。共同創業者のYann Bilien氏が、その設計思想と技術的アプローチをVentureBeatに語りました。

現在主流のRAGアーキテクチャは、意味的に関連する文書の検索には優れていますが、取得した情報が当該意思決定に適用可能かどうかまでは判断できません。Northwest AI ConsultingのWyatt Mayham氏は「検索と適用可能性の間にあるギャップが最大の課題」と指摘します。期限切れの価格例外や管轄限定の安全方針など、文脈を見落とすとエージェントは「自信を持って間違った行動を取る」結果になります。

意思決定文脈グラフは、適用可能性時間認識型メモリ決定経路の3原則で構築されます。すべてのルールや例外に有効期間が付与され、「当時何が正しかったか」と「今何が正しいか」を区別して推論できます。ニューロシンボリックAIがパターン認識と形式論理の符号化を担い、非構造データから自動的にオントロジーを生成します。

最大の特徴は非回帰性です。エージェントが新たな解決策を探索し、満足な結果が得られると、その行動シーケンスをグラフに凍結します。以降の探索はこの検証済みの基盤から始まるため、新しいスキルの習得が既存の正しい行動を上書きすることがありません。Bilien氏は「回帰し続ける限り完全な自己学習モデルは実現しない」と強調します。

銀行の大量トランザクション処理のように99.999%の信頼性が求められる領域で、このフレームワークは大きな可能性を持っています。ただしMayham氏は、自動オントロジー生成が企業の雑多な実データに耐えられるかが「常に難しい部分だ」と指摘しており、実運用での検証が今後の焦点となります。

FigmaがAIエージェントをデザインキャンバスに搭載

AIエージェントの機能

自然言語デザイン生成・編集
複数エージェント同時並行実行
デザイン文脈を理解する専用モデル
既存デザインの反復生成を自動化

事業環境と成長

CanvaAdobe等との競争激化
2026年Q1売上は前年比46%増
AnthropicOpenAIとの提携済み
デザインとコードの統合を推進

Figmaは2026年5月20日、協調デザインキャンバス上で動作する独自のAIエージェントを発表しました。ユーザーは自然言語のプロンプトで新規デザインの生成、既存デザインの編集、反復作業の自動化を指示でき、複数のエージェントを同時に起動して並行作業させることも可能です。

同社によると、このAIエージェントデザイン用途にファインチューニングされたモデルで動作し、デザインの文脈や要素を理解します。チーフデザインオフィサーのLoredana Crisan氏は「ソフトウェア構築が容易になるなか、最も重要なのは方向性の設定だ」と述べ、エージェントとの協働でアイデアの検証やエッジケースの可視化が加速すると強調しました。

AIエージェントはまずFigma Designで提供を開始し、今後は他の製品にも展開する計画です。同社はこれに先立ち、AnthropicClaude CodeOpenAICodexといったAIコーディングツールとの連携を進めており、デザインとコードの距離をさらに縮める方針を示しています。

FigmaCanvaAdobe、Flora、Kreaなど競合との激しい競争に直面しています。昨年にはノードベースのデザインツールWeavyを買収し、AI画像編集機能も追加しました。2026年第1四半期の売上高は3億3,340万ドルで前年同期比46%増と、AI時代においても堅調な成長を続けています。

Cerebras、1兆パラメータを毎秒981トークン推論

ウェーハスケールの速度優位

Kimi K2.6を毎秒981トークンで処理
GPU6.7倍、中央値比23倍の速度
エージェント向けコーディング要求を5.6秒で完了
Artificial Analysisが独立検証で速度確認

企業向け推論市場の競争激化

Fortune 500企業が本番ワークロードを試験中
IPO直後で時価総額950億ドルに到達
NVIDIAGroq買収200億ドルが競争圧力に
OpenAI向け推論インフラも提供中

Cerebras Systemsは、2026年最大のテックIPOを完了した直後に、1兆パラメータの推論性能を公表しました。北京のMoonshot AIが開発したオープンウェイトモデルKimi K2.6を、独自のウェーハスケールチップ上で毎秒981トークンで処理し、GPUクラウドの最速を6.7倍上回る記録をベンチマーク企業Artificial Analysisが独立検証しています。

Kimi K2.6は1兆パラメータのMixture-of-Expertsモデルで、トークンあたり320億パラメータを活性化します。SWE-Bench Proで58.6を記録し、Claude Opus 4.6やGPT-5.4と同等以上の性能を示しており、AnthropicOpenAIの高額な閉鎖型APIの代替として企業の関心を集めています。コーディングエージェント処理など高付加価値タスクでの利用が想定されています。

Cerebrasの速度優位を支えるのはWafer-Scale Engine 3です。ディナープレート大の単一チップに44GBのオンチップSRAMを搭載し、NVLink対比200倍以上の帯域幅を実現します。MoEモデルの全エキスパートを同一ウェーハ上に配置することで、GPU間のデータ転送ボトルネックを解消しました。

同社はFortune 500のソフトウェア・金融・ヘルスケア企業にクラウド試験を提供中で、消費者向けAPIよりも企業顧客を優先する戦略を採っています。料金はGPUベースのプロバイダと同等水準としつつ、速度に対する付加価値で差別化を図ります。

競争環境も急変しています。NVIDIAが高速推論Groq200億ドル買収し、推論市場が訓練市場を商業的重要性で追い越しつつあることを示唆しました。Cerebrasは新ハードウェアの発表を予告しており、OpenAIとの200億ドル超の推論インフラ契約も含め、エージェント時代の推論基盤としての地位確立を目指しています。

AIコーディングでロボット操作、誰でもロボティクスの時代へ

コードでロボット制御

OpenClawCodexロボットアーム操作
赤いボール把持プログラムを自動生成
AIモデル訓練もエージェントが支援
従来数時間の設定作業を大幅短縮

CaP研究の進展

UC Berkeley等がCaP-Xベンチマーク開発
ロボット制御ではGeminiが最高性能
Nvidiaと共同で実用化を推進
Spencer Huangが社内ハッカソン主導

WIREDの記者Will Knight氏が、AIエージェントOpenClawOpenAICodexを使い、オープンソースのロボットアーム「LeRobot 101」をバイブコーディングで制御する実験を行いました。従来は専門知識が必要だったロボットの設定・制御が、AIコーディングによって飛躍的に簡単になりつつあります。

LeRobot 101はHuggingFaceが提供するオープンソースのロボットアームで、コントローラーアームとカメラ付きフォロワーアームの2本で構成されます。Knight氏は手動での接続・キャリブレーションに数時間を費やし、モーターの過熱トラブルにも見舞われました。しかしOpenClawCodexを用いると、接続設定やジョイントの校正を自動で処理し、赤いボールを検出して掴むPythonスクリプトまで生成できました。

さらにOpenClawの支援のもと、ロボットアームを制御するAIモデルの訓練にも成功しています。エージェントがトレーニングプロセスを案内し、各訓練後のエラー率を確認するなど、専門家なしでもモデル開発が可能であることを示しました。ハルシネーションによるバグは残る課題ですが、成果は十分に実用的なレベルです。

この手法は2022年の論文で提唱された「Code as Policy」に基づいています。UC BerkeleyのKen Goldberg教授らはNvidia、カーネギーメロン大学、スタンフォード大学と共同で、コーディングモデルのロボット制御能力を測るCaP-Xベンチマークを開発しました。興味深いことに、ロボット制御で最も高い性能を示したのはClaudeChatGPTではなくGoogleGeminiでした。マルチモーダル学習と物理世界の理解に注力してきた成果とみられます。

NvidiaJensen Huang CEOの息子であるSpencer Huang氏は、社内ハッカソンでバイブコーディングによるロボット制御の実験を推進しています。Goldberg教授との共同研究では、Code as Policyをより多くのロボットソフトウェアツールと互換性を持たせることを目指しています。「ほぼ誰でもロボティクスに参入できるようになること、それが真のブレークスルーだ」とHuang氏は語っており、音声やテキストでロボットを操作できる未来が近づいています。

Google、エージェント商取引基盤UCPを大幅拡張

UCP決済機能の拡充

Universal Cartが複数小売横断で稼働
Nike・Walmart等でGoogle Pay決済対応
YouTube広告からの即時購入を実現
Affirm・Klarna後払いをGoogle Payに統合

業種・地域の拡大展開

カナダ・豪州・英国へ順次展開
ホテル予約・フードデリバリーに対象拡大
AI Modeからの直接予約を実現

小売向けAIツール群

Merchant CenterにAI表示分析機能追加
Ask Advisor広告・分析を一元管理

Googleは2026年5月20日、Google Marketing Liveにおいて、エージェント型商取引の基盤であるUniversal Commerce Protocol(UCP)の機能を大幅に拡張すると発表しました。Google I/Oで発表されたUniversal CartやAgent Payments Protocol(AP2)と連携し、AIエージェントによるショッピング体験を本格的に推進します。

中核となるのは、複数の小売業者を横断して機能するUniversal Cartです。消費者はSearch、GeminiYouTubeなど複数サービスで商品をカートに入れ、Google Payで数タップで決済できます。Nike、Sephora、Target、Walmart、Wayfairなど大手小売業者に加え、Shopify加盟店も対象です。小売業者が常に販売主体となる仕組みを維持しています。

広告領域にもUCPが拡張されます。Direct OffersやYouTubeのショッピング広告からその場で購入可能になるほか、AffirmKlarnaによる後払いオプションがGoogle Payに組み込まれます。これにより広告から決済までのファネルが大幅に短縮されます。

地域・業種の拡大も発表されました。UCP対応決済はカナダ・豪州に数か月内に展開し、英国にも順次拡大します。さらにホテル予約やフードデリバリーなど新カテゴリへの参入も進め、SearchのAI ModeやGoogleマップの会話画面から直接予約・注文が可能になります。

小売業者向けには、Merchant Centerに新しいAIパフォーマンスインサイト機能を追加し、AI検索面でのブランド表示シェアを競合と比較できるようになります。また、AIアドバイザー機能「Ask Advisor」がMerchant Center内に搭載され、Google AdsやGoogle Analyticsと連携してリスティングやキャンペーンの管理を支援します。

Google、AI広告エージェントAsk Advisor発表

Ask Advisorの機能

複数Google製品を横断する統合AIエージェント
広告設計から効果分析まで一気通貫で対応
自然言語の指示でキャンペーン自動構築
データ専門知識なしでも最適な施策提案を取得可能

計測基盤の統合強化

オープンソースMMM「Meridian」をAnalytics 360に統合
ファーストパーティデータとクロスチャネル指標を一元化
Gemini搭載の予測シグナルで将来コンバージョンを推定
メディアミックス最適化と投資判断を高精度化

Googleは2026年5月20日、Google Marketing Liveにて広告運用を横断的に支援するAIエージェントAsk Advisor」を発表しました。Google Ads、Google Analytics、Merchant Centerなど複数製品に散在していたAIエージェントを統合し、マーケターが一つの対話型インターフェースからキャンペーンの立案・実行・分析までを完結できるようにします。英語アカウント向けにベータ版が提供開始され、年内に機能拡充が予定されています。

Ask Advisorの特徴は、自然言語による指示だけで広告運用の全工程を自動化できる点です。たとえば「ヘアケア商品の新規顧客を見つけて」と伝えると、Merchant Centerから商品情報を取得し、Google Adsでキャンペーンを自動構築します。さらに広告配信後はGoogle AdsとGoogle Analyticsのデータを横断分析し、何が効果的だったかを説明したうえで次のアクションを提案してくれます。

同時にGoogleは、計測基盤の強化も打ち出しました。オープンソースのマーケティングミックスモデル(MMM)である「Meridian」をGoogle Analytics 360に統合します。これにより、ファーストパーティデータとクロスチャネル指標を一元管理し、各チャネルの因果的なパフォーマンスを測定できるようになります。予測シナリオ機能でメディア投資の最適配分もシミュレーション可能です。

加えて、Geminiを活用した新しい予測シグナル「Qualified Future Conversions(QFC)」がGoogle Adsに導入されます。上流ファネルの広告支出とブランド検索などのシグナルを紐づけ、将来の売上につながる見込み顧客を可視化します。QFCは将来的にMeridianとも連携し、MMMの精度をさらに向上させる計画です。

今回の発表は、Google広告プラットフォーム全体をAI中心のアーキテクチャへ再編する戦略の具体化といえます。データの専門知識がなくても高度な分析と最適化にアクセスできる環境を整備することで、中小企業から大企業まで幅広いマーケターの生産性向上を狙っています。

Figure AIの人型ロボット連続稼働デモが世界的話題に

1週間近い連続デモの衝撃

Figure 03が荷物仕分けを自律実行
当初8時間の予定が約1週間に延長
人間インターンとの対決企画も実施
視聴者がロボットに愛称をつける現象

技術基盤と実力の見極め

Helix 02で全身制御と長期自律を実現
1000時間超の人間動作データで訓練
20万以上の並列環境でシミュレーション学習
デモの成功と実用性能は別問題との指摘

ロボットスタートアップのFigure AIが5月13日から開始したヒューマノイドロボットのライブ配信デモが、テック業界で大きな話題を呼んでいます。最新機種「Figure 03」が荷物のバーコードを検査しコンベアベルトに配置する作業を、人間の介入なしに自律的にこなす様子が約1週間にわたって配信されました。

当初の計画は8時間の連続稼働デモでした。同社CEOのBrett Adcock氏は、以前のデモがわずか1時間だったことを踏まえ「何かが壊れる可能性が高い」とX上で期待値を抑えていました。しかし結果として、ロボットは予想を大幅に上回る長時間稼働を達成しています。

このデモはYouTubeやXで急速に拡散し、視聴者がロボットに名前をつけたり、Figure AI側が関連グッズを急遽販売したりする盛り上がりを見せました。一部のユーザーからは「スティーブ・ジョブズの『One More Thing』以来最高のプロダクトデモ」という称賛も寄せられています。

Figure 03の自律動作を支えるのは、同社が開発したニューラルネットワーク「Helix 02」です。1000時間を超える人間の動作データと、20万以上の並列シミュレーション環境での訓練を経て、全身制御と長時間の自律行動を可能にしたとされています。

ただし、こうした印象的なデモが実世界でのロボット能力を正確に反映しているとは限りません。限定的なタスクでの成功と、多様な現場環境での実用性能には依然として差があり、商用展開に向けた信頼性の検証が今後の焦点となります。

NanoClaw、買収を蹴り1200万ドル調達

急成長と資金調達の背景

Valley Capital Partners主導で1200万ドル調達
Docker・VercelHugging Face CEOら参加
初コード作成から6週間でタームシート締結
約2000万ドルの買収提案を辞退

エンタープライズ展開戦略

従業員1対1のAIアシスタント提供
Docker Sandboxでゼロトラスト実行環境構築
MITライセンス維持しつつ管理サービスで収益化
GitHub星2.9万・25万DL突破

セキュリティ重視のオープンソースAIエージェント基盤NanoClawを開発するNanoCo AIが、Valley Capital Partners主導で1200万ドルのシードラウンドを完了しました。Docker、Vercel、monday.com、Hugging Face CEOのClem Delangue氏らが出資に参加しています。創業者のGavriel Cohen氏とLazer Cohen氏の兄弟は、約2000万ドル規模の買収提案を断り、独立した事業成長を選択しました。

NanoClawは、OpenClawのセキュアな代替として誕生しました。OpenClawが40万行に膨れ上がったのに対し、NanoClawのコアロジックは約500行のTypeScriptに抑えられ、人間のセキュリティチームが約8分で監査可能です。すべてのエージェントはDockerのMicroVMベースのサンドボックス内で隔離実行され、APIクレデンシャルがエージェントに直接渡ることはありません。

同社のエンタープライズ戦略の核は、従業員1人に1つのAIアシスタントを提供する「プロフェッショナルアシスタント」モデルです。メールや文書、会議メモを取り込みながら動的なナレッジグラフを構築し、Andrej Karpathy氏が提唱する「LLMナレッジベース」に近い仕組みで業務を支援します。Cohen氏は「1人のエージェント生産性が2〜3倍になれば、むしろ人員を増やしたくなる」と述べ、人員削減ではなく生産性の倍増を訴求しています。

シンガポール外相のVivian Balakrishnan氏がNanoClawを「セカンドブレイン」と公言したことで注目が急拡大しました。Cohen氏はシンガポールのカンファレンスで300人の聴衆に自身のエージェントを同時操作させるライブデモを実施し、悪意あるアクセス試行を遮断しつつ正当な予約だけを通すゼロトラストアーキテクチャの堅牢性を実証しています。

オープンソースのMITライセンスは維持したまま、自社でインフラを構築・運用できない企業向けにマネージド展開サービスで収益化を図ります。GitHub星数は2万9000近く、ダウンロード数は25万を突破しており、AmazonGoogleMeta、Accentureなど大手企業の幹部が個人利用から社内展開を検討する段階に入っています。

Google、AI広告動画をGemini Omniで自動生成

Asset Studioの進化

Gemini Omni統合で動画生成対応
マーケティングブリーフ自動理解
自然言語でのクリエイティブ編集
複数テーマ・形式を一括生成

広告運用への実装

1クリックA/Bテスト機能搭載
ブランドガイドライン自動準拠
今夏から英語圏でグローバル展開

Google I/O 2026で、Google広告クリエイティブ制作ツール「Asset Studio」の大幅アップデートを発表しました。新たにマルチモーダルモデル「Gemini Omni」を統合し、テキストや画像だけでなく動画アセットもワンストップで制作できるようになります。広告主のマーケティングブリーフ、ブランドガイドライン、ウェブサイト、目標を自動的に理解し、高品質なクリエイティブを即座に生成します。

従来のAsset Studioは静止画やテキスト中心のアセット生成が主でしたが、Gemini Omniの統合により動画クリエイティブの制作が同一プラットフォーム内で完結します。自然言語での指示によるクリエイティブの調整にも対応しており、専門的な編集スキルがなくても広告素材を制作できます。

パフォーマンス最適化の面では、1クリックA/Bテスト機能が追加されました。広告主が設定した目標に基づき、複数のクリエイティブバリエーションの中から最も効果の高いアセットを自動的に特定します。制作から検証までのワークフローが一つのツールに集約されます。

これらの新機能は2026年夏から英語対応でグローバル展開される予定です。GoogleはAsset Studioを「アイデアから広告までを一箇所で完結させるツール」と位置付けており、広告制作の効率化と品質向上の両立を目指しています。

Google、SynthIDとC2PAを検索に統合

検証機能の大幅拡大

SynthID検証がChrome検索に搭載
C2PA情報も同一画面で確認可能に
OpenAIChatGPT画像SynthID埋め込み開始

実効性への課題と期待

C2PAメタデータはSNS投稿時に容易に除去される
SynthIDは除去困難で事実検証に実績
オープンソースモデルの採用は不透明

MetaのC2PA活用

Instagramでカメラ撮影写真にC2PAタグ付与
AI生成画像と実写の判別を支援

Googleは2026年5月19日のI/Oカンファレンスで、AI生成コンテンツの検証技術であるSynthIDのマーカー確認機能をChromeブラウザとGoogle検索に統合すると発表しました。Chromeはウェブブラウザ市場で圧倒的なシェアを占めており、この統合により数十億人規模のユーザーがAI生成画像の真偽を手軽に確認できるようになります。

さらにGoogleの検証インターフェースは、コンテンツの来歴を記録する業界標準規格C2PA Content Credentialsの情報も同時に表示します。従来はSynthIDの確認にGeminiアプリ、C2PAの確認に専用ポータルと別々のツールが必要でしたが、これを一画面に集約することで検証の手間を大幅に削減します。

OpenAIも同日、ChatGPTCodex・APIで生成した画像SynthIDを埋め込む方針を発表しました。同社はすでにC2PAメタデータを付与していますが、SNSへの投稿時にメタデータが除去される問題が指摘されています。OpenAI自身もC2PAについて「銀の弾丸ではない」と認めており、スクリーンショットの撮影やプラットフォームへのアップロードで容易に失われる限界があります。

一方、SynthIDは画像に不可視の電子透かしを埋め込む方式のため、メタデータ除去の影響を受けにくく、ファクトチェッカーによるディープフェイク検証で実績を積んでいます。両技術が相互補完的に機能することで、より広範な安全網を構築できる可能性があります。

MetaInstagramでカメラ撮影画像にC2PAメタデータを付与する取り組みを開始します。これによりユーザーは実写とAI生成画像を区別しやすくなりますが、過去にはAIラベルの誤適用で批判を受けた経緯もあります。悪意あるディープフェイクに使われるオープンソースモデルがこれらの仕組みを採用する保証はなく、来歴技術の実効性はこれから問われることになります。

米ユタ州で4万エーカーの巨大データセンター計画に住民猛反発

Stratos計画の全容

Kevin O'Leary支援の4万エーカー規模
マンハッタンの2倍超の面積
電力消費9GWで州需要のほぼ2倍
第1期の投資額は40億ドル超

環境への深刻な懸念

年間CO2排出量3020万トンで州全体を55%増加
熱負荷16GWが砂漠の気温を最大12°F上昇
水源確保に住民4000件の異議申し立て

住民の反対運動と政治的対立

住民投票で郡承認覆す動き

米ユタ州Box Elder郡で、投資家Kevin O'Leary氏が支援する4万エーカー規模のデータセンターStratos Project」が郡委員会の承認を得ましたが、環境負荷への懸念から住民の強い反発に直面しています。同計画はAI分野での米国の覇権確立を掲げ、Spencer Cox知事の支持も取り付けました。

Stratos Projectはマンハッタンの2倍超の面積に9GWの電力を消費する施設で、第1期だけで40億ドル超の投資が見込まれます。電力はRuby Pipelineからメタンガスを引いて敷地内発電所で賄う計画ですが、その消費量はユタ州全体の家庭・企業・発電所が使う天然ガスの約1.5倍に相当します。

環境面の懸念は深刻です。ユタ州立大学の物理学教授Robert Davies氏の分析によると、施設の熱負荷は16GWに達し、「毎日原爆約23個分のエネルギーを地域環境に放出する」規模になります。周辺の砂漠では日中2〜5°F、夜間は8〜12°Fの気温上昇が予測され、砂漠の生態系が依存する夜間の結露が失われる恐れがあります。

水資源も争点です。当初計画していたSalt Wells Springからの取水には約4000件の異議が寄せられ、開発側は申請を取り下げました。しかし新たに「Hansel Valleyの無名の泉」からの取水を申請しており、最近成立した水利権法により、公共の福祉への影響を理由に申請を却下することが難しくなっています。

住民側は郡の承認を覆す住民投票の実施を申請しています。一方、郡委員のBoyd Bingham氏は抗議者に「いい加減にしろ」と発言し、Cox知事も許認可の迅速化を主張。O'Leary氏は反対派を「中国の資金提供を受けている」と非難するなど、政治的対立が激化しています。巨額投資と住民の直接民主主義が正面からぶつかる象徴的な事例となっています。

MIT教授が化学原理を組み込んだAI創薬モデルを開発

化学の直感をAIに実装

ShEPhERDが3D形状で薬物評価
製薬企業が新薬発見に実用中
分子のタンパク質結合を予測
化学的妥当性を生成モデルに付与

反応予測と物理法則の融合

FlowERで反応生成物を予測
質量保存則など物理原理を内蔵
反応中間体の実現可能性を考慮
専門家反応機構理解を再現

化学工学とCSの融合研究

構造解析から実験自動化まで展開
DARPA支援の合成計画研究が原点

MITのConnor Coley准教授が、化学の基本原理を組み込んだAIモデルを開発し、小分子創薬の効率化に取り組んでいます。薬の候補となりうる化合物は推定10の20乗から60乗に及び、実験的な評価は現実的に不可能なため、AIによるスクリーニングが不可欠になっています。

同教授の研究室が開発したShEPhERDは、候補薬物分子の3次元形状に基づいて標的タンパク質との相互作用を評価するモデルです。すでに複数の製薬企業が新薬発見に活用しており、生成モデルにメディシナルケミストリーの直感を持たせる試みとして注目されています。

もう一つの成果である生成AIモデルFlowERは、異なる化学物質を組み合わせた際の反応生成物を予測します。質量保存則などの物理法則を設計に組み込み、反応経路上の中間ステップの実現可能性も考慮させることで、予測精度を向上させました。

Coley教授は化学工学と計算機科学の交差領域を専門としています。Caltechで化学工学を学んだ後、MIT機械学習ケモインフォマティクスを用いた反応経路最適化の研究で博士号を取得しました。DARPAの「Make-It」プログラムを通じて、機械学習による医薬品合成の改善に取り組んだことが現在の研究の出発点です。

研究室では創薬AI以外にも、コンピュータ支援構造解析、実験室自動化、最適実験設計など幅広い領域に取り組んでいます。化学におけるAI活用のフロンティアを多角的に押し広げる方針です。

xAI、違法タービン訴訟中に28億ドル追加購入を計画

SpaceX上場で判明した計画

28億ドルのタービン追加購入
うち20億ドルが移動式ガスタービン向け
今後3年間でAIインフラに投入

深刻化する環境問題と法的リスク

NAACPが無許可運転で提訴
許可15基に対し46基を稼働
EPAが連邦法違反と認定
年間2000トン超のNOx排出の恐れ

規制回避の論理と限界

トレーラー搭載で「移動式」と主張
州と連邦の規制解釈の齟齬を利用

イーロン・マスク氏率いるxAIが、テネシー州メンフィス近郊のデータセンターで使用するガスタービンをめぐり訴訟を抱えるなか、さらに28億ドル相当のタービン追加購入を計画していることが、SpaceXIPO申請書類から明らかになりました。うち20億ドルは、現在訴訟の対象となっている「移動式ガスタービン」向けです。

xAIデータセンターでは現在46基のガスタービンが稼働していますが、正式に許可を取得しているのは15基にとどまります。各タービンは年間2000トン超の窒素酸化物(NOx)を排出する能力があり、全米でも大気汚染が深刻な地域の環境をさらに悪化させています。

これに対しNAACPが差し止め請求を含む訴訟を提起し、米環境保護庁(EPA)もxAIの運転が連邦法に違反していると認定しました。xAI側はタービンが輸送用トレーラーに搭載されたままであることを根拠に「移動式」と主張し、最長1年間は許可不要と反論しています。

しかしこの主張は、移動式発電機の許可を不要とするミシシッピ州の解釈と、同規模のタービンにはトレーラー搭載であっても大気汚染規制が適用されるとする連邦規制との齟齬を突いたものです。SpaceX自身もIPO申請書類のなかで、差し止め命令や許可取り消しが「AIビジネスに悪影響を及ぼす」とリスク要因に明記しています。

AI企業のインフラ需要が急拡大するなか、環境規制との両立が大きな課題として浮上しています。xAIの事例は、データセンター電力確保を急ぐあまり法的リスクを積み上げる構図を象徴しており、今後の規制動向と訴訟の行方が注目されます。

Google、Gemini活用の次世代AI広告を展開

AI Mode向け新広告形式

Conversational Discovery広告で質問に直接回答
推薦リスト内にHighlighted Answers表示
独立したAI解説を広告に併記し透明性を確保
75%のユーザーがAI Modeで意思決定を迅速化

検索とコマースの進化

AI-powered Shopping広告が商品選定理由を自動生成
Business Agentが広告内チャットでリード獲得
Direct Offers拡大でネイティブ決済統合
Ask Advisorが広告・分析・MCを横断支援

Googleは2026年5月20日のGoogle Marketing Liveで、Geminiを基盤とした次世代広告フォーマットを発表しました。AI SearchおよびAI Modeにおいて、従来の静的な広告からユーザーの質問に直接応答する対話型広告へと大きく舵を切ります。同社によれば、AI Modeを利用した消費者の75%が購買判断の迅速化を実感しています。

AI Mode向けには2種類の新広告が導入されます。Conversational Discovery広告はユーザーの具体的な質問に対し、Gemini広告主の商品情報をもとにカスタマイズした回答を生成します。Highlighted AnswersはAI Modeが提示する推薦リスト内に、関連性の高い広告を自然に組み込む形式です。いずれも広告であることを明示する「Sponsored」ラベルが付与され、独立したAI解説で透明性を担保します。

通常のGoogle検索にも新機能が加わります。AI-powered Shopping広告では、エスプレッソマシンなどの商品検索時にGeminiが最適な商品を選び出し、その商品が適している理由を即座に生成します。Business Agent for Leads広告内にチャット機能を埋め込み、大学選びなど重要な意思決定の場面でユーザーの質問にリアルタイムで回答します。

2026年1月に開始したDirect Offersパイロットも拡充されます。Chewy、Gap、L'Oréalなどが参加するこのプログラムでは、プロモーションのバンドル化やUniversal Commerce Protocolによるネイティブ決済統合が追加されました。旅行分野ではBookingやExpediaがAIによる旅行計画内で特別オファーを提示できるようになります。

広告運用面では、Google Ads・Analytics・Merchant Centerを横断する統合エージェントAsk Advisorや、ブランドガイドラインから高品質クリエイティブを生成するAsset Studioの強化も発表されました。Googleは「AI時代に勝つにはAIを活用するしかない」と述べ、広告エコシステム全体のAI化を加速させる姿勢を鮮明にしています。

Google I/O「全疾病を解決」発言の危うさを検証

Hassabisの大胆な宣言

Gemini for Science発表に合わせた発言
AlphaFoldやAlphaGenome等の研究用AIツール群
全疾病解決は研究者向けの文脈

AI医療研究の現実と限界

実用化には20年以上が現実的見通し
FDA治験や倫理課題は省略不可
アルゴリズムバイアスやデータ格差が残存

科学ウォッシングへの警鐘

RFK Jr.のFDA不要論との誤った連想リスク
短尺動画時代に文脈が消失する構造的問題

Google DeepMind CEOのDemis Hassabisは、Google I/O 2026の基調講演の終盤で「すべての疾病を解決することを目指す」と宣言しました。この発言は、研究者向けAIツール群「Gemini for Science」の発表に合わせたもので、タンパク質構造予測のAlphaFoldやDNA変異予測のAlphaGenomeなどが含まれます。

AlphaFoldはすでにマラリアワクチン開発やLDLコレステロール関連タンパク質の発見、若年性パーキンソン病の原因タンパク質解明など具体的な成果を上げています。AlphaGenomeも疾病の発症メカニズム解明に貢献する可能性がありますが、Nature誌の研究では個人ゲノム予測への未対応や細胞・組織特異的パターンの限界が指摘されています。

しかしThe Vergeの記者Victoria Songは、こうした成果があっても「全疾病解決」という表現は一般視聴者に誤解を与えると警告します。実用化には少なくとも20年以上が必要であり、FDA治験や動物実験といった従来のプロセスをAIが代替することはできません。倫理的・規制的課題も依然として山積しています。

特に問題視されるのは、RFK Jr.保健長官がAIでFDAを「無用にできる」と発言した文脈との混同リスクです。Hassabisの発言は研究者コミュニティに向けたものですが、短尺動画やSNSの時代では文脈が剥落し、科学的根拠なき楽観論や「サイエンスウォッシング」を助長しかねないと指摘されています。

記事は、シリコンバレーで流行するペプチドパーティーやバイオハッキング文化にも触れ、「AIが全疾病を解決する」という言説が「サプリで死を克服する」といった非科学的主張と地続きになる危険性を示唆しています。AIは医療研究の強力なツールですが、専門家の判断と科学的厳密性は省略できないという結論です。

YouTube、AI広告とOmniショート動画を発表

Demand Gen広告の進化

マルチモーダル動画広告の自動生成
Googleマップ面への広告配信開始
チェックアウトリンクが9市場に拡大
商品フィードが自動車業界にも対応
AI支援によるワンクリックキャンペーン作成

Shorts Remixの衝撃

Gemini Omniで他者のShortsをAI変換
自分自身を他人の動画挿入可能

Googleは2026年5月20日のGoogle I/Oにおいて、YouTubeに関する2つの大型アップデートを発表しました。広告主向けにはDemand Genの機能拡張、一般ユーザー向けにはGemini Omniを活用したショート動画リミックス機能が導入されます。いずれもAIを中核に据え、YouTube広告収益力とユーザーエンゲージメントの両面を強化する施策です。

Demand Genでは、Asset Studioのマルチモーダル動画生成機能により、数回のプロンプト入力で高品質な広告素材を作成できるようになります。クリエイターとのパートナーシップ動画をキャンペーン設定画面から直接ブーストする機能も追加され、クリエイターエコノミーと広告の融合が進みます。小売業者はGoogle Merchant Centerに動画をアップロードするだけで、リアルタイムのユーザー関心に基づいた動的配信が可能になります。

配信面の拡大も注目点です。Googleマップへの広告在庫が新たに追加され、地域探索中のユーザーにリーチできるようになります。チェックアウトリンクは9つの新市場に展開され、商品フィードは自動車業界を含む新たな業種にも対応します。商品フィードを活用した広告主はコンバージョンが平均33%向上するとGoogleは報告しています。

一般ユーザー向けのShorts Remix機能では、Gemini Omniの映像生成能力を活用し、他者が投稿したショート動画をAIでリスタイルできます。ピクセルアート風やアニメ風への変換に加え、自分自身を動画に挿入することも可能です。クリエイター側にはリミックスを無効にするオプションが用意されており、リミックス動画にはデジタル透かしと元動画へのリンクが付与されます。

これらの施策はYouTubeの競争力を複数方向から強化するものです。広告主にはAIによるクリエイティブ自動化と測定精度の向上を提供し、ユーザーにはAI動画編集という新たな表現手段を開放しています。特にDemand GenのAI支援キャンペーン作成は、既存のPerformance Maxキャンペーンの設定をワンクリックで最適化できるため、広告運用の効率化が大幅に進む見通しです。

Googleがシンガポール政府とAI国家連携を拡大

医療・科学での活用

DeepMindがAI共同臨床医研究を展開
国立研究財団とCo-Scientist活用で連携
A*STARにCloud AI分析基盤を提供
視覚障害者向けランニングエージェントを実証

教育・人材と安全基盤

教育機関Gemini搭載Workspace提供済み
教育省と教員AI研修プログラムを拡充
CSA・GovTechとAIエージェント安全指針を策定
多言語安全ベンチマーク研究を推進

Googleは2026年5月20日、シンガポール政府と包括的なAI国家パートナーシップを締結しました。デジタル開発情報省(MDDI)が主導し、複数の政府機関と連携して、医療・科学・教育・安全の各分野でフロンティアAIの社会実装を加速させます。

医療分野では、Google DeepMindのシンガポール研究拠点を軸に、公立病院群と「AI共同臨床医」研究を開始します。AIエージェントが臨床ガイドラインや科学文献に基づく情報を提供し、医師の診療を支援する仕組みです。科学研究では、国立研究財団(NRF)と連携し、仮説生成ツールCo-Scientistの活用研修を展開します。

教育分野では、すでに全国の小学校から短期大学までGoogle Workspace for EducationにGeminiベースのAI機能を導入済みです。教育省との協力をさらに拡大し、授業計画や教材カスタマイズの自動化、教員向けAI研修プログラムの整備を進めます。

AI安全の領域では、サイバーセキュリティ庁(CSA)やGovTechと共同でAIエージェントサンドボックスの知見をまとめた白書を公開しました。コンピュータ操作エージェントの安全な運用指針を示しています。さらにIMDAやMLCommonsと多言語・多モーダルの安全ベンチマーク研究も進行中です。

企業支援の面では、Google CloudシンガポールエンジニアリングセンターのForward Deployed Engineers(FDE)チームを拡充し、現地企業のエージェント型AIによる業務変革を加速させます。シンガポールを信頼できるAI展開のグローバル拠点として確立する狙いです。

DeepMind、視覚障害者向けAIランニングガイド発表

二重構造で安全性を確保

Pixel 10 Pro胸部装着で走路認識
オンデバイス処理で超低遅延の停止警告
Gemma 4が高次の状況判断を担当
高エントロピーフレームのみ選択処理

マルチエージェント協調

Planner:天候・地図取得と目標設定
Coach:危険度3段階で音声指示
Break:休憩・再開を柔軟に管理

ウェアラブル展開と実地検証

スマートグラス試作で視野拡大
シンガポールSG Enableと共同テスト

Google DeepMindは2026年5月20日、視覚障害者や弱視のランナーがガイドランナーなしで走れるようにする「Running Guide agent」を発表しました。従来、視覚障害者のランニングには伴走者やトラックの誘導ラインが必要でしたが、本エージェントはリアルタイムの空間認識AIにより単独走行を目指します。

システムの核心は安全性を最優先した二重経路アーキテクチャです。第一の経路はPixel 10 Proのカスタムシリコン上で完全オフライン動作するセグメンテーションモデルで、超低遅延の停止警告や方向指示音を提供します。第二の経路はGemma 4 E4Bによる高度なマルチモーダル推論で、地形変化や新たな障害物など情報量の多いフレームだけを選択処理することで、遅延を抑えつつ的確なコーチングを実現します。

ランニング体験全体を3つの専門エージェントが分担します。Planner天候Google Maps情報を取得しワークアウト目標を設定します。Coachは走行中に「DANGER」「WARNING」「NOTICE」の3段階で簡潔な音声フィードバックを届けます。Breakは休憩と再開を管理し、ランナーが自分のペースで運動を続けられるよう支援します。

今後の展開として、胸部装着のスマートフォンに加えスマートグラスへの搭載を試作中です。グラスはより広く安定した視野を提供し、マルチモーダルモデルへの入力品質を大幅に向上させます。また、シンガポールの障害者支援機関SG Enable提携し、実際の視覚障害ランナーとともに実地テストを進めています。エッジコンピューティングと深い環境理解の組み合わせにより、すべてのランナーに自立した走行体験を届けることが目標です。

Stability AIが6分超の楽曲生成モデルを公開

モデルの全体像

4モデルを同時公開
最大27億パラメータの大規模構成
小型版はオープンウェイトで提供
6分20秒の長尺楽曲に対応

ライセンスと事業戦略

Warner・Universal提携済み
学習データは完全ライセンス取得
プロ向け音楽制作ツールを開発中
音楽業界幹部の採用を加速

Stability AIは2026年5月20日、音声生成モデルの新シリーズ「Stable Audio 3.0」を発表しました。最上位モデルは6分20秒のプロ品質の楽曲を生成でき、2024年リリースの前世代モデルが対応していた長さの2倍以上を実現しています。

今回公開されたのは、小型SFX(4.59億パラメータ)、小型(同)、中型(14億パラメータ)、大型(27億パラメータ)の4モデルです。小型2モデルは最大2分の音楽デバイス上で生成でき、中型・大型は楽曲構造やメロディの一貫性を保った長尺生成が可能です。小型SFX・小型・中型の3モデルはオープンウェイトで公開され、誰でも利用・改変できます。

大型モデルはAPIとセルフホスティング経由のみの提供で、売上100万ドル超の企業はエンタープライズライセンスが必要となります。Stability AIは学習データがすべて正規にライセンスされたものであると説明しており、Warner Music GroupおよびUniversal Music Groupとの提携がその基盤となっています。

AI音楽生成の分野ではGoogleElevenLabsも参入していますが、SunoやUdioが著作権訴訟に直面するなど、学習データのライセンスが事業継続の鍵となっています。Stability AIはライセンス問題をクリアした点で競合との差別化を図っています。

同社はプロのミュージシャン向けに新たな製品群を開発中で、Universal AudioやFenderで最高デジタル責任者を務めたEthan Kaplan氏をプロ向け音楽事業の責任者として迎えました。AI音楽企業が音楽業界の経験者を積極的に採用する動きは業界全体のトレンドとなっています。

OpenAI教育プログラムにシンガポール参加、9カ国に拡大

第1期の成果と実績

ヨルダンで100万人超の生徒が利用
カザフスタンで8.4万教員がAI研修修了
スロバキアの教員9割超が生産性向上を報告
エストニアで2万人超の生徒に展開済み

シンガポールとの協力

母語学習の個別最適化を支援
教育省・GovTechと共同で活用事例構築
教員向けワークショップを実施

今後の展開方針

教員主導のLuminariesプログラム開始予定
次期参加国の募集を年内に発表

OpenAIは2026年5月20日、ロンドンで開催されたEducation World Forumにおいて、教育支援プログラム「Education for Countries」の次段階を発表しました。今年のダボス会議で発足した同プログラムにシンガポールが新たに参加し、エストニア、ギリシャ、イタリア、スロバキア、トリニダード・トバゴ、カザフスタン、UAE、ヨルダンに続く9カ国目となります。

第1期参加国ではすでに具体的な成果が出ています。ヨルダンでは100万人以上の生徒と10万人以上の教員がAI教育アシスタント「Siraj」を利用しています。カザフスタンでは全20地域でChatGPT Eduが導入され、8万4000人超の教員がAI準備研修を修了しました。スロバキアの大学調査では、教員の9割超が週5時間程度の時間削減を実感しています。

シンガポールでは、18〜24歳のChatGPT利用の約43%が学習・教育目的であることが判明しています。同国の教育省およびGovTechと連携し、母語学習のインタラクティブな個別最適化などのユースケースを構築します。教員向けにはOpenAI Academyのシンガポール版ワークショップや、Codex for Teachersハッカソンも実施予定です。

プログラム全体は「研究主導の展開」「現地化されたAI学習ツール」「教員研修と支援」の3本柱で構成されています。OpenAIの学習成果測定スイートを活用し、政府・教育者と共同でAIの学習への影響を検証します。エストニアではタルトゥ大学やスタンフォード大学と連携し、2万人超の生徒を対象とした実教室環境での影響調査を進めています。

今後は教員との共同設計を軸とする「OpenAI Luminaries」の第1フェーズを近く開始する予定です。次期参加国の選定も進んでおり、年内に発表される見通しです。週9億人超がChatGPTを利用するなか、OpenAIエージェント型AIの教育活用を政府レベルで推進する方針を鮮明にしています。

Google Beam、等身大表示で会議を刷新

没入型ディスプレイ活用

HP Dimensionで等身大表示
非Beam端末からも自動最適化
空間オーディオで声を定位

ハイブリッド会議の改善効果

社会的つながりが50%向上
会話貢献度が21%増加
ハイブリッドの包摂性格差を縮小

今後の展開

Google WorkspaceやZoomと連携継続
beam.googleで最新情報を公開予定

Googleは2026年5月20日、ビデオ会議プラットフォーム「Google Beam」において、グループ会議の体験を向上させる新たな実験的機能を発表しました。HP Dimensionの没入型ディスプレイを活用し、Beam以外のデバイスから参加するメンバーを等身大で表示する技術です。

この機能では、リモート参加者がまるで同じテーブルを囲んで座っているかのように、実物大のサイズと位置で画面上にレンダリングされます。さらに空間オーディオを組み合わせることで、発言者の声がその人物の表示位置から聞こえるように定位されます。自宅からでもオフィスからでも、参加時に自動で最適化が行われます。

Googleの研究によると、このアプローチはハイブリッド会議における「包摂性の格差」を解消する効果があります。具体的には、社会的つながりの感覚が50%強化され、会話への貢献能力の自己評価が21%向上したと報告されています。

従来のビデオ会議では、小さなタイル状の画面に表示される参加者の微妙な表情を読み取ることが難しく、リモート参加者が傍観者のように感じてしまう課題がありました。等身大表示と空間オーディオの組み合わせにより、対面に近い自然なコミュニケーションが実現されます。

GoogleGoogle WorkspaceおよびZoomとの連携を通じて、既存のBeam上での会議体験をさらに高めていく方針です。経営者やリーダーにとって、ハイブリッドワーク環境における会議の質向上は生産性に直結する重要なテーマであり、今後の展開が注目されます。

IrisGoがPC操作自動化で280万ドル調達

プロアクティブAIの挑戦

Andrew NgのAI Fund主導で資金調達
ユーザー操作を学習し自動再現
コーディング支援機能も搭載

普及戦略と今後の展開

NvidiaGoogleも出資
Acerとプリインストール契約締結
macOSWindows向けベータ版公開
他メーカーへの搭載拡大を計画

IrisGoは、Andrew NgのAI Fundが主導した280万ドルのシードラウンドを完了したスタートアップです。同社はPCのデスクトップ上でユーザーの日常的なワークフローを学習し、人間の指示なしに自動化する「プロアクティブAI」コンパニオンを開発しています。共同創業者のJeffrey Lai氏は元Apple技術者で、中国語版Siriの開発に携わった経歴を持ちます。

IrisGoの基本的な仕組みは、操作を一度見せるだけでそのプロセスを記憶し、以降は自動で再現するというものです。デモではオンラインでのコーヒー注文手順を一度記録し、その後エージェントが自律的に同じ注文を完了する様子が披露されました。メール作成や請求書処理、レポート作成など、すぐに使えるスキルライブラリも内蔵されています。

プライバシー面では、多くのデータをオンデバイスで処理する設計を採用しています。クラウド処理はユーザーが明示的に許可した場合のみ実行され、エンドツーエンド暗号化が適用されます。ただし大規模なタスクについてはクラウドとのハイブリッド構成となっています。

事業拡大の面では、NvidiaGoogleからも出資を受けており、著名な支援者との連携で信頼性を確保しています。最近macOSWindows向けのベータ版をリリースしたほか、Acerと新デバイスへのプリインストール契約を締結しました。今後は他のデバイスメーカーとも同様の提携を目指す方針です。

Google、ミズーリ州新データセンターに地域投資を発表

エネルギーと地域負担軽減

Amerenと500MW超の容量確保契約締結
2000万ドルのエネルギー影響基金設立
家庭の光熱費削減へ断熱・省エネ支援

雇用と人材育成

直接雇用1人あたり地域9人の雇用創出
建設労働者の訓練・見習いプログラム資金提供
モンゴメリー郡で数千人規模の育成計画

Googleは2026年5月20日、ミズーリ州モンゴメリー郡に新設するデータセンターに伴い、エネルギー・雇用・教育分野での地域投資プログラムを発表しました。同社はAIインフラの拡大を地域経済の活性化と結びつける姿勢を鮮明にしています。

エネルギー面では、電力会社Amerenとの容量確保フレームワーク契約に基づき、500メガワット超の追加電力容量の開発を支援します。Googleは自社の運用・インフラコストを自ら負担する方針を明確にしました。

さらに、2000万ドル規模のエネルギー影響基金を設立し、住宅の断熱改修やエネルギー効率化を通じて地域家庭の光熱費負担を軽減する取り組みを進めます。データセンター建設が地域住民の電気料金上昇につながるとの懸念に先手を打つ施策です。

雇用創出においては、同社のデータセンターが直接雇用1人に対し地域で9人の雇用を生み出す経済波及効果を強調しています。モンゴメリー郡では、建設労働者・見習い訓練センターへの資金提供を通じ、数千人規模の技能労働者育成を計画しています。