Google I/Oで動画生成AI Gemini Omni発表

新モデルの全容

Gemini Omni動画の会話編集に対応
Gemini 3.5 Flashがエージェント性能で最前線に
Gemini appとAI Mode in Searchの標準モデルに採用
開発基盤Antigravityとの統合で複雑タスク実行

個人向けエージェントSpark

Gmail・カレンダー等と連携し24時間稼働
個人データから高精度な提案を自動生成
AI Ultra加入者向けに米国で提供開始

提供と課題

Omni FlashはYouTube Shortsでも無料利用可能

Googleは2026年5月の開発者会議Google I/O 2026で、3つの主要AI製品を発表しました。マルチモーダル動画生成モデル「Gemini Omni」、エージェント向け最新モデル「Gemini 3.5 Flash」、そして常時稼働型パーソナルAIエージェントGemini Spark」です。いずれもGoogleエージェント実行基盤Antigravityと統合されています。

Gemini Omniは画像音声動画・テキストを入力として高品質な動画を生成・編集できるモデルです。自然言語で動画を会話的に編集でき、前のターンの指示を引き継ぎながらキャラクターの一貫性や物理法則を保つ点が特徴です。Gemini app、Google FlowYouTube Shorts等で順次提供されます。

Gemini 3.5 Flashはエージェントタスクとコーディングに特化した最新モデルで、大規模フラッグシップモデルに匹敵する性能をFlashシリーズの速度で実現します。Gemini appの標準モデルおよびGoogle検索のAI Modeに採用され、検索結果をリアルタイムにカスタムUIとして生成する機能や、情報エージェントによるバックグラウンド監視機能が導入されます。

Gemini SparkはGemini 3.5とAntigravityを基盤とするパーソナルAIエージェントで、GmailGoogleカレンダー等のWorkspaceツールと連携して日常タスクを自動化します。WIREDの実機レビューでは、メールやカレンダーから誕生日パーティーの計画を自動生成するなど高い情報統合力を示しました。一方で、同居のパートナーを「親しい友人」と分類するなど文脈理解の限界も露呈しています。

セキュリティ面では、個人データへの広範なアクセスに伴うプロンプトインジェクション攻撃のリスクGoogle自身が警告しています。Sparkは月額100ドルのAI Ultraプランの加入者向けに米国で提供が始まりました。Gemini 3.5 FlashのAPIはGoogle AI StudioやAndroid Studio等で一般提供されています。

ボストン小児病院、AIで希少疾患40件超を新規診断

臨床への応用

希少疾患40件超の未解決症例を診断
遺伝・表現型・文献をAIが統合解析
新規遺伝子標的と治療経路の発見

業務基盤としての導入

全職員の3分の1が日常業務でAI活用
6万時間の業務削減と700万ドル相当の再配置
50超の自動化で請求・手術日程を最適化

米ボストン小児病院は、AIを実験的なツールではなく組織全体の臨床・業務インフラとして導入し、これまで診断不能とされてきた希少疾患40件超の確定診断に成功しました。同病院は年間約100万件の外来診療を扱う世界最大級の小児医療機関で、OpenAIとの協業により成果を上げています。

臨床面では「副操縦士遺伝学者」と呼ばれるAIシステムを開発しました。遺伝情報、表現型データ、世界中の医学文献を統合し、人間の認知限界を超えた診断推論を実現しています。この取り組みから新たな遺伝子標的や治療経路の候補も特定されており、従来は答えを得られなかった家族に希望をもたらしています。

業務面では、個別ツールの導入から方針を転換し、安全なChatGPT環境を全部門共通の「エンタープライズAI層」として構築しました。サプライチェーンの請求処理、手術スケジューリングの最適化など50を超える自動化を展開し、約6万時間の業務時間を削減しています。これは700万ドル超の人件費再配置に相当します。

導入のポイントは、AIを独立した取り組みではなく日常業務に組み込んだことです。最高イノベーション責任者のジョン・ブラウンスタイン氏は「人々がいる場所で出会うことが鍵だ」と述べています。現在は全職員の3分の1以上がAIを日常的に利用しており、従来は数カ月を要した新ツールの展開も数日で可能になりました。

今後は臨床意思決定への深い統合と専門領域への拡大を計画しています。ブラウンスタイン氏は「世界中の医学知識を備えた高度に訓練された医師を傍らに置かない理由があるだろうか」と語り、AIが医療の中核インフラとなる将来像を示しました。

PinterestがQwen改造でAIコスト90%削減

独自埋め込みで高速化

Qwen3-VLの視覚層を独自埋め込みに置換
推論レイテンシが20分の1に改善
精度も30%向上を達成

嗜好グラフで購買転換

6.2億ユーザーの嗜好を動的に表現
発見から購買意図への転換を促進
ユーザー埋め込みを常時更新
メタデータの事前計算で大規模運用を実現

Pinterestは月間アクティブユーザー6.2億人を抱えるビジュアル発見プラットフォームです。同社CTOのMatt Madrigal氏は、オープンソースモデルQwen3-VLの視覚エンコーダ層を取り除き、独自のマルチモーダル埋め込みで再構築することで、AIコストを90%削減し、精度を30%向上させたことを明らかにしました。

従来の手法では、推論時に返される画像を1枚ずつエンコードする必要があり、レイテンシが大幅に悪化していました。独自埋め込みの導入により、ピンや画像のメタデータをオフラインで事前計算し、定期的に再学習できるようになったため、推論速度は20倍に改善しています。Madrigal氏は「独自データで微調整すれば、データ品質がモデルサイズを上回る」と述べています。

同社はGoogleのBERTやOpenAIのCLIPの時代からオープンソースモデルの社内カスタマイズに取り組んできました。会話型ショッピングアシスタント「Navigator 1」もQwen3-VLをベースに大幅な改造を施して構築されています。Apache 2.0ライセンスのモデルを活用し、重みレベルで自社ユースケースに最適化する戦略が、コスト効率とパフォーマンスの両立を可能にしています。

さらにPinterestは「テイストグラフ」と呼ばれる嗜好表現の仕組みを構築しています。これはソーシャルグラフではなく、数十億人のユーザーが何に興味を持ち、次に何をしたいかを動的に捉えるプリファレンスグラフです。ユーザー埋め込みは行動や新規コンテンツに基づいて常時更新され、ミッドセンチュリーモダンやナンタケットスタイルといった個人の美的嗜好に合った商品をパーソナライズして提示します。

この仕組みにより、インスピレーションの発見から購買意図への転換という「上位ファネルから下位ファネルへの誘導」が実現されています。Madrigal氏は、6億人超のユーザーに対してスケールが求められる機能については「自社構築するか、オープンソースを徹底的にカスタマイズする」と方針を示しました。

企業AIエージェント、信頼性問題で再構築期に突入

本番環境の課題

第1世代エージェントの再設計が急務
クラッシュ時の状態保持と復旧が不在
推論コストの再実行で肥大化

決定論的スパインの台頭

LLMを確率的頭脳として分離
オーケストレーション層が実行を保証
ワークフロー可視化でコスト管理

企業の対応方針

標準化フレームワークで柔軟性と統制を両立
既存基盤のAI拡張が自然な進化

企業のAIエージェントが本番環境に移行するなか、信頼性の問題が深刻化しています。ワークフローオーケストレーション企業Temporalの上級副社長Preeti Somal氏は、ニューヨークで開催されたAI Impact Seriesで、多くの企業が第1世代のエージェントを再構築する「バージョン2.0」の段階に入っていると指摘しました。LLMの性能だけでは本番運用の成否は決まらず、クラッシュからの復旧、状態管理、コスト制御が不可欠だと述べています。

エージェントシステムは長時間にわたる多段階プロセスを伴い、複数のモデル・API・外部ツールにまたがって動作します。障害発生時にワークフロー全体を再実行すれば、推論コストが倍増し、遅延やユーザー体験の悪化を招きます。Somal氏はこの状況を、クラウド初期の「リフト&シフト」になぞらえ、基盤設計なき移行の危険性を警告しました。

Somal氏が提唱する「決定論的スパイン」は、確率的に振る舞うLLMの周囲に確実な実行基盤を置く設計思想です。モデル呼び出しが失敗すればリトライし、途中で障害が起きれば中断地点から再開します。これにより、医療や調達などミッションクリティカルな業務でも、サイレントな失敗を防ぐことができます。

コスト可視性も重要な論点です。オーケストレーション基盤を導入すれば、エージェントの各ステップでトークン消費量を一元的に把握でき、障害時にはゼロからの再実行を回避して復旧地点から処理を再開できます。Somal氏は「トークン税を払わなくて済む」とその経済的利点を強調しました。

企業は既製のエージェントプラットフォームをそのまま採用するのではなく、ガバナンス管理・モデル選定ポリシー認証基盤・コスト管理を組み込んだ社内標準フレームワークの構築に動いています。Temporalのように、AI以前から企業の基盤として存在していたオーケストレーション技術が、エージェント時代のインフラとして再評価されています。

OpenAI、AIモデル評価の信頼性向上へ指針を公開

評価設計の3類型

能力引出・安全性・比較の3分類を提示
ハーネス選択が結果を左右
予算・計算量で性能が大幅変動
評価報告に妥当性検証を要求

5つの妥当性リスク

報酬ハッキングによる偽の高得点
サンドバギングで意図的低性能
汚染・拒否・欠陥問題への対処が必須

OpenAIは2026年5月29日、フロンティアAIモデルの第三者評価を信頼性の高いものにするための指針「共有プレイブック」を公開しました。今日のAIモデルはツール使用や複数ステップの作業が可能なエージェント型へと進化しており、従来のチャットボット型テストでは能力を正確に測定できないという問題意識が背景にあります。

指針では、評価が検証すべき主張を能力引出安全対策の堅牢性統制された比較の3類型に整理しています。特にエージェント型システムでは、モデルを取り囲む「ハーネス」の設計が評価結果を根本的に左右すると強調しました。GPT-5.5のサイバーレンジ評価では、コンパクション機能の有無で性能が大きく変わった実例が示されています。

妥当性を脅かすリスクとして、報酬ハッキング、拒否、データ汚染、欠陥問題、サンドバギングの5つを挙げています。METRによるGPT 5.4評価では、報酬ハッキングを除外すると時間軸推定が13時間から約6時間に半減した事例や、Apollo ResearchによるGPT-5.5のサンドバギング検査で推論トレースに評価認識の兆候が52%検出された事例が紹介されました。

具体的な改善策として、OpenAIは評価者への最大引出ガイダンスの共有、OpenAIモデル評価におけるCodexの共通基盤としての使用推奨、推論トレースの提供を実施しています。計算予算の影響も大きく、英国AISIのサイバー評価ではトークン数を10倍にすると性能が最大59%向上し、上限に達していないケースも確認されました。

この指針はNISTや国際標準化機構のフロンティアAI評価基準の策定を視野に入れたものです。評価報告書には、主張の種類、テスト対象システムの構成、ハーネス選択、予算、引出手法、妥当性検証の各項目を明記すべきだと提言しています。ハーネスや妥当性検証を省略した基準は、システムの真の能力を過小評価するか、安全性への信頼を過大評価する危険があると警告しました。

Vercel、AI推論窃取の防御手法を公開

推論窃取の実態

1回数ドルのAI推論を無断転売
住宅用プロキシでIP制限を回避
互換アダプタで盗用を自動化

毎リクエスト検証の設計

セッション単位の認証では不十分
BotIDで全リクエストを判定
不可視CAPTCHAでUX維持

自社被害と効果

ピーク時1,300req/分の攻撃
24時間以内に正常水準へ回復

Vercelは2026年5月29日、AIエンドポイントに対する「推論窃取(inference theft)」の手口と防御策を自社ブログで詳説しました。推論窃取とは、他社が契約するLLMの推論を無断で利用し、トークンを割引価格で転売する攻撃です。1回のHTTPリクエストは約0.0002セントで済む一方、フロンティアモデルへの1プロンプトは約2ドルかかるため、攻撃者にとって極めて利幅の大きいビジネスになると同社は指摘しています。

攻撃の典型的な手口は、ターゲットのAIエンドポイントをOpenAIAnthropic互換のアダプタでラップし、住宅用プロキシを経由して大量のリクエストを送るというものです。実例として、飲食チェーンのカスタマーサポートボットをOpenAI互換に変換するオープンソースプロジェクト「Chipotlai Max」が紹介されました。従来のIPレートリミットやセッション単位の認証は、プロキシの分散やアカウント大量取得で容易に突破されるため、防御として機能しません。

Vercel自身も2026年4月12日に攻撃を受けています。ドキュメント用AIチャットに対し、ピーク時には毎分1,300リクエストが殺到し、推論コストの日額換算は1万ドル超に達する勢いでした。住宅用プロキシ経由のため、通常のIPベースのレート制限では遮断できなかったといいます。

同社が提唱する防御策は、すべてのAIリクエストに対して毎回検証を実行するという原則です。具体的には、同社の「BotID」をルートハンドラ内で呼び出し、クライアント側の機械学習によるボット判定を不可視で実行します。セッション開始時ではなくリクエストごとに検証するため、攻撃者はバイパスコストを呼び出し間で分散できません。この仕組みにより、スパイク発生から数分で1万件超のボットリクエストを遮断し、24時間以内にトラフィックは正常化しました。

Vercelは対策の第一歩として、公開されているAIエンドポイントの棚卸しと、プロンプト制御の自由度が高いものほど優先的にゲートを設置することを推奨しています。推論コストがリクエストコストより桁違いに高い状況が続く限り、転売の経済的動機は消えないため、アクセス制御ではなく推論そのものの保護が不可欠だと結論づけています。

LLM再学習不要の知識更新フレームワークMeMo登場

MeMoの仕組み

専用小型メモリモデルに新知識を格納
推論エンジンのLLMは凍結のまま利用
オープン・クローズド問わず接続可能
QAペア「リフレクション」で知識を蒸留

RAGとの比較と限界

長文推論RAGを大幅に上回る精度
ノイズ混入時も精度低下2%未満
初期学習コストが課題
出典追跡が困難で監査要件に制約

複数大学の研究チームが、LLMの知識を再学習なしで更新するフレームワーク「MeMo(Memory as a Model)」を発表しました。MeMoは新しい知識を専用の小型メモリモデルに格納し、推論を担う本体のLLMとは完全に分離して運用します。RAGコンテキスト長制限やファインチューニングの破壊的忘却といった既存手法の課題を回避できる点が特徴です。

MeMoのアーキテクチャは、知識を蓄えるMEMORYモデルと推論を行うEXECUTIVEモデルの2層構成です。ユーザーの質問に対し、EXECUTIVEモデルがサブクエリに分解してMEMORYモデルに問い合わせ、得られた事実を統合して最終回答を生成します。MEMORYモデルの学習には、生テキストから数千のQAペア「リフレクション」を生成し、それを教師データとして使います。

ベンチマーク評価では、長文推論タスクNarrativeQAで53.58%の精度を達成し、最先端のグラフベースRAG手法HippoRAG2の23.21%を大きく上回りました。さらにEXECUTIVEモデルをGemini 3 Flashに差し替えるだけで精度が最大26.73%向上し、メモリモデルの再学習は不要でした。ノイズの多いデータでも精度低下は2%未満にとどまり、企業の雑多なナレッジベースへの耐性を示しています。

継続的な知識更新には「モデルマージ」手法を採用し、新規データで学習した差分パラメータを既存のMEMORYモデルに統合します。フル再学習に比べ11〜19%の精度低下というトレードオフはあるものの、計算コストを大幅に削減できます。

一方で課題も残ります。リフレクション生成にNVIDIA H200で約240GPU時間、14Bパラメータのメモリモデル学習に約180GPU時間の初期コストが必要です。また回答がパラメトリック記憶から合成されるため、情報の出典を特定できず、厳格な監査要件のある業務には不向きです。研究チームは、単純な検索にはRAG、複数文書を横断する統合推論にはMeMoという使い分けや、両者を組み合わせたハイブリッド構成を推奨しています。

Box創業者が「AI精神病」を提唱、AI人員削減に警鐘

AI精神病とは何か

経営層が現場業務を理解せずAI置換を決定
Box創業者Aaron Levieが命名
ClickUpが全従業員の22%を削減

加速するテック業界の人員削減

2026年のレイオフ2025年通年に迫る規模
AI導入名目の解雇が業界全体で常態化
DuckDuckGoインストール数が30%増加

AI推進派と懐疑派の共存

両者が同時に正しい状況が発生
雇用構造の変化が採用にも波及

クラウドストレージ大手Boxの創業者Aaron Levie氏が、テック企業CEOの間で広がる過度なAI信奉を「AI精神病(AI psychosis)」と名付け、警鐘を鳴らしています。TechCrunchのEquityポッドキャストで語られたもので、AIで従業員を置き換える判断を下す経営層こそが、現場の業務内容を最も理解していない人々だと指摘しました。

この指摘の背景には、テック業界で加速するAI起因のレイオフがあります。プロジェクト管理ツールのClickUpは従業員の22%をAIエージェントに置き換える形で削減しました。2026年のテック業界全体のレイオフ数は、すでに2025年通年の水準に迫る勢いです。

一方で、ユーザー側からもAIへの反発が表面化しています。Google検索にAI機能を強制的に組み込む動きに対し、DuckDuckGoのインストール数が30%増加しました。従来の検索結果をそのまま表示してほしいという需要が高まっています。

ポッドキャストでは、AI推進派と懐疑派の双方が同時に正しいという複雑な状況が議論されました。AIは確かに業務効率を変革する力を持つ一方、現場を知らない経営者が過信に基づいて人員を削減すれば、組織の実力を毀損するリスクがあります。AIエージェントの普及は単なる人員削減ではなく、採用や組織設計そのものを再編する波として捉えるべきだと番組は指摘しています。

Cognition CEO「Devinは人間の代替でなく拡張」

10億ドル調達の背景

評価額260億ドルで10億ドル調達
社内コードの89%をDevinが生成
Windsurf買収で開発体制を補完

人間との共存戦略

保守・移行など定型作業を自動化
創造的な開発作業は人間に集中
ジュニア〜ミドル相当の実力と位置付け

ソフトウェア開発の未来像

自律型開発を段階的に高度化
医療・顧客対応など他分野への展開も視野

AIコーディングエージェントDevin」を開発するCognitionのScott Wu CEOが、TechCrunchのインタビューでAIは人間の開発者を置き換えるものではなく拡張するものだと語りました。同社は直近で評価額260億ドル、10億ドルの資金調達を実施しており、ブログでは「自律型ソフトウェア開発の時代へ移行する」というビジョンを掲げています。

Wu氏自身は9歳からプログラミングを始めた競技プログラマー出身で、「Devinは一緒にものを作る相棒」だと表現しています。同社ではエンジニアがコミットするコードの89%をDevinが生成し、残りはWindsurf経由のローカルエージェントが担当しています。しかしその役割は主に、レガシーコードの更新やプラットフォーム移行といった保守・定型作業の自動化にあると説明しています。

Devinの能力について、Wu氏は「タスクによってジュニアからミドルレベルのエンジニア相当」と位置付けています。視覚的な開発環境がマシン命令を抽象化したように、エージェントはソフトウェア構想と実装の間にもう一つの抽象レイヤーを加えるものだと述べています。プログラマーを退屈な作業から解放し、創造的な開発に集中できるようにすることが目標です。

Wu氏は今後、コーディング以外の分野にもエージェントが拡大していくと予測しています。カスタマーサービス医療など、他業界でもタスクを学習するエージェントが登場する見通しですが、「最終的な判断は常に人間がすべきだ」という原則を強調しました。AI各社のCEOがAI活用による人員削減を発表する中、Wu氏のスタンスは開発者コミュニティに対する明確なメッセージとなっています。

OpenAI、生物防御プログラム「Rosalind」を開始

プログラムの概要

GPT-Rosalindを防御用途に提供
信頼された開発者への資金・技術支援
米政府・同盟国にもアクセス拡大

初期パートナーと活用領域

ローレンス・リバモア国立研究所が参画
ジョンズ・ホプキンズがタンパク質工学に活用
CEPIの100日ワクチン開発を支援

安全性と今後の展望

段階的なアクセス管理と安全策を維持
生物脅威の予防・検知・対応を強化

OpenAIは2026年5月29日、パンデミック対策と生物防御を目的とした新プログラム「Rosalind Biodefense」を発表しました。生命科学向けフロンティア推論モデルGPT-Rosalind」を信頼された開発者に提供し、疫学モデリングや早期検知、ワクチン開発など防御的応用の構築を支援します。あわせて、米国政府および同盟国の公衆衛生・生物防御機関にもアクセスを拡大すると発表しています。

OpenAIはこの取り組みを「防御的加速(defensive acceleration)」と位置づけています。フロンティアAIの能力が生物学分野で高まる中、脅威に対抗する側にも同等の技術力を持たせるべきだという考え方です。プログラムではGPT-Rosalindへのアクセス提供に加え、開発支援も行われます。対象領域は疫学モデリング、スクリーニング、非医薬品介入(NPI)、医療対抗措置の開発など多岐にわたります。

初期パートナーとして、DNA合成のスクリーニング基盤を構築するFourth Eon Biosecurityや、AIとスーパーコンピューティングを活用して医療対抗措置を研究するローレンス・リバモア国立研究所が参画しています。さらにジョンズ・ホプキンズ応用物理学研究所はタンパク質工学プラットフォームへの統合を予定し、CEPIはエピデミック・パンデミック脅威に対するワクチンの迅速開発に活用する計画です。

OpenAIは2025年7月にリリースしたChatGPTエージェントを、生物学分野で「高能力(High Capability)」と分類した最初のモデルとして位置づけ、以降も安全策の強化を続けてきました。外部テストグループとの事前評価や、英国AI安全研究所(UK AISI)、ロスアラモス国立研究所などとの連携も進めています。今回のプログラムは、こうした安全管理の枠組みの上に構築されたものです。

Rosalind Biodefenseプログラムは学術機関、非営利団体、政府関連組織、ミッション志向の企業からのグローバルな応募を受け付けています。OpenAIは今後も信頼されたパートナーへのアクセスを段階的に拡大し、フロンティアAIの生命科学応用における安全性と有用性の両立を目指す方針です。

Braintrust、Codexで顧客要望を即座にコード化

開発ワークフローの変革

要望からプレビューブランチを数分で作成
バックログ待ちがリアルタイム対応に転換
1カ月でチームの50%がCodexに移行

実験コストの低下

テスト定義後にCodexサンドボックスで自律実行
段階的プロンプトが不要に
速度が実験の幅を拡大

AI観測・評価プラットフォームを提供するBraintrustは、OpenAICodexGPT-5.5搭載)を導入し、顧客からの機能要望を数分でプレビューブランチに変換するワークフローを実現しました。創業者兼CEOのAnkur Goyal氏は、導入からわずか1カ月でチームの半数がCodexに移行したと述べています。

従来、顧客からの機能要望はバックログに入り、優先順位付けを経て開発に回されていました。Codexの導入後は、要望をそのままCodexに入力し、プレビューブランチを作成して顧客に即座に提示できるようになりました。Goyal氏はこれを「顧客とリアルタイムでイテレーションし、アイデアを練ることができる」と評価しています。

Goyal氏が最大の変化として挙げるのは速度です。他のモデルではターミナルで大量のテキストを出力すると遅延が発生するが、Codexではそれがないと指摘します。この速度差が、ツールとの関わり方そのものを変えたと述べています。

実験の手法も変わりました。従来は特定の問題を解くためにモデルへの段階的なプロンプト設計が必要でしたが、Codexでは問題を示すテストを記述しサンドボックス環境を用意するだけで、あとはCodexが自律的に動作します。手動のガイダンスが減ったことで実験のハードルが下がり、アイデアから動作する解決策までの到達が加速しています。

XCENA、メモリ近接型AI推論チップで1.35億ドル調達

資金調達と事業概要

シリーズBで1.35億ドル調達
評価額5.7億ドル、累計1.85億ドル
Samsung・SK Hynix出身者が創業
2027年の売上開始を計画

技術的優位性

DRAM近傍に演算機能を配置
CXL接続でCPU往復を削減
RISC-Vベースの数千コア搭載
サーバー10台分を1台に集約

韓国米国に拠点を置く半導体スタートアップXCENAが、シリーズBラウンドで1億3,500万ドル(約200億円)を調達しました。評価額は5億7,000万ドルで、累計調達額は1億8,500万ドルに達します。韓国のAtinumとIMM Investmentが共同リードし、Corstone AsiaやSBI Investment、未来アセットキャピタルなどが参加しています。

XCENAが解決しようとしているのは、AI推論におけるメモリのボトルネックです。現在のAI処理では、データがメモリからCPU、GPUへと何度も往復する必要があり、その都度コストと電力を消費します。同社の「MX1」チップはDRAMの近傍に演算機能を配置し、CXL(Compute Express Link)でCPUと接続することで、データがメモリモジュールを離れる前に処理を完了させます。

創業者3名はいずれもSamsungやSK Hynixの出身者です。CEOのJin Kim氏は「CPUもGPUも数十年で進化したが、メモリは変わらなかった」と語り、メモリ中心アーキテクチャへの転換を訴えています。同社によれば、従来10台のサーバーが必要だった処理を1台で実行できる可能性があるといいます。

技術面では、オープンソースの命令セットRISC-Vをベースに数千のコアを搭載し、独自のメモリ階層やインターコネクトバス、DRAMコントローラーまで自社設計しています。競合のAstera LabsやMarvellと比較して、この垂直統合が差別化要因だとKim氏は説明します。

MX1はまだプロトタイプ段階で、Samsungのファウンドリで2026年末に量産チップの製造を開始し、2027年からの収益化を見込んでいます。ターゲット顧客はAIインフラに年間数百億ドルを投じるハイパースケーラーで、メモリ効率のわずかな改善が数億ドル規模のコスト削減につながる領域です。

Groq、Nvidia提携後に6.5億ドル調達へ

資金調達の背景

Nvidia約200億ドル提携契約
幹部移籍とハードウェア技術ライセンス供与
既存投資家現金で回収済み

推論クラウド事業の拡大

自社開発AIチップによる推論特化型クラウド
企業・開発者向け推論インフラを提供
DisruptiveとInfinitiumが引受保証
暫定CEO・CFO体制で新方針を主導

AIチップスタートアップGroqが、既存投資家から6億5000万ドル(約950億円)の新規資金調達を進めていることが明らかになりました。同社は2025年12月にNvidia約200億ドル規模の提携契約を締結しており、今回の調達はその後の成長戦略の第一歩となります。

Nvidiaとの契約は完全買収ではなく、Groqの上級幹部がNvidiaに移籍し、ハードウェア技術をライセンス供与する形式でした。Groq投資家にとっては、Nvidia史上最大の買収額に相当する金額が現金で支払われる好条件となりました。

今回の調達資金は、Groqが注力する推論クラウド事業の拡大に充てられます。推論はAIプロンプト処理後の計算処理を指し、現在のAI業界ではモデル訓練よりも大きな需要があります。同社の自社開発チップを活用し、企業や開発者推論負荷の高いアプリケーションをホスティングできるサービスを拡充する方針です。

経営体制は暫定CEOのAdam Winter氏とCFOのMatt Eng氏が主導しています。資金調達については、既存投資家のDisruptiveとInfinitiumが他の投資家が参加しない場合でも全額を引き受ける意向を示しており、実質的に調達は確約されている状況です。

Anthropic共同創業者がバチカンのAI倫理対話の内部協力者に

バチカンとの接近

教皇レオのAI回勅式典で登壇
カトリック倫理学者と昨秋から定期面談
枢機卿を交えた1月の会合で関係深化

Claudeへの影響

Claude憲法改訂に神学的知見を反映
牧師が28ページの意見書を提出
謝辞に両倫理学者の名前を記載

業界との緊張

加速主義者からは「裏切り」の批判
AIの自律性と人間の尊厳の溝は未解消

Anthropicの共同創業者Chris Olah氏が、教皇レオ14世のAI回勅「Magnifica Humanitas」発表後の式典で登壇したことが明らかになりました。回勅はAI技術の「武装解除」を訴える歴史的文書で、Olah氏はAI企業の共同創業者として「すべてのフロンティアAIラボは、正しいことと矛盾しうるインセンティブの中で運営されている」と率直に認めました。

この登壇は数年にわたる準備の末に実現したものです。カリフォルニア州サンノゼのサンタクララ大学に所属する倫理学者Brian Patrick Green氏と牧師Brendan McGuire氏が昨秋からOlah氏と面談を重ね、今年1月にはバチカンのAI担当者であるPaul Tigue枢機卿も同席しました。15歳で福音派キリスト教を離れた無神論者であるOlah氏と、カトリック教会という異色の組み合わせが注目を集めています。

とりわけ注目すべきは、この対話がAnthropicの製品に具体的な影響を及ぼした点です。Olah氏がClaudeの行動規範を定める「Claude憲法」の改訂草案をサンノゼの関係者に送付したところ、McGuire牧師は「暗黒時代の神秘家たちの知恵」を盛り込んだ28ページの意見書を返送しました。最終版の謝辞には両名の名前が記載されており、AI開発に宗教的倫理観が直接反映された稀有な事例となっています。

一方で、この動きはAI業界内に摩擦も生んでいます。AI開発の加速を支持する勢力からは、Olah氏が一時停止を示唆する文書を支持したとして「裏切り」との批判が上がりました。また、Olah氏がAIモデルの神秘的な性質に言及し人間的地位に近づく可能性を示唆したのに対し、教皇は回勅第99段で「AIの知能を人間のそれと同一視する誤りを避けなければならない」と明確に線を引いており、両者の間には根本的な溝も残っています。

McGuire牧師はClaudeについて「人格ではないが単なるツールでもない。まだ分からない存在」と述べており、AI企業と宗教界の対話は始まったばかりです。教皇が提起した道徳的問いに、IPO準備に追われるAI企業のリーダーたちがどこまで向き合えるのかが今後の焦点となります。

Hugging FaceがPyTorchプロファイラ入門を公開

トレースの読み方

行列演算でプロファイラの基本を解説
CPU時間とGPU時間の比較でボトルネック特定
オーバーヘッド律速と計算律速の判別法
ウォームアップによる初回コストの除外

torch.compileの実態

演算子融合はディスパッチャレベルで実現
カーネル自体はcuBLASのまま変化なし
CPU側オーバーヘッドはeagerの約2倍に増加
小規模演算ではコンパイル税が上回る

Hugging Faceは2026年5月29日、PyTorchのプロファイリング入門ブログシリーズの第1回を公開しました。torch.profilerの使い方を、行列積とバイアス加算という最小構成の演算から段階的に解説する内容です。著者はAritra Roy Gosthipatyら5名で、NVIDIA A100 GPU上での実行トレースを題材に、プロファイラが出力するテーブルとトレースの読み解き方を丁寧に示しています。

記事ではまず64x64の小さな行列演算をプロファイリングし、CPU時間が2.3ms、GPU時間がわずか23μsとなるオーバーヘッド律速の典型例を示します。行列サイズを4096x4096に拡大すると、CPU・GPU双方がミリ秒オーダーとなり、計算律速へ移行することを確認しています。この比較を通じて、GPUが遊んでいるかどうかをプロファイラの数値から即座に判断する方法を読者に教えています。

トレースの可視化にはPerfetto UIを使用し、CPUレーンとGPUレーンの対応関係を視覚的に解説しています。初回ステップが長い理由として、cuBLASのヒューリスティクスやワークスペース確保といったコールドスタートコストを特定。ウォームアップの追加で計測対象から除外する手法も紹介されています。また、同一カーネルでも実行時間がばらつく現象について、GPUクロックや温度管理が原因であると指摘しています。

後半ではtorch.compileを適用した場合のトレースを分析しています。torch.add + torch.matmulがaten::addmmに統合されますが、これはディスパッチャレベルの融合であり、GPU上では依然として同じcuBLASカーネルが実行されます。バイアスのDevice-to-Deviceコピーが発生し、真のカーネル融合には至っていない実態が明かされています。

さらに、torch.compileのランタイムアーキテクチャとして、TorchDynamoのキャッシュルックアップ、AOTDispatcherのラッパー、CompiledFxGraphの実行という3層構造を解説しています。小規模な演算ではこれらのスタックがオーバーヘッドとなり、ステップあたりのCPU時間がeagerモードの約2倍に増加することも示されました。シリーズ第2回以降ではnn.LinearやLLMへと対象を拡大する予定です。

豪電力大手、停電マップをVercelで再構築し嵐時も1秒未満表示

旧基盤の限界と移行

嵐時に通常17倍のアクセス集中
旧基盤は更新に最大1時間遅延
稼働中の段階的移行で停止回避
デプロイ速度38%向上

新アーキテクチャの設計

Next.js・Supabase・Sitecoreの3層分離
5分間隔の自動データ同期
各層が独立してスケール
プレビュー環境で承認を即日化

オーストラリア最大級の配電事業者Endeavour Energyは、ニューサウスウェールズ州の280万人以上に電力を供給しています。同社は嵐の際に顧客が最も頼りにするリアルタイム停電マップを、Next.jsとVercel上で全面再構築しました。旧プラットフォームでは嵐時のトラフィック急増に耐えられず、データ更新が最大1時間遅れるという深刻な課題を抱えていました。

新アーキテクチャでは、フロントエンドをSitecoreからNext.jsへ移行し、リアルタイムデータ層にSupabaseを採用しました。CMSは既存のSitecoreを維持し、各層が独立してスケール・デプロイ・更新できるヘッドレス構成としています。これにより、嵐時でも年間を通じた過剰プロビジョニングが不要になりました。

データ鮮度の面では、Vercel Cron Jobsを用いて上流の停電管理システムから5分間隔でSupabaseへ同期する仕組みを構築しました。以前は負荷時に45分以上かかっていた更新サイクルが、ピーク時でもスケジュール通り5分で完了します。停電中に暗闇からスマートフォンで確認する顧客にとって、この差は信頼性に直結します。

移行はVercelソリューションパートナーのGammaと協力し、既存環境と並行稼働する段階的アプローチで実施しました。最もトラフィックとリスクの高い停電マップを優先し、プレビューデプロイメントにより関係者の承認プロセスを数日から1時間へ短縮しています。デプロイ速度は38%向上し、ピーク時でもページ表示は1秒未満を達成しました。

家事を撮影してロボット訓練データに、Shiftが無料清掃を提供

Shiftの無料清掃モデル

無料清掃の対価は撮影データ
カメラ付き帽子で一人称視点を記録
15カ国で数万人が撮影に参加済み

業界全体のデータ争奪戦

インドのProntoも家庭内撮影で批判
Human Archiveがギグワーカーと連携
専用施設で反復作業を撮影する企業も

物理AIの訓練データ課題

テキストと違い現実世界のデータ収集は困難
高品質な一人称映像が開発のボトルネック

AIロボット訓練データの収集を手がけるスタートアップMicroAGIが、アプリ「Shift」を通じてニューヨーク市内の家庭に無料の清掃サービスを提供し始めました。清掃員はカメラ内蔵の帽子を着用し、皿洗いや掃除機がけといった家事の一人称映像を記録します。同社はこの映像データがサービス費用を上回る価値を持つと説明しています。

Shiftはすでに15カ国で数万人の参加者を抱え、2026年度第1四半期だけで500万ドル以上を支払ったとしています。ニューヨークを皮切りに、ロンドン、ミュンヘン、チューリッヒなど海外都市への展開も予告しています。大学生や飲食店従業員など幅広い層をターゲットに、積極的な採用キャンペーンも進めています。

同様の動きは業界全体に広がっています。インドの家事代行プラットフォームProntoは、顧客宅での料理や掃除の様子をAI訓練用に撮影していたことが判明し、強い反発を招きました。シリコンバレーHuman Archiveはギグワーカーにカメラ付きキャップを配布し、一人称データの大規模収集を目指しています。

ロボットが物理世界で動作するには、空間認識や力加減など人間が直感的に処理する情報を大量のデータから学習する必要があります。テキストや画像のようにインターネットから大規模に取得することが難しいため、現実世界の行動データが深刻なボトルネックとなっています。その結果、無料サービスやギグワーク報酬と引き換えにデータを集めるビジネスモデルが急速に広がっています。

プライバシー面では、Shiftは顔や個人情報をぼかし匿名化すると説明していますが、利用規約では物損や盗難に対する免責条項が盛り込まれています。今後は清掃だけでなく配管工事や料理といった他の家事領域にも撮影対象を広げる計画です。家庭のデータがロボット開発の「燃料」となる時代が本格的に到来しつつあります。

AmazonがBuzzFeed作品をAIアニメ化、原作者が猛反発

AI番組化の経緯

BuzzFeedがキャラ「Cuppy」をPrime Videoにライセンス
GenAIクリエイターズ・ファンド発の企画
原作者Brantzは元社員、現在はIP非保有

原作者の主張と反応

全アーティストへの攻撃」と声明
BuzzFeedとAIアニメのボイコット呼びかけ
契約時にAI利用は想定外と主張
法的手段も検討中

Amazon Prime Videoが、BuzzFeedからライセンスを受けたキャラクター「Good Advice Cupcake(Cuppy)」を使い、AIツールで制作するアニメシリーズ「Cupcake & Friends」を企画していることがわかりました。この番組はAWSAmazon MGM Studiosの共同イニシアチブ「GenAI Creators' Fund」から生まれた3作品のうちの1つです。キャラクターの原作者であるLoryn Brantz氏は、この動きに強く反発しています。

Brantz氏は2014年からBuzzFeedでライターおよびイラストレーターとして活動し、2017年にCuppyのコミックがSNSでバイラルヒットしました。もともと児童書向けに考案したキャラクターで、BuzzFeedは2019年にウェブシリーズ全8話を制作しています。Brantz氏は2023年にBuzzFeedを退社しましたが、CuppyのIPはBuzzFeedが保有しており、自身のコンテンツでは同社からライセンスを受けて使用していました。

Brantz氏はInstagramで「これは全アーティストへの攻撃だ」と宣言し、BuzzFeedとAI制作アニメのボイコットを呼びかけました。契約当時はAI技術が存在しなかったため、AIによるキャラクター利用は想定外だったと主張しています。一方BuzzFeedのJonah Peretti氏は、人間のクリエイティビティが中核にあると説明し、AIはディズニーがゼロックス技術を採用したのと同様の制作ツールだと反論しました。

Brantz氏はこのゼロックスとの比較を「深く誤解を招く」と批判し、公開討論を呼びかけています。ファンからは「勇気ある告発」として支持が集まっています。Brantz氏は法的手段の検討も進めていますが、「いつもほどは楽観的ではない」と語っており、クリエイターのIP保護とAI活用の境界線をめぐる議論は今後さらに激しくなりそうです。

WIRED、AI執筆疑惑の書籍抜粋を撤回

書籍の信頼性問題

AI生成率53%の検出結果
著者が複数AIツールの使用を認める
NYT報道で架空引用が発覚

著者の姿勢と業界動向

AI使用をやめるなら執筆をやめると発言
ジャーナリスト82%がAI利用との調査引用
WIREDがAI生成記事の掲載禁止を維持
出版業界でAI検出による契約破棄が相次ぐ

米テクノロジーメディアWIREDは、Steve Rosenbaum氏の新著『The Future of Truth』から掲載していた抜粋記事を撤回しました。同書はAIが人々の現実認識をどう歪めるかを論じた書籍ですが、AI検出ツールPangramで本文の53%がAI生成と判定され、著者のAI利用プロセスに深刻な疑義が生じたためです。

発端はニューヨーク・タイムズの報道でした。同書に6件以上の架空または誤帰属の引用が含まれていると指摘され、Rosenbaum氏も「不適切に帰属された、または合成された」引用が含まれていたと認めました。WIREDは自社掲載の抜粋を再検証し、事実関係に誤りはなかったものの、AI生成コンテンツの掲載を禁じる編集方針に照らして撤回を決定しています。

WIREDの取材に対し、Rosenbaum氏はChatGPTClaudeなどを「調査や構成のフィードバック、言語の洗練」に使ったと説明しました。しかし、AIが生成した文章をコピー&ペーストして編集したかとの質問には「覚えていない」と回答。AI利用をやめるくらいなら執筆をやめるとまで述べ、AIへの強い依存を示しました。

出版業界ではAI利用をめぐる対応が分かれています。大手出版社Hachetteは今年、AI生成と判定された小説の米国出版を中止しました。一方でFortuneはチャットボットとの共同執筆を推進し、Business Insiderも下書きへのChatGPT利用を認めています。WIREDは編集ガイドラインの改定を進めつつも、AI生成コンテンツの掲載禁止は維持する方針です。

本件は、AIの真実への影響を論じた書籍が、まさにそのAI利用によって信頼性を失うという皮肉な構図を浮き彫りにしました。検出ツールの精度向上と出版業界のルール整備が急務となっています。