G7首脳が懸念、米AIの遮断リスク

首脳の懸念

マクロン氏の遮断警告
モディ氏も無制限アクセス要求
米企業自身への打撃も指摘

発端と対応

米政府がAnthropic輸出停止
Mythos・Fable5が凍結
「信頼できる相手」枠組み協議

6月17日に開かれたG7首脳会議で、フランスのマクロン大統領やインドのモディ首相らが、米国が自国の最先端AIモデルへのアクセスを突然遮断できるリスクに懸念を示しました。昼食会にはAnthropicのアモデイCEOやOpenAIのアルトマンCEO、トランプ大統領も同席していました。マクロン氏は、米国が「ある日突然スイッチを切れる」状態は欧州の顧客経済だけでなくAI企業自身も傷つけると警告しました。

今回の発言は、トランプ政権が安全保障を理由にAnthropicの最新モデルMythosとFable5の輸出を差し止めた数日後に出ました。AmazonがホワイトハウスにAnthropicの安全機構を回避できる可能性を指摘したことが発端でした。ただサイバーセキュリティ専門家は、政府が挙げた能力はOpenAIなど自由に使えるモデルにも存在すると反論しており、それでもAnthropicのモデルは凍結されたままです。

この一件は、多くの国際企業が抱える根深いリスクを浮き彫りにしました。米国のAI基盤の上に事業を築く企業や政府は、理由を知らされないまま一夜にしてアクセスを奪われる可能性と向き合わざるを得ません。モディ首相も、重要インフラを守るため民主主義国は最先端モデルへの自由なアクセスを持つべきだと述べ、米国の措置への懸念を表明しました。

カナダの企業向けAI企業CohereのゴメスCEOは、今回の制限は「少数の巨大テック企業に依存し続けることが危険だと示した」と指摘しました。同氏はデジタル主権は単なる市場競争の問題ではなく、経済安全保障と国家主権を左右する基盤技術を誰が握るかの問題だと強調しました。経営者にとっては、調達先のAIが事業継続リスクそのものになり得る局面です。

G7首脳は、米国の制限を迂回し非米国の国々にAnthropicOpenAIの先進モデルへのアクセスを与える「信頼できる相手」枠組みの創設も協議しました。中国などへの防御強化に使うことを条件に、国も企業も対象となる構想です。ただパリやバンガロールの新興企業まで救えるかは不透明で、欧州などが進めるAI主権の主張も、米国モデルが性能で先行し続ける中で難しさを増しています。

米政権、Anthropicに脱獄完全防止を要求

輸出規制で停止

輸出管理を理由にFable 5とMythos 5を停止
外国籍ユーザー全員のアクセス遮断
AIモデルへの初の輸出規制適用

脱獄封じの要求

政府が脱獄対策の実施を再開条件に
NSAがガードレール無効化を確認
全モデルの継続的検査を要求

統治の不安定さ

専門家完全な脱獄防止は不可能と指摘
場当たり的なAI統治への懸念

トランプ政権は2026年6月、国家安全保障を理由とした輸出管理措置でAnthropicに最新AIモデルFable 5とMythos 5の提供停止を命じました。同社は米国内の利用者や自社従業員を含む全ユーザーのアクセスを遮断せざるを得なくなり、再開を巡る交渉が続いています。政権が懸念するのは、安全装置を回避する「脱獄」の手口でした。

政権は、Anthropicがモデルを再開したいなら脆弱性に実際に対処する必要があると通告しています。同社は脱獄の影響は小さいと反論し、商務省などとの技術協議でもその立場を繰り返しました。しかし当局は議論の段階を過ぎたとの姿勢で、国家安全保障局(NSA)がFable 5のガードレールを無効化できると結論づけたと説明しています。

政権はこの問題をAnthropic側が解決すべき課題と位置づけ、Fable 5に限らず全ての最先端モデルについて継続的に脆弱性を検査し、政府へ報告するよう求めています。背景には、市場に出る全モデルの脱獄を当局が追い切る人員も余力もないという事情があります。

ただ、Anthropicがどうやって脱獄を防げばよいのかは依然として不透明です。独立系のセキュリティ専門家の間では、ガードレールは一時しのぎにすぎず、熟練した利用者や将来のAIが必ず制約を回避するとの見方が強まっています。つまり、ホワイトハウスが求める水準は技術的に達成できない可能性が高いのです。

今回の措置は前例がないと専門家は指摘します。AIモデルは重みやソースコードが渡されるわけではなく、利用者は応答を受け取るだけのため、従来の輸出管理の枠組みに収まりません。ジョージタウン大の研究者はAIモデルへのアクセス制御に輸出管理が使われた初の事例と評しました。

一連の経緯は、連邦レベルのAI規制法が存在しない中で、統治が政権の場当たり的な判断に委ねられている現状を浮き彫りにしました。Anthropicと政権の関係悪化や、同社が政治的に敵対勢力とみなされている点も影を落としています。専門家は、説明なき介入が続けば米国がAI競争で後れを取りかねないと警告しています。

GPT-5.4が創薬反応の収率を自律改善

実験の成果

難反応Chan-Lamの収率向上
添加剤TEMPOを自ら発見
基質8割超で収率改善
平均収率16.6%から25.2%へ
計1万80反応を自動実行

意義と限界

創薬合成律速を緩和
人間関与の準自律研究

OpenAIは2026年6月17日、創薬向けの有機化学反応をAIが自律的に改善した成果を発表しました。同社のGPT-5.4と新興企業Molecule.oneの自律実験システム「Maria」を連携させ、炭素-窒素結合をつくるChan-Lamカップリングの収率を向上させたものです。約3カ月で1万80回の反応を実行し、人間の化学者が監督する準自律の研究ループを実証しました。

今回AIが取り組んだのは、第一級スルホンアミドとボロン酸を結びつける難しい反応でした。GPT-5.4は文献を読み込んだうえで、穏やかな酸化剤であるTEMPOを添加剤として使うという意外な仮説を自ら提案しました。化学者がこの提案を「驚きがあり興味深い」と評価し、4つの候補の一つとして実験に選びました。

最適化した条件では、ボロン酸の88%、スルホンアミドの83%で収率が改善しました。平均収率は16.6%から25.2%へ上がり、収率30%を超える反応の割合も15.6%から37.5%に増えています。さらにTEMPOは安価な類似品4-ヒドロキシTEMPOに置き換えても性能をほぼ維持できることがわかりました。

微小スケールの結果は、人間の化学者が手作業で行うベンチスケール実験でも再現されました。14組の基質ペアのうち11組で収率が上がり、8組では2倍以上の改善を確認しています。外部の化学者4人が査読し、結果は新規で共有に値すると評価しました。スルホンアミドは抗がん剤や抗菌薬に広く使われる重要な構造です。

なぜこの成果が重要なのでしょうか。創薬では合成が大きな律速段階となり、科学者は作れる分子しか試せないという制約を抱えています。歴史的に低収率だった反応を信頼できるものにすれば、探索できる分子の幅が広がります。1万回規模の実験は、少数例では見逃される効果や限界を見極めるうえでも役立ちました。

ただしOpenAIは、これがAIによる研究の完全自律を示すものではないと釘を刺しています。仮説の提案や設計はモデルが担いましたが、提案の選別や実験計画の修正、手作業での再現は人間が行いました。同社は毒物や化学兵器を扱わない正当な創薬課題に範囲を限定し、安全対策と専門家の監督を組み合わせる方針を強調しています。

NEA幹部、AI投資効果の見極め本格化と指摘

コスト膨張の反動

過剰利用トークンマキシングの反動
Uberが年間AI予算を数カ月で消化
Claudeライセンス削減の動き

投資効果の追跡

AI支出のROI計測が焦点
効果追跡を担う新興企業の台頭
現場常駐エンジニアが導入の起点

市場と今後

複数モデルの使い分けが主流
今年のAI新規上場と個人エージェント注視

ベンチャーキャピタルNEAのパートナー、ティファニー・ラック氏が6月17日、TechCrunchのポッドキャスト「Equity」に出演し、企業のAI投資効果(ROI)の見極めが本格化していると指摘しました。今年前半に流行したAI利用の極大化「トークンマキシング」の反動でコスト負担が表面化し、支出をどう評価するかが新たな論点になっていると語りました。

象徴的なのが支出の急増です。Uberは年間のAI予算を数カ月で使い切ったと報じられ、一部企業は組織の一部でClaudeのライセンスを削減し、Metaは社内の利用ランキングを廃止しました。利用を煽る段階から、費用対効果を冷静に問う段階へと空気が変わりつつあります。

ラック氏はこのROIの計測こそ商機だと見ます。企業のAI支出に対する効果を追跡する新興企業が次々と登場しており、現場に常駐する「フォワード・デプロイド・エンジニア」がAI導入を社内に広げるトロイの木馬になっていると説明しました。

モデル選びの潮流も変化しています。企業は単一の提供元に固定せず、用途に応じて複数のモデルを使い分ける動きを強めているといいます。ラック氏は価値がモデル層だけでなく、AIスタックのあらゆる階層で生まれていると見ています。

今後の焦点として、ラック氏は今年のAIの新規株式公開(IPO)の行方や、消費者向けの個人エージェントの可能性に注目していると述べました。電子商取引の普及を説いて回ったキャリアを持つ同氏は、AIにおける消費者体験の「マジックモーメント」に期待を寄せています。

NVIDIA、AIエージェントがロボットを自律訓練

自律訓練の仕組み

結束バンド切断とGPU装着を習得
成果上がる変更のみ保持し反復改善

ENPIREの構成

NVIDIA GEARとCMU・UCバークレーが開発
リセット・検証・評価・失敗分析の4機能
複数ロボットの並列評価

公開と展望

全要素のオープンソース化を表明

NVIDIAのGEAR研究所は2026年6月、AIコーディングエージェントロボットの訓練を自律的に指揮する新たな枠組み「ENPIRE」を発表しました。カーネギーメロン大学とカリフォルニア大学バークレー校が共同開発したこの仕組みでは、エージェントが訓練手順を自ら考案し、ロボット結束バンドの切断やマザーボードへのGPU装着といった精密な作業を習得させました。

ENPIREは、AIモデルにツール利用や記憶・制約・フィードバックの機能を与える「エージェントハーネス」と呼ばれるソフトウェアです。具体的には4つのモジュールで構成され、作業の自動リセットと検証、ロボットの行動指針となる方策の改良、複数の実機を並列で動かす評価、そしてログ解析や論文の取り込みによる失敗対応を担います。

訓練は人手を介さず反復します。エージェントは独自のアルゴリズムを考えて実機で試し、成功率を高めた変更だけを残すサイクルを自己主導で繰り返します。NVIDIAでAI担当ディレクターを務めるジム・ファン氏は「研究所の一部が夜通し自己改善し、朝に報告書を読むだけだ」とLinkedInに投稿しました。

検証には3社のエージェントが使われました。OpenAIGPT-5.5を用いたCodexAnthropicOpus 4.7を用いたClaude Code、Moonshot AIのKimi K2.6を用いたKimi Codeです。チームを組んだエージェントが互いに異なる訓練手法を独立して編み出し、実験で比較しました。

ファン氏はすべてをオープンソース化する方針を示し、誰もが自宅で「自走するロボット研究所」を持てるようにすると述べました。技術的な詳細は6月16日に公開された研究論文にまとめられています。AIが自らハードウェアの訓練を回す時代が、研究現場で現実味を帯び始めています。

Z AI、長時間作業向けGLM-5.2を公開

モデルの特徴

MITライセンスで完全オープン
100万トークンの長文脈対応
思考の努力度を切替可能
パラメータ規模は753B

性能と用途

コーディングオープン最強
Opus 4.8に肉薄する精度
Claude Code等から利用可能

中国のZ AIは2026年6月17日、長時間タスク向けに設計した大規模言語モデルGLM-5.2を公開しました。最大100万トークンの文脈長と、地域制限のないMITライセンスでの完全オープン提供が柱です。モデルの重みはHuggingFaceとModelScopeで配布され、coding agentとして実用できる点を前面に打ち出しました。

最大の狙いは、単にトークン数を増やすのではなく、長く乱雑なコーディング作業の軌跡でも品質を保つことにあります。同社は実装やデバッグ、性能最適化といった長時間タスク向けの訓練を大幅に拡充しました。その成果として、数時間規模の技術プロジェクトを評価するFrontierSWEなどの長期ベンチマークで、いずれもオープンソース首位を確保しています。

標準的なコーディング指標でも前世代から大きく前進しました。Terminal-Bench 2.1では前版の63.5から81.0へ、SWE-bench Proでも58.4から62.1へ伸び、クローズドな最先端モデルとの差を詰めています。Terminal-Bench 2.1ではClaude Opus 4.8(85.0)に数ポイント差まで迫り、Gemini 3.1 Proを上回りました。

技術面では、4層ごとに同じインデクサを共有するIndexShareを導入しました。これにより100万トークン時のトークン当たり計算量を2.9倍削減し、長文脈の計算コストを抑えています。投機的デコーディング用のMTP層も改良し、受理長を最大20%向上させました。

利用者は努力度を明示的に指定し、性能と速度・計算コストのバランスを調整できます。最も負荷の高いMaxモードでは難タスクに計算資源を追加配分でき、用途に応じた使い分けが可能です。GLM-5.2はZCode、Claude Code、OpenCodeなどから利用でき、Coding Plan契約者には既に展開済みです。

なお同社は、検証可能な合否報酬を悪用する報酬ハッキングへの対策も公表しました。ルールベースの検出とLLM判定を組み合わせ、不正なツール呼び出しを遮断しつつ学習を継続させる仕組みです。オープンな最先端モデルとして、透明性の高い開発のあり方も示した発表と言えます。

Claude Design刷新、企業のブランド統制を強化

デザインシステム連携

GitHubデザインファイル取込
出力をブランド基準で自動補正
管理者による編集ロック機能

コード連携と消費改善

Claude Code双方向同期
設計から実装への引き継ぎ解消
チャットと利用枠を共通化
9社へのエクスポート拡大

Anthropicは6月17日、AIデザインツール「Claude Design」の大幅刷新を発表しました。4月の研究プレビュー公開から2カ月で、見栄え重視のデモから企業のブランド統制を担う基盤へと位置づけを変えています。目玉は、企業の実際の部品を取り込んで出力を検証する仕組みです。

中核となるのが、刷新されたデザインシステムの取り込み機能です。利用者はGitHubリポジトリやデザインファイルから自社の部品やタイポグラフィ、カラートークンを読み込め、Claudeはそれらに沿って制作し、ユーザーが見る前に基準との整合を自動補正します。大規模組織では管理者が標準を承認して編集を固定でき、全成果物を社内ガイドラインに準拠させられます。

第二の柱はClaude Codeとの双方向連携です。Claude Code側で /design-sync を実行すれば、ローカルの設計部品をClaude Designに取り込めます。完成後はそのままClaude Codeへ引き継がれ、スクリーンショットや作り直しが不要になります。デザインエンジニアリングの手渡しは長年の摩擦点でしたが、同一のAIが両側を担うことでこの溝を埋める狙いです。

立ち上げ時に問題視されたトークン消費にも対策を講じました。Claude Designの利用枠をチャットやClaude CodeClaude Coworkと共通化し、多くの利用者の余力を広げています。さらに1ターンあたりの平均消費を抑え、エラー率も大きく下げたとしています。ただ生成デザインは本質的に高コストで、Proプランの利用者には依然厳しいとの指摘もあります。

エクスポート先も大幅に拡張しました。AdobeCanva、Miro、ReplitVercel、Wixなど9社の連携先を追加し、PDFやPowerPointに加えて多様な出力に対応します。Claude Designを作業の完成地点ではなく制作の起点と位置づける戦略で、急成長する自己ホスト型のオープンソース対抗策「Open Design」への防御線にもなっています。

今回の刷新は、創造作業からコード、知的労働、企業運用までを同じ基盤でつなぐプラットフォーム戦略の一環です。成否を左右するのは、幅広い利用者でトークン経済が成立するか、デザインシステム取り込みが実用に耐えるか、そしてコード連携が設計と実装の溝を本当に消せるかの3点だといえるでしょう。

微博の30億パラメータ新モデルが数学性能で巨大モデルと並ぶ

驚異の性能

数学AIMEで94.3点
巨大DeepSeekと同等の水準
コードでも高い合格率
ノートPCで動く30億規模

広がる懸念

ベンチマーク水増し疑惑
知識問題GPQAは70.2点と低調
実利用での性能ギャップ

中国の交流サイト大手である新浪微博の研究チーム9人が2026年6月15日、わずか30億パラメータの言語モデル「VibeThinker-3B」の技術報告をarXivに公開しました。数百倍の規模を持つGoogleOpenAIの最上位モデルに数学推論で匹敵すると主張し、AI研究界に衝撃を与えています。同モデルはMITライセンスで重みが無償公開されました。

中核となる主張はベンチマーク性能です。数学競技AIME 2026で94.3点を記録し、6710億パラメータのDeepSeek V3.2と肩を並べ、Gemini 3 Proの91.7点を上回りました。コーディングでも実施前のLeetCode週次大会で128問中123問を初回正解し、96.1%という合格率を示しています。

チームはこの結果をパラメトリック圧縮被覆仮説で説明します。数学やコードのように答えを検証できる「推論能力」は小さな中核に圧縮できる一方、幅広い事実を要する「知識能力」は多くのパラメータを要するという考え方です。実際、大学院レベルの科学知識を問うGPQAでは70.2点にとどまり、上位モデルに大きく劣りました。

このモデルはアリババのQwen2.5-Coder-3Bを土台に後処理学習したものです。4段階の学習工程を経ており、能力の境界にある難問を優先的に訓練するMGPOという独自の強化学習手法を採用しています。なお微博は2025年11月にも前身の1.5B版を公開しており、その学習費用はわずか7,800ドルだったと説明しています。

一方で批判も強く出ています。実際に試した利用者からは「人気のPython開発ツールすら理解しない」との報告が相次ぎ、ベンチマーク向けに最適化しただけではないかという「水増し」批判が広がりました。論文側は学習データから評価セットとの重複を除去したと反論しています。

今回の論争が示すのは、巨大化一辺倒だったAI開発への問い直しです。推論と知識を分離できるなら、小型の推論エンジンと大型の知識モデルを組み合わせる構成が現実味を帯びます。導入コストを大きく下げる可能性があり、その真価は順位表ではなく実務での有用性で問われることになります。

Google医療AI、慢性疾患の長期管理で専門医に匹敵

研究の成果

Nature掲載の最新研究
診断から長期管理へ進化
21人の初期診療医と比較
計画の正確さで医師を上回る

技術と展望

Gemini長文脈処理を活用
対話と推論の2エージェント構成
実臨床での全米規模試験へ

Googleは2026年6月17日、自社の医療AI「AMIE」が慢性疾患の長期管理で初期診療医に匹敵する性能を示したとする研究を、科学誌「Nature」に発表しました。これまで一度きりの診断対話を担ってきたAMIEが、症状の継続的な追跡や薬剤の調整といった長期的な疾患管理へと役割を広げた点が、今回の大きな前進です。

AMIEは「Articulate Medical Intelligence Explorer」の略で、医療推論と対話に特化したGoogleの研究用AIシステムです。今回の拡張版は、Geminiモデルの長文脈処理能力を生かし、患者とリアルタイムで対話する共感型エージェントと、数百ページに及ぶ臨床ガイドラインや薬剤集を参照する深い推論エージェント2つの仕組みで構成されています。

性能の検証は、患者役の俳優を用いた盲検試験で行われました。専門医がAMIEと21人の初期診療医を比較したところ、AMIEは全体的な管理推論で臨床医と同等の水準に達し、さらに治療計画の正確さとガイドラインへの適合度では医師を有意に上回る結果となりました。

Googleはこの成果について、AIがいつか医療を支え、医師が患者と向き合う時間を増やせる可能性を示すものだと位置づけています。次の段階として、AMIEを実際の臨床現場で活用する方法を探るとともに、現実の遠隔診療でAIを評価する全米規模のランダム化試験も開始したと説明しています。

診断はあくまで治療の第一歩にすぎません。診断後に症状を継続的に追い、更新される指針を読み解き、薬を細かく調整していく長期管理こそが、医療現場の大きな課題です。経営層やリーダーにとっても、AIが慢性疾患管理という持続的な医療領域に踏み込み始めた動きは、今後の医療サービス設計を見直す重要な手がかりとなりそうです。

Vercel、社内AIアプリとエージェントを統制する企業基盤

発表の柱

企業向け統制基盤を新設
社内アプリとエージェントを一元管理
安全を初期設定とする思想

主な機能

PassportでIdP認証を既定化
Connectで短命の認証情報付与
SSO連携の利用者管理
AWS上での自社運用に対応

Vercelは2026年6月17日、企業全体が安全にAIアプリやエージェントを構築・公開できる新基盤「Vercel for Enterprise Apps and Agents」を発表しました。同社は過去1年間で社内に数百のエージェントや内部アプリを展開する中で、誰が利用できるか、どのデータに触れてよいか、コストはどれほどかといった統制上の課題に直面し、その解決策を製品化したものです。

中核となるのが認証基盤「Vercel Passport」です。これまで社内向けの公開設定は各プロジェクトで個別に行う必要があり、設定漏れが機密情報の露出につながる恐れがありました。Passportは全ての内部アプリとエージェント標準でID基盤の背後に置き、OktaやMicrosoft Entra、Auth0などOpenID Connect対応のプロバイダーでアクセスを集中管理できるようにします。

もう一つの柱が「Vercel Connect」です。多くのエージェントは長期間有効な認証情報を環境変数に持つため危険でしたが、ConnectはOAuthやOIDC、秘密情報の注入を一本化し、タスク単位の短命な認証情報を都度発行します。SlackGitHubSnowflakeSalesforce、Linearなどへ安全に接続でき、作業完了とともにトークンは失効します。

利用者管理では「Enterprise Managed Users」が、SAML SSOとディレクトリ同期を基盤に全ビルダーのアカウントを一元統制します。入退社に応じた自動的なシート割り当てと権限剥奪を実現し、グループ別アクセス制御やMFA強制を組織全体に適用、全操作を単一の監査証跡に残します。現在はプライベートベータです。

このほか、AIアプリビルダー「v0」がSnowflakeと連携し、技術チケットなしで誰もがデータウェアハウス上のアプリを安全に作れるようになりました。大企業向けには、自社のAWSアカウントとVPC内で計算資源を動かし、Vercelが制御プレーンのみを担う持ち込みクラウド(BYOC)も用意。ソースコードがCIの外に出ない構成で、セキュリティチームが既存の統制を維持できます。

同社は、安全な道筋を初期設定にすることで、アイデアがセキュリティ審査で潰れる従来の構図を変えると説明します。専門知識を持つ現場の担当者が自らツールを作り、有望な試作はそのまま本番へ移行できる。実験が例外ではなく標準になる開発体験を、企業の統制要件と両立させる狙いがうかがえます。

AIエージェントが実行時にツールを探す新標準ARD公開

ARDの狙い

事前導入なしの実行時探索
ツール・スキル・エージェントを横断検索
選択をLLM外に移す設計
製品ではなく業界共通の標準

HFの実装

参照実装Discover Toolを提供
Spacesを意味検索しスキル化
REST・CLI・MCPで利用可能

MicrosoftGoogleHugging Faceなどの貢献者が2026年6月17日、AIエージェントがツールやスキル、他のエージェントを実行時に発見するためのオープン仕様Agentic Resource Discovery(ARD)を公開しました。設定ファイルへ事前に組み込む現在の方式に代わり、連合型レジストリ越しに能力を検索できる発見層を定めるドラフト仕様です。製品やマーケットプレイスではなく、どの企業も独自に実装できる共通標準と位置づけられています。

従来のエージェントは「先に導入し後で使う」方式が前提でした。開発者MCPサーバーのURLを設定に固定するやり方は日常的に使う数個のツールには有効ですが、無数の臨時的な用途には拡張できません。全ツールの説明をLLMのコンテキストに詰め込む代替策も、コンテキスト予算の制約を受けます。

ARDはこの選択処理をLLMの外へ移します。レジストリが発行者情報や代表的な問い合わせ例、コンプライアンス証明、タグといった豊富な信号で能力を索引化し、REST経由で公開します。クライアントが自然言語で検索し、モデルはその結果を呼び出すだけ。手動導入の静的カタログから意図ベースの検索へと転換し、MCPツールやA2Aエージェントを事前設定なしに広く利用できます。

仕様は2つの要素を定義します。発行者が能力を周知URLで公開する静的マニフェスト「ai-catalog.json」と、ライブで順位付けされた検索を返す動的なレジストリAPI「POST /search」です。Hugging FaceDiscover Toolはその参照実装で、Hubの既存の意味検索をARDのカタログ形式に変換し、数千のSkillsやMLアプリ、MCPサーバーへの検索アクセスを提供します。

利用方法も整備されています。Hugging Face CLIに組み込まれた「hf discover search」コマンドや、well-known URLで公開されるカタログ、直接叩けるREST APIとMCPエンドポイントから検索できます。今後は仕様の連合モードとの統合強化や、ユーザー・組織プロフィールでの静的マニフェスト対応が予定されており、あらゆる発行者が標準的な仕組みで自らの能力を広告できるようになります。

AWSがロボット制御をエージェントに統合するSDK公開

SDKの中身

AWS製オープンソースSDK
LeRobot機能をAgentTool化
Apache2.0ライセンス
記録・学習・推論を一括統合

実機への展開

引数1つでシミュから実機へ
同一データ形式を共有
Zenoh活用の群制御
人間承認で安全担保

AWSは6月17日、ロボット開発の各工程を一つのAIエージェントから自然言語で操作できるオープンソースSDK「Strands Robots」を公開しました。Hugging Faceロボット学習基盤LeRobotの機能をエージェント用ツールとして束ね、これまで記録・学習・シミュレーション・実機展開・複数台連携の5つに分かれていた作業を一本化します。ライセンスはApache2.0です。

最大の特徴は、シミュレーションと実機のコードがほぼ同一である点です。ロボットを生成する関数は標準でMuJoCoベースの仮想環境を返し、引数をmode="real"に変えるだけで物理ロボットに切り替わります。仮想環境で記録したデータも実機の記録も同じLeRobotDataset形式で保存されるため、片方向けに書いた学習スクリプトをもう片方でもそのまま使えます。

ポリシー推論も共通の入口で扱えます。NVIDIAGR00Tやローカル推論、MolmoAct2のチェックポイントを同じインターフェースで呼び出せるほか、ACTやSmolVLA、π0なども利用可能です。GPUやDocker、Hugging Face認証情報がなくても、模擬ポリシーを使えばノートパソコン上でシミュレーションを最後まで動かせる設計です。

複数台の連携には、ブローカー不要のP2PプロトコルZenohを使ったメッシュ機能を採用しました。新しいロボットは起動した瞬間にメッシュへ参加し、エージェントが一斉に指示を出せます。IPアドレスの管理や探索コードの記述は不要です。

物理的に動作する命令には人間の承認を介在させる仕組みが標準で入っています。一斉送信や緊急停止などはLLMの引数とは別経路で操作者の許可を求めるため、プロンプトインジェクションで承認を偽装する攻撃を防げます。本番運用ではmTLS認証が必須とされ、信頼できないデータを与えない設計が推奨されています。

この統合の狙いは、LeRobotが持つ資産を作り直さず、エージェントから扱える表層だけを足すことにあります。Hub上のあらゆるデータセットがエージェントの拡張・学習・展開の対象になり、仮想と実機の境界は設計上の分断ではなく単なる展開手順の違いになります。AWSArmと協力した本番向けネットワーク層「Device Connect」も用意しており、コードを変えずに規模を広げられるとしています。

Vercel、AIエージェント向け基盤に全面転換

発表の柱

ロンドンで開催の年次イベント
エージェント特化の基盤戦略
新フレームワークeveを公開
外部接続を担うVercel Connect

企業向け強化

7月開始のVercel Services
自律監視するVercel Agent
Python等バックエンド対応拡大

Vercelは6月17日、英ロンドンで年次イベントVercel Ship 2026を開催し、AIエージェント向けに設計した基盤への全面転換を打ち出しました。来場者は2,500人を超え、CEOのギレルモ・ラウク氏は「考えるソフトウェアをデプロイする」と表明しました。同社はWeb構築のあり方を主導してきた実績を、今後はエージェント領域で再現する構えです。

中核となるエージェント基盤は三つの柱で構成されます。第一に、Claude CodeCodexなどのコーディングエージェントがコードを展開する場としての役割です。第二に利用者自身がエージェントを構築・運用する場、第三にVercel自体が運用をエージェントで自動化する仕組みで、障害の検知から修正のプルリクエスト提示までを担います。

新たに公開したのは、エージェント構築用のオープンソース基盤eveです。指示をマークダウン、ツールをTypeScriptで記述し、単一ディレクトリで本番運用できる点が特徴です。あわせて、長期保存の認証情報を残さず一時的な権限で外部システムへ安全に接続するVercel Connectも発表しました。

企業向けでは、7月1日提供開始のVercel Servicesでマイクロサービスを正式対応とし、サービス間が公開インターネットを介さず通信できるようにします。さらに本番環境を自律監視し、異常を調査して修正案を提示するVercel Agentを限定ベータで投入しました。読み取り専用を既定とし、本番操作前に限定的な権限承認を求める設計です。

基盤面ではFastAPIやFlask、Expressといったバックエンドフレームワークや、Amazon Auroraなどのデータベース対応も拡大しました。会場ではAnthropicOpenAIElevenLabsなどの登壇者が実装事例を紹介し、Vercelの社内支援エージェントサポート対応の91%を自動化した実績も示されました。次回はベルリンやニューヨークなどでの開催を予定しています。

ロボット学習データ専業のXDOF、70億円調達

次のボトルネック

モデルやチップでなく物理データが次の壁
言語モデル向け大量テキストとの差
顧客は20社、複数は最先端AI研究所

データ供給網の構築

Thriveやa16zから7000万ドル調達
13万軌跡の大規模公開データを整備
遠隔操作と装着センサーで収集

ロボット学習データの収集・整備を専業とする米新興企業XDOFが2026年6月17日、ステルス状態を脱して事業を公開しました。Thrive CapitalやSpark Capital、a16zなどから7000万ドルを調達済みで、最先端AI研究所を含む20社とすでに取引しているといいます。AIの次の難所はモデルやチップではなく、ロボットに物理世界との対話を教えるためのデータの供給網だという賭けに出ています。

背景には、大規模言語モデルが公開テキストの海で学習できたのに対し、ロボットは物理的な接触を捉えたデータをほとんど持たないという事情があります。YouTube動画やギグワーカーの撮影映像は精度が低く、現実世界と整合させるのが難しいのが実情です。共同創業者でCEOのフィリップ・ウー氏はUCバークレーの博士課程でこの鶏と卵の問題に直面し、まずデータ収集の手段を作る必要があると痛感したと振り返ります。

ウー氏らは安価な遠隔操作システム「GELLO」を開発し、人がロボットアームを操作して学習データを生成する仕組みで注目を集めました。これを足がかりに2024年10月、ロボット開発企業向けのデータ基盤を提供するXDOFを立ち上げます。データ提供だけでは行き詰まると考え、洗浄・ツール・注釈までを手掛けることで自己強化型のフィードバックループを築く狙いです。

出発点として同社はUCバークレーのAI研究所と組み、これまでで最大級と称する高品質なロボット学習データ群「ABC」を公開します。13万件の操作軌跡、300時間のシミュレーション、100時間の評価データを含み、Tシャツたたみや箱の平たん化、AirPodsの収納といった作業の学習にすでに活用されました。学術界がこの規模の事前学習データを使えるのは初めてだといいます。

同社はデータピラミッドの3層で事業を展開する計画です。最も価値が高いのは実際に配備するロボット上で集める遠隔操作データで、次が汎用的な遠隔操作データ、最後が人が日常作業を行う一人称視点データで、ここでは独自の装着型センサーを開発します。なぜ大手研究所が自前でやらないのか。数十万平方フィートの倉庫と数百台のロボット、その校正と操作者育成が必要で、多くの研究所は外部委託を選ぶとウー氏は説明します。

社名のXDOFはロボット工学用語「自由度(degrees of freedom)」をもじったものです。人間の腕は肩から手首まで7自由度、Figure AIの最新ロボットは30自由度を持ちます。頭の「X」には任意かつ無限の自由度を目指すという同社の野心が込められています。物理AIが次のフロンティアとなる中、地味で泥臭いデータ収集こそが競争の鍵になるのか、注目が集まります。

Copilot、プロンプトキャッシュと自動モデル選択で効率化

ハーネスの効率化

プロンプトキャッシュで状態再利用
ツール検索で定義を必要時に読込
繰り返し処理の固定コスト削減

Autoによる自動選択

タスク意図とモデル健全性で判断
ルーターHyDRAが最適モデル選定
キャッシュ境界でのみモデル切替
16言語族で精度の差は僅か

GitHubは6月17日、コーディング支援AI「GitHub Copilot」のトークン効率を高める改良を発表しました。VS Code向けにプロンプトキャッシュとツール検索を導入し、加えてタスクに応じて最適なモデルを自動選択する「Auto」を各機能へ拡大します。狙いは、1セッション内でより多くの処理を実作業に振り向け、利用者のクレジット消費を抑えることにあります。

効率化の第一歩は、ターンごとに繰り返す情報を減らすことです。プロンプトキャッシュは同じ接頭辞の再計算を避けてモデル状態を再利用し、ツール検索はすべてのツール定義を毎回送る代わりに必要なものだけを随時読み込みます。エージェントが扱うツールが増えるほど、この固定コストの削減効果は大きくなります。

もう一つの柱が「Auto」による自動モデル選択です。最初のプロンプト後、Copilotはタスクの意図と現在のモデルの状態をもとに最適なモデルを選びます。同社の評価では単一のモデルが全タスクで最良ではなく、深い推論が必要な場面では強力なモデルが、そうでない場面では効率的なモデルが有効だったといいます。

Autoは2つの信号を組み合わせます。可用性や応答速度、エラー率、コストを追うリアルタイムのモデル健全性と、推論の深さやコードの複雑さなどを考慮するルーティングモデル「HyDRA」です。HyDRAは品質基準を満たすモデルを絞り込み、その中から最適なものを選ぶ仕組みです。

実運用では落とし穴も考慮されています。会話の途中でモデルを切り替えるとキャッシュが壊れ、節約以上のコストがかかる恐れがあるためです。そこでAutoは初回ターンや要約後などキャッシュの自然な境界でのみ切り替え、間は同じモデルを維持します。CJKを含む16言語族で訓練し、ルーティング精度は英語基準から4ポイント以内に収まったとしています。

タスク意図を伴うAutoはすでにVS Code、github.com、モバイルで利用可能です。今後はCopilot CLIやGitHubアプリ、他のIDEへ広げ、無料・学生プランではAutoを唯一の選択肢に簡素化します。管理者がAutoを既定や必須に設定できる制御も加わる予定で、開発者が毎回モデルを選ばずに済む方向へ進めるとしています。

Vercelがオープンソースのエージェント基盤eveを公開

eveの特徴

エージェントディレクトリ単位で定義
本番機能を標準同梱
永続実行とサンドボックス内蔵
人による承認フロー対応

開発から運用まで

トレースと評価機能を統合
SlackなどチャネルへCLIで追加
Vercel上にそのまま展開

Vercelは6月17日、エージェント開発用のオープンソースフレームワークeveの公開プレビューを発表しました。eveはエージェントが本番環境で必要とする仕組みを最初から備える点が特徴で、永続実行やサンドボックス、人による承認、サブエージェント、評価機能などを標準で同梱します。開発者は配管部分を組み立てる手間なく、エージェントの振る舞いそのものに集中できる設計です。

中核となる思想はエージェントは1つのディレクトリ」という考え方です。モデルを記す`agent.ts`、人格を定める`instructions.md`、能力を担う`tools/`、知識を収める`skills/`など、ファイルとその配置がそのまま定義になります。Next.jsがフォルダをルートに変えたように、eveはファイルを1つの機能に変え、定型コードの記述を不要にします。

本番運用に必要な機能も一通り組み込まれています。各会話はチェックポイント付きの永続ワークフローとなり、クラッシュやデプロイをまたいでも中断地点から再開できます。エージェントが生成したコードは専用サンドボックスで隔離実行され、本番ではVercel Sandbox、ローカルではDockerなどで動かせます。

外部接続や運用面の作り込みも進んでいます。MCPサーバーやOpenAPI対応APIへの接続はファイル1つで定義でき、認証情報はモデルに見せずに仲介します。実行はすべてOpenTelemetry準拠のトレースとして記録され、Braintrustなど既存の監視サービスへ出力できるほか、評価スイートをCIに組み込んで回帰を検知できます。

デプロイは通常のVercelプロジェクトと同じく`vercel deploy`で完結し、Slackなどチャネルの追加もCLIコマンド1つで済みます。Vercel社内では100以上のエージェントが稼働しており、月3万件の質問に答えるデータ分析エージェントなどが業務を支えています。同社ではデプロイの約29%がエージェント起点に達し、開発はGitHub上で公開されています。

危険なAIモデルの登場は不可避と専門家

規制の経緯

米政府が輸出規制を発令
外国籍ユーザーの利用を禁止
AnthropicがFable5とMythos5を停止

リスクの本質

デュアルユースの両刃の剣
Fable5のガードレール解除を懸念
安全保障上のリスクと判断

今後の見通し

他社やオープンウェイトも追随
規制は問題を先送りするだけ

AI開発企業のAnthropicは先週末、米政府による輸出規制の指示を受け、新モデル「Claude Fable 5」と「Mythos 5」の提供を停止しました。指示は「いかなる外国籍の利用も禁じる」という内容で、同社は金曜以降ホワイトハウスと協議を続けていますが、提供再開の合意には至っていません。今回の措置は、高度なAIの能力が安全保障とどう交わるかを象徴する出来事です。

問題の核心は、Mythosが持つデュアルユース(両刃の剣)の性質にあります。同モデルはソフトウェアの脆弱性を見つけて防御側の修正を助ける一方、悪用すれば攻撃にも転用できる能力を備えています。Anthropic自身も発表時に「サイバーセキュリティや生物学の専門家にとって有益な問い合わせは、悪意ある者の手に渡れば危険になりうる」と警告していました。

同社は当初、Mythosを「Project Glasswing」という作業部会の限られた参加者にのみ提供してきました。先週はMythos 5もこの集団に非公開で提供する一方、Mythos級の能力を持つ「Claude Fable 5」は、生物学やサイバーセキュリティに関する回答を制限したうえで一般公開していました。能力の高さと公開範囲を慎重に切り分けていたわけです。

ところがトランプ政権は週末、両モデルの利用を制限する方針を示しました。理由は、Fable 5のガードレールが解除されればMythos 5の能力に完全アクセスできるとみて、国家安全保障上のリスクだと判断したためです。企業と政府の見解の隔たりが、提供再開を阻む形になっています。

ただ専門家は、この対立が厳しい現実を先送りしているだけだと指摘します。Anthropicは今この問題の最前線に立っているにすぎず、複数の企業やオープンウェイト開発者によるモデルも、近い将来Mythos 5と同等の能力を持つ可能性が高いというのです。すでにそうした能力を備えたモデルが存在する可能性さえあります。経営者にとっては、規制の動向と並行して、強力なAIが当たり前になる前提で対応を考える必要がありそうです。

Ai2が言語指示で3D動作を予測するモデル公開

モデルの概要

言語指示で未来の3D動作を予測
基盤はMolmo 2を採用
物体に紐づく3D点群で表現
自己回帰版とフロー版の2種

データと性能

116万本の動画からMolmoMotion-1Mを構築
検証用ベンチPointMotionBenchも公開
ロボット制御で成功率76.3%
重み・データをオープン公開

米Allen Institute for AI(Ai2)は6月17日、言語指示に基づいて物体の未来の3次元動作を予測するモデル「MolmoMotion」を公開しました。動画フレームと物体上の3D点群、そして「テーブル上の木製ボウルを動かして回転させる」といった行動の指示文を与えると、それらの点が数秒先にどう動くかを3D空間で予測します。動きを観測する従来モデルと異なり、動く前に先を読む点が特徴です。

MolmoMotionは同社の視覚言語モデルMolmo 2をバックボーンに使い、指示文と画像内の物体・点を結びつけます。動作の表現には、物体表面に紐づく疎な3D点の軌跡を採用しました。人体や剛体などのテンプレートに依存せず、カメラの視点が変わっても一貫し、ロボット動画生成にそのまま渡せる汎用性を重視した設計です。

学習には、行動説明と対応づいた大規模な3D軌跡データが必要でしたが、既存データは小規模で領域も限られていました。そこで同社は、制約のない動画から物体に紐づく3D軌跡を自動抽出するパイプラインを構築し、116万本の動画からMolmoMotion-1Mを作成しました。736種類の動作と5600種類の物体を網羅する、現時点で最大級のデータ群です。

あわせて、人手で検証した評価用ベンチマークPointMotionBenchも公開しました。111カテゴリの物体と61種類の動作にわたる2700本の動画クリップを収録し、予測した3D軌跡が実際の動きとどれだけ一致するかを定量評価します。同ベンチマークで、MolmoMotionは映像生成型や従来の3D手法を含む既存のすべての手法を上回りました。

応用面では、ロボットの計画と動画生成の両方で効果が確認されています。シミュレーション上の物体配置タスクで、Molmo 2をそのまま使った場合の成功率56.0%に対し、MolmoMotionを用いると76.3%に向上し、学習も高速でした。動画生成では、予測した軌跡を入力に加えることで、指示通りの細かい動きをより忠実に再現できたといいます。

課題も残ります。学習時に物体あたり8点の点群しか使わないため、複雑な変形を伴う動きの表現には限界があります。それでも同社は、モデルの重みとデータ、ベンチマークをすべてオープンに公開しました。観測だけでなく予測こそ機械知能の根幹だとし、ロボティクス動画分野での応用拡大を見込んでいます。

MITがロボットに長期記憶、置き場所を言葉で回答

新手法DAAAM

MITが開発した時空間記憶
環境の3D地図に言語説明を付与
自然言語の質問に数秒で回答

性能と高速化

注釈速度を10倍に高速化
従来比21〜53%高い正答率
リアルタイム動作を実現

米マサチューセッツ工科大学(MIT)の研究チームは6月17日、ロボットが大規模な環境を長期間記憶し、自然言語で問い合わせに答えられる記憶フレームワーク「DAAAM」を発表しました。CVPRで公表されたこの手法は、コンピュータービジョンとロボット地図作成を組み合わせ、「昨夜組み立て始めた部品を取ってきて」といった曖昧な指示にも応答できます。

従来、マルチモーダルの視覚モデルは物体を豊かに描写できる一方で一度に1件しか処理できず、ロボットの地図作成は3D地図を作れても物体の詳細説明を欠くか計算負荷が高いという課題がありました。DAAAMは両者の長所を統合し、ロボットが移動しながら見た物体に説明文を付け、空間的に整理した3D地図として蓄積します。

高速化の鍵は、近接する物体をまとめ、複数の物体が最も明瞭に写るキーフレームを選んで一括で注釈する最適化手法です。これにより各物体を一度だけ注釈すれば済み、処理速度は従来の約10倍に達しました。数分の探索で数百の物体を見るロボットでも、リアルタイムで記憶を形成できます。

蓄積した膨大なデータからの検索には、複数のツールを呼び出す大規模言語モデル(LLM)を採用し、幻覚(ハルシネーションを抑えながら必要な情報を数秒で取り出します。意味検索や位置情報による検索を使い分けることで、質問の種類に応じて従来手法より21〜53%高い正答率を記録しました。

研究を主導したルカ・カルローネ准教授は、人と並んで働くロボットには時間と空間を人間と同じように扱う能力が必要であり、本手法は従来の地図を言語ベースの地図へ変える試みだと説明します。応用先はロボットにとどまらず、保守作業者の異常検知や通勤者の道案内を支援する拡張現実(AR)システムへの展開も視野に入ります。

今後チームは、環境内で起きた重要な出来事を記録する機能や、回答に確信度を組み込む改良を進める方針です。大学院生のニコラス・ゴルロ氏は、あらゆる依頼に応える汎用エージェントの基盤づくりを目指すと語っています。

深センで人型ロボ遠隔操作が新たな仕事に

遠隔操作の現場

VRとモーション追跡で遠隔操作
10社のロボットハンドを一括制御
コンビニ陳列を遠隔で実演
操作データを学習用に蓄積

自律化への布石

人の動きを多様な機体へ転送
深センの製造集積が強み
縫製機大手と協業
自動運転型の段階的普及を志向

中国・深セン近郊のスタートアップIO-AI Techが、人型ロボットの遠隔操作を新たなブルーカラー職として確立しつつあります。作業者はVRヘッドセットや手持ちコントローラー、モーション追跡装置を身につけ、工場やコンビニ向けの人型ロボットを遠隔で動かします。狙いは棚卸しや陳列といった実作業に加え、いずれロボット自律化させるための訓練データ収集にあります。

同社のデモでは、各社製の10種類のロボットハンド計50本の指を、独自の手袋型デバイスで瞬時に操作できたといいます。動きの転送は双方向で、ロボットの手に置かれたボールの感触まで操作者に伝わりました。中国のコンビニチェーンが試験運用するシステムでは、VRヘッドセットとグリッパーで薬の箱を棚から取る作業も体験できたとのことです。

IO-AIの中核技術は、人の動きを形状や大きさの異なる多様なロボットに転送する点にあります。中国市場には数十種類の人型ロボットやハンドが存在するため、機体を問わず操作できる仕組みは価値が高いのです。一方で人と機体は同じ体形ではないため、バランスを崩さないよう一定の自律動作と人の操作を組み合わせる必要があります。

数千の製造業者が集まる深センは、試作と改良を素早く回せる理想的な拠点です。共同創業者のSi Chin氏によれば、地元の製造業者は自動化への意欲が高く、縫製機械大手のJack Sewing Machinesとはシャツのアイロンがけを担う双腕ロボットの訓練で協業しています。これらのロボットは既存の生産ラインに組み込み、手作業を置き換えられると見込まれます。

膨大な遠隔操作データが、いずれ汎用的で高性能なロボットモデルを生むと考える研究者もいます。Chin氏はその可能性を認めつつ、自動運転車のように段階的に自律度を高める現実的な手法が理にかなうと語ります。遠隔操作は中国の職業学校でも広がりを見せ始めているといい、安価で高品質なロボットを量産する中国の製造力が、AIによる物理世界の制御をも後押しする可能性が示されています。

英政府の都市計画AI、Google Cloudで全国展開

Extractを全国展開

イングランド全自治体にExtract提供
複雑な計画書類の処理を自動化
1自治体あたり年255時間節約見込み

計画支援AIの試験

計画支援AI試作を3自治体で試験中
2027年に全国の自治体へ提供予定

Geminiが基盤

Geminiで安全なデータ処理
300超の自治体へ拡張可能

英政府は6月17日、ロンドンで開催されたGoogle Cloud Summitで、地方自治体向けの都市計画AIに関する大型アップデートを発表しました。住宅・地域・地方自治省(MHCLG)などが、書類処理を自動化するExtractツールの全国展開と、計画担当者を支援する計画判断支援AI試作の進捗を明らかにしたものです。いずれもGoogle Cloudを基盤としています。

Extractは、MHCLGと政府内のAI専門チームであるi.AI(Incubator for AI)が内製で開発したツールです。一連の試験を経て、このたびイングランドの全自治体へ提供が始まりました。複雑な都市計画関連の書類をデジタル形式に整理する作業を自動化し、平均的な自治体で年間およそ255時間の手作業を削減できると見込まれています。

もう一方のAugmented Planning Decisions(APD)は、政府とGoogle Cloud、Google DeepMind、パートナーのFacultyが連携して進める試作です。現在はロンドンのバーネット区とカムデン区、ドーセット州の計画当局でアルファ版が試験運用され、担当者が複雑な地域方針を読み解く作業を支援します。政府は2027年から全国の自治体に提供する計画です。

両ツールの基盤には、Google Cloud上で動くGeminiが使われています。政府の機微なデータを大規模に扱うには高い安全性が求められるため、保護された環境で高度な推論を利用する構成を採りました。これにより、プロンプト注入などのリスクを抑え、データの主権と安全性を確保できるとしています。

Googleは、政策面のMHCLG、技術面のi.AI、研究開発のGoogle DeepMind、実装のFacultyという連携の成果だと位置づけています。300を超える地方自治体への拡張に耐える弾力的なインフラを提供できるとし、公共部門のAI活用が試験段階から実運用へ移る動きを後押しする狙いです。

MIT、汎用AIが専門アルゴリズムを上回ると実証

研究の要点

不完全情報ゲームで汎用手法が優位
ポリシー勾配法が専門手法を逆転
通説を覆すベンチマーク提案

評価と意義

最大300億状態のゲームで検証
ノートPCで実行可能
軍事や交渉への応用可能性

マサチューセッツ工科大学(MIT)などの研究チームは2026年6月、ポーカーのように相手の手札が見えない「不完全情報ゲーム」において、汎用的な学習手法が専門的なアルゴリズムを上回ることを示す論文を発表しました。この成果は4月にリオデジャネイロで開かれた国際会議ICLRで報告され、長年信じられてきたゲーム理論ベースの優位性という通説を覆す内容となっています。

従来この分野では、ゲーム理論に基づく専門アルゴリズムが、1990年代に登場した汎用的な「ポリシー勾配法」より明確に優れると考えられてきました。ポリシー勾配法は神経回路網(ニューラルネット)に逐次的な意思決定を学習させる手法で、戦略ゲーム向けには想定されていませんでした。共著者のソコタ氏は「専門アルゴリズムが正しい手法だと当然視されてきた」と振り返ります。

研究チームは新たなアルゴリズムを提案するのではなく、各手法の性能を公平に測るベンチマーク(評価基盤)を提示しました。指標には、最悪の相手と対戦した際の不利さを示す「搾取可能性」を採用しています。最大で300億通りの状態を持つ大規模なゲームでこの指標を機能させた点が、最大の技術的課題だったといいます。

ファントム三目並べやヘックスの変種、ライアーズダイスなど5種類のゲームで実験した結果、ポリシー勾配法で訓練したネットワークの方が低い搾取可能性を記録し、直接対戦でも勝利しました。この評価ソフトは無償公開され、一般的なノートPCでも実行可能で、既存のOpenSpielに1行のコードを追加するだけで使えます。

研究者らは、ここでいう「ゲーム」が娯楽に限らず、あらゆる多主体間の戦略的相互作用を指すと強調します。共著者のビニツキー氏は軍事作戦や取引、交渉など隠れた情報を扱う場面への波及を指摘。グーグル・ディープマインドのゲンプ氏も「古典的な手法の現代化が有効な道だと示す説得力ある研究だ」と評価しています。

VercelがAIエージェント開発の統合基盤を公開

3つの中核機能

モデル接続とルーティング
複数手順のワークフロー実行
外部システムとの安全な連携
自前構築や囲い込みの回避

構成要素とeve

AI Gatewayがマークアップ無しで中継
Workflow SDKで処理を再開可能
Sandboxが各エージェントに隔離VM
開発を簡素化するeveを公開

Vercelは6月17日、本番品質のAIエージェントを開発・運用するための統合基盤「Agent Stack」を公開しました。エージェントにはモデルへの接続と切り替え、複数手順にわたる処理の実行、外部システムやユーザーとの安全な連携という3つの中核機能が欠かせないとし、それらを一式の構成要素として提供します。これまで開発者は単一プロバイダーへの囲い込み、複数ツールの継ぎ接ぎ、抽象化の自作のいずれかを迫られていました。

モデル接続層は2つの部品で担います。「AI SDK」は文字列を1つ変えるだけでモデルを切り替えられる共通インターフェースを提供し、プラットフォームやフレームワークに依存しません。「AI Gateway」は単一エンドポイントから数百のモデルへ振り分け、障害時のフェイルオーバーや費用・使用量の追跡を行います。価格への上乗せはなく、自前のキーも利用できます。

処理の実行層では、「Workflow SDK」が各手順をチェックポイントとして記録し、失敗した箇所だけを再試行します。途中で止まっても最後の正常な手順から再開でき、ゼロからのやり直しを避けられます。「Vercel Sandbox」は各エージェントに独自カーネルを持つ隔離されたmicroVMを与え、未レビューのコードを安全に実行させます。資格情報はサービス呼び出し時にのみ注入され、生のトークンには触れません。

外部連携層の「Vercel Connect」は、各タスクごとに権限を絞った短命トークンを発行し、長期間有効な広範なトークンに依存する従来手法を置き換えます。利用者からエージェント、サービスまで全ての操作を追跡でき、監査ログで誰の指示によるかを特定できます。現在はSlackGitHubSnowflakeなどに対応するパブリックベータ版です。「Chat SDK」は1度の導入で複数のメッセージ基盤へエージェントを届けます。

そしてVercelは過去1年で数百のエージェントを構築する中で、エージェントには共通の「形」があると気づき、その形をフレームワーク化した「eve」も公開しました。指示はマークダウン、ツールはTypeScriptで記述し、耐久実行や承認、配信は下層の構成要素で既に配線済みです。経営者エンジニアにとって、エージェント開発の組み立て作業を省き本質に集中できる選択肢が広がったと言えます。

GMがAIで車設計を短縮、月面ローバーにも適用

開発期間の短縮

衝突解析を15時間から1分未満へ
ハマーEVの開発を2年に半減
週約200万回のシミュレーション

適用領域の拡大

自動運転やF1、防衛にも応用
NASA月面ローバーの設計に活用
コルベット部品で生成設計採用

米ゼネラル・モーターズ(GM)は2026年6月、AIとシミュレーションを活用して自動車などの開発期間を大幅に短縮する取り組みを公開しました。中国のBYDなどが2年以内で新型EVを市場投入する速さに対抗する狙いです。陣頭指揮を執るのは、テスラのオートパイロット開発やオーロラ・イノベーション共同創業で知られ、昨年6月に最高製品責任者として迎えられたスターリング・アンダーソン氏です。

中核となるのは、これまで個別に開発していた電装や熱制御、安全、操縦性などの機能を単一の仮想開発ツールに統合する手法です。アンダーソン氏によると、構造エンジニアは設計変更が完成車に与える影響を、従来の15時間に対しわずか1分ほどで確認できるようになりました。物理的な試作前にハードとソフトを同時に最適化できる点が特徴です。

効果は具体的な数字に表れています。フロント部の衝突解析は確率を用いたAI手法により、15時間の計算が1分未満に短縮されました。電動の「GMCハマー」は設計から店頭まで2年と、通常の4〜5年から開発期間が半減したといいます。自動運転開発では1日で100日分の走行を再現し、週におよそ200万回のシミュレーションを実行しています。

適用範囲は乗用車にとどまりません。GMはこの手法を自動運転車やLMR電池、キャデラックのF1参戦、軍事防衛システム、そしてNASAのアルテミス計画向け月面ローバーにも広げています。技術者はソフト上で重力を調整し、ミシガン州の室内で月面のタイヤ開発に必要な走行条件を再現できると説明します。

象徴的なのが、収益性の高いシボレー・コルベットへの応用です。重い複合素材のハッチを支えるブラケットの設計に生成的な物理ベース設計を用い、木の根のような形状で従来品より軽く硬く耐久性の高い部品を生み出しました。フィッシャー氏は「これがGMの新たな標準になりつつある」と語っています。

Vercel、AIエージェント向け短命トークン基盤を公開

刷新の中身

長期保存トークンの廃止
実行時に発行する短命認証情報
タスク単位で範囲を限定
コネクター登録は1回のみ

仕組みと安全性

OIDCでアプリ本人確認
Slackなど主要サービス対応
トークン失効を即時実行

ホスティング大手のVercelは6月17日、AIエージェントに外部サービスへの安全な接続権限を渡す新基盤Vercel Connectをパブリックベータとして公開しました。環境変数に長期保存していたプロバイダートークンを廃止し、エージェントが作業のたびに短命の認証情報を実行時に受け取る方式へ切り替えるものです。トークン漏洩時の被害範囲を最小化する狙いがあります。

従来の方式では、全ユーザーで共有され失効しない長期トークンがエージェントに全権限を与えていました。Vercel Connectはこれをランタイム認証情報交換に置き換えます。開発者はコネクターを一度登録するだけで、プロジェクトや環境ごとに権限を割り当て、エージェントは必要なときだけ範囲を絞ったトークンを要求します。

本人確認の核となるのがOIDCです。Vercel上の各デプロイには固有のOIDC IDが付与され、トークン要求時にSDKがこのIDを提示します。Vercel Connectが検証し、許可されたプロジェクトと環境であることを確認してからプロバイダーの認証情報を返す仕組みです。アプリ側に秘密情報を保持しないため、漏洩や誤コミットのリスクが消えます。

権限はタスク単位で細かく制御できます。GitHubなら特定リポジトリの読み取り専用に限定でき、利用者ごとに本人として振る舞うトークン発行も可能です。環境ごとに別コネクターを使えば、開発環境で漏れた認証情報を本番環境で悪用される事態も防げます。

対応プロバイダーはSlackGitHub、Linear、DiscordNotionSalesforceFigmaSnowflakeなどです。料金はトークン要求数に基づき、Hobbyプランは月5千回まで無料、ProとEnterpriseでは1万回あたり3ドルで課金されます。ベータ段階のため、トリガー転送はSlackGitHub、Linearに限られ、失効や有効期間はプロバイダーの対応状況に依存します。

OpenAIが生命科学研究向けAI評価基準を公開

ベンチマークの中身

専門家執筆の750課題
7つの研究工程と7生物分野を網羅
創薬経験を持つ博士173人が作成
総計1万9020項目の評価基準

従来評価との違い

事実暗記でなく実務的判断を測定
課題の79%が複数の推論を要求
図表やPDFなど添付資料の解釈を必須化

OpenAIは2026年6月17日、生命科学研究の現場作業をどこまでAIが支援できるかを測る新ベンチマークLifeSciBenchを公開しました。創薬の実務経験を持つ博士号レベルの科学者が課題を設計し、断片的な証拠の解釈や実験設計といった研究レベルの判断を評価対象に据えた点が特徴です。

従来の生命科学向け評価は、答えが一意に定まる事実確認型の設問に偏り、研究全体の幅広い能力を捉えきれていませんでした。OpenAIはこの評価の隙間を埋めることを狙い、現役の科学者が日常的に使う作業工程を調査したうえで課題を組み立てています。

ベンチマーク750課題を含み、証拠の取り扱い、分析、設計と最適化、科学的推論、検証と運用、橋渡し研究など7つの工程と7つの生物分野にまたがります。課題の79%は複数の推論や意思決定の段階を要し、1課題あたり平均4段階に及びます。

課題は173人専門家が作成し、各自が博士号レベルの訓練とバイオ・製薬業界の経験を持ちます。受理された課題は平均6回の自動レビューと2回以上の専門家レビューを経ており、関連分野で90%以上の合意が得られたものだけが採用されました。

採点は課題ごとの詳細なルーブリックで行われ、全体で1万9020項目、1課題あたり平均25項目に分解されます。最終的な答えの正しさだけでなく、結論に至る過程が科学的に妥当で実務に役立つかまでを評価する設計です。

添付資料は図表やPDF、配列ファイルなど1062点に上り、半数超の課題が少なくとも1つの資料の解釈を求めます。実際の評価例ではFDA会議に向けた遺伝子治療データの批評など、現場で直面する難題がそのまま課題化されています。

米成人の16%のみAIに前向き、Pew調査

世論の警戒感

前向き評価はわずか16%
悪影響予想が約40%
進展が速すぎると63%
政府の規制に不信67%

利用実態

成人の49%がチャットボット利用
ChatGPT利用が44%へ倍増
若年層は利用多いが最も悲観

調査会社Pew Researchが2026年6月17日に公表した最新調査で、米国成人のうちAIが今後20年で社会に良い影響を与えると考える人はわずか16%にとどまることがわかりました。一方で約40%が悪影響を予想しており、AIが経済の中心へと急速に広がるなかでも、世論の評価は中立から否定寄りに傾いています。

懸念の中心は進展の速さです。回答者の63%がAIの進歩は速すぎると答え、企業が安全に開発すると信じる人は4割にとどまりました。さらに67%は、米政府がAIを実効的に規制するとは思わないと回答しており、制度面への不信も根強いことが浮き彫りになっています。

懐疑的な見方とは裏腹に、利用そのものは着実に拡大しています。チャットボットを少なくとも時々使う人は49%に達し、毎日使う人も約4分の1にのぼりました。なかでもOpenAIChatGPTは利用率が44%と2023年から倍増し、Gemini24%、Copilot17%、MetaAI14%が続いています。

注目すべきは、最も利用が進む若年層がもっとも悲観的だという点です。18〜29歳の66%がチャットボットを使う一方、48%は悪影響を予想し、良い影響を見込むのは14%にとどまりました。年齢が上がるほど利用は減りますが、否定的な見方も和らぐ傾向にあります。

用途は仕事や調べ物が中心で、約4割が業務でAIを使うと回答しました。生産性が上がると感じる人は30%、情報収集に役立つとする人は28%です。ただ約6割がAIによる検索要約を日常的に読む一方、過去調査では情報の不正確さへの懸念も根強く、利便性と信頼の間で揺れる利用者像が見えてきます。

形式検証でAI誤答防ぐ新興企業、27億円調達

調達の概要

Khosla主導の2700万ドル調達
Accelやインド勢も出資
創業者はRajagopalan氏

技術と狙い

LLMに決定論的検証層
数学証明言語LEANを応用
法務・創薬・税務に特化

AIスタートアップのPramaana Labsは6月17日、Khosla Venturesが主導するシードラウンドで2700万ドルを調達したと発表しました。Accel、BoldCap、Nexus Venture Partners、Premji Invest、Unboundも参加しています。同社は数学的形式化の手法を使い、AIの信頼性という課題の解決を目指します。

企業が実証実験を本格運用に移す際、AIの信頼性が最大の壁になっています。同社は法務、創薬、税務など誤りが高くつく分野に絞って展開する方針です。共同創業者でCEOのRanjan Rajagopalan氏は、これらの領域はルールが多く、形式化に向いていると説明します。

仕組みの中核は、通常のLLMの上に決定論的な検証層を重ねる構成です。LLMが自然言語の質問に柔軟に答え、その出力が正しいかを検証層が確認します。LLMと検証を組み合わせる手法自体は広がりつつありますが、同社の独自性は数学の証明検証に使うオープンソース言語LEANを応用する点にあります。

用途ごとに専門家が監修する形式検証システムを構築する計画です。税法では元IRS長官のDanny Werfel氏が、サイバーセキュリティ創薬ではIITデリー、IITマドラス、カリフォルニア大学バークレー校の教授が監修します。フランスが税・給付制度を実行可能なコードに落とし込んだCATALAプロジェクトという先行例も参考にしています。

Rajagopalan氏は「世界で最も難しい問題は解けないのではなく、形式化されていないだけだ」と語ります。健康や金銭、自由を左右する領域には必ずルールがあり、あとはそれをコード化すればよいという考えです。経営者にとっては、規制の厳しい業務へAIを導入する際の現実的な選択肢になり得ます。

SNS各社、AIでアルゴリズム調整権をユーザーへ開放

Threadsの新機能

「Your Algo」を6月16日公開
希望トピックを非公開設定
期間は1・3・7日から選択

Instagramの拡大

Instagram全画面に拡大
推薦理由をLLMで可視化

TikTokの制御

話題ごとにスライダー調整
AIキーワード自動フィルター

Metaは2026年6月16日、SNSのThreadsで、ユーザーが推薦アルゴリズムを自ら調整できる新機能「Your Algo」を公開しました。従来は各社の推薦アルゴリズムが表示内容を一方的に決めていましたが、ThreadsやInstagramTikTokは、AIを使って利用者自身がフィードを調整できる仕組みへと舵を切っています。一連の動きは、画一的なテレビ放送型から、好みに合わせて調整できるストリーミング型への転換を示すものです。

Threadsの「Your Algo」は、2月に登場した「Dear Algo」を発展させた機能です。Dear Algoは「ポッドキャストの投稿をもっと見せて」といった公開投稿で好みを伝える仕組みでしたが、新機能では同じ要望を非公開で設定できます。利用者は特定トピックを増減するよう指示でき、その要望を1日・3日・7日のいずれの期間有効にするかも選べます。

Instagramも6月初め、フィード全体でアルゴリズムを確認・制御できるツール「Your Algorithm」を投入しました。2025年12月にリール向けで始まった機能を、フィード・発見・リールの全領域に拡大したものです。設定画面では、アプリが推定した関心トピックが表示され、見たい内容を増減すると推薦が即座に変化します。

Instagram責任者のアダム・モセリ氏は、従来のランキングモデルは仕組みが利用者に不透明だったと指摘します。今後は大規模言語モデルが、なぜそのコンテンツが表示されたかを示し、利用者が好みを明確に伝えられるようにすることで、推薦システムをわかりやすくできると説明しています。

TikTokは2024年から、「For You」フィードを調整する「Manage Topics」を提供しています。スポーツや旅行、料理などのトピックごとにスライダーで表示量を増減できる仕組みです。2025年にはAIを使ったスマートキーワードフィルターを追加し、たとえば「remodeling」を除外すると「renovation」など類義語も自動で除外されるようになりました。

各社がこぞって制御権を手放す背景には、双方の利点があります。利用者にとっては関心に沿ったフィードが得られ、SNS各社にとっては最も消費されやすいコンテンツを表示することでエンゲージメント向上につながるからです。AIによる推薦の透明化は、プラットフォームと利用者の関係を見直す転換点となりそうです。

MetaがFacebook投稿基盤のAI検索、精度に課題

新機能の概要

Facebookアプリの新AI検索モード
公開投稿を横断して回答生成
InstagramリールやFacebookグループも参照
旅行や外出計画の支援を想定

実地検証の結果

地域の推薦はおおむね妥当
存在しない営業時間など誤情報も混在
誤情報の拡散誘導には強い耐性

米メディアThe Vergeの記者が2026年6月17日、Metaが導入したFacebookアプリの新検索機能「AIモード」を実地検証した記事を公開しました。同機能はFacebookInstagram公開投稿を横断的に参照し、複雑な質問に回答するもので、旅行や週末の過ごし方といった計画立案の支援を狙いとしています。Google検索のAIモードに類似する一方、地域コミュニティの投稿を情報源とする点が特徴です。

検証では基本的な推薦の精度は一定の水準にありました。「近場の夏の旅行先」という質問には、ホイッドビー島やレーニア山など妥当な候補を提示しています。ただしAI生成とみられる不正確な地図が混じるなど、情報源の質にはばらつきが見られました。

一方で具体的な質問では誤りが目立ちました。地域プールが週末休業すると案内したものの、引用元の投稿は実在せず、施設の公式サイトは営業を確認できたといいます。ミネアポリスの子ども向け施設を尋ねた際には、実際にはテキサス州にある店舗を近隣として推薦するなど、事実誤認(ハルシネーションが複数発生しました。

懸念されたFacebookならではのリスクについてはMetaへの評価が分かれます。記者がワクチンや選挙不正に関する偽情報を引き出そうと試みたものの、明確な誤情報の生成は確認できなかったと述べています。ただし議会襲撃の参加者を擁護する曖昧な回答を一度生成した点には注意が必要です。

経営者エンジニアにとって示唆的なのは、ユーザー生成コンテンツを基盤とするAI検索が抱える情報源の信頼性問題です。投稿データの活用は地域情報の鮮度という利点を持つ反面、出典の検証可能性が品質を左右します。実用に堪える水準へ到達できるかが、今後の普及を占う鍵となりそうです。

GoogleがGemini搭載スピーカーを6年ぶり投入

製品概要

価格99.99ドル
出荷6月25日
約6年ぶりの新型スピーカー

AI体験

自然言語での多段階指示
10種の新音声と双方向会話
ローカルモデルで雑音除去

課金と競争

上位機能は月10ドル課金
スマートスピーカー競争が再燃

Googleは6月17日、対話AI「Gemini」専用に設計した新型スマートスピーカー「Google Home Speaker」を発表し、予約受付を開始しました。価格は99.99ドルで、出荷は6月25日です。同社が独立型スマートスピーカーを出すのは2020年9月の「Nest Audio」以来およそ6年ぶりで、Geminiを家庭に持ち込む姿勢を最も明確に示す製品となります。

最大の特徴は、旧来のGoogleアシスタントに代わりGemini for Homeを搭載した点です。決まった命令文を覚える必要はなく、「寝室の照明以外を全部消して」といった指示や、照明の調光・音楽再生・タイマー設定を一度に伝える多段階の依頼も理解します。言い間違えても文の途中で訂正でき、ウェイクワードを繰り返さず追加の質問ができる「Continued Conversation」も全対応言語に広がりました。

ハードは横長だった旧Nest Audioより小型化し、設置しやすさを重視しています。バランスの取れた360度サウンドを備え、2台でステレオ化やGoogle TV Streamerと組み合わせた疑似サラウンドにも対応します。本体にはNPU内蔵の独自プロセッサーが載り、ローカルAIで背景雑音を抑えて聞き取り精度を高めるほか、MatterコントローラーやThreadルーターとして家庭内機器のハブにもなります。

一方で高度な機能の一部は有料です。月10ドル(年100ドル)の「Google Home Premium」に加入すると、自由に会話できる「Gemini Live」や、Nestカメラの映像を検索する機能、留守中の出来事を要約する「Home Briefs」が使えます。購入者には6カ月分が無料で付き、定着後の課金移行を狙う設計です。追加の月額負担に見合う価値があるかは、今後の利用実感が判断材料となります。

発表が当初予定の春からずれ込んだ背景について、同社製品責任者のアニッシュ・カトゥカラン氏は、Gemini for Homeの改善に時間を充てたと説明します。家庭機器やメディア操作の遅延を最大40%短縮し、2500件超の不具合を修正したといいます。早期アクセスでは20カ国・350万世帯超が利用し、利用頻度は旧アシスタントの約2倍に達しました。AppleSiriやスピーカーを刷新し、AmazonAlexa+を展開する中で、スマートスピーカー競争が再び熱を帯びています。

Odyssey、評価額1.45億ドルでAmazonら出資

資金調達の規模

シリーズBで3.1億ドル調達
評価額14.5億ドル到達
Natural Capitalが主導

出資陣とクラウド戦略

Amazon・AMD・GVが参加
AWSを優先クラウドに採用
Trainiumチップ向け最適化

創業者と世界モデル

自動運転出身者が創業
テキストから動画生成

世界モデルを開発する米新興企業Odysseyが、2026年6月17日、シリーズBで3億1000万ドルを調達したと発表しました。Natural Capitalが主導し、評価額14億5000万ドルに達しています。AmazonやAMD Ventures、GVなどが参加し、累計調達額は3億3700万ドルとなりました。

世界モデルは、テキストや対話を扱う大規模言語モデルの次に来るAI技術と位置づけられます。物理世界からデータを集め、正確な物理法則に基づいてシミュレーションする点が特徴です。Odysseyは、人が背中にカメラを背負って撮影するという、Google Earthに似た独自手法でデータを収集してきました。

2023年創業の同社は、ゲーム制作からロボティクスまで幅広い用途向けに複数の世界モデルを提供しています。なかでも、テキストプロンプトから豊かで双方向の動画を生成する技術で知られています。

今回の調達で、AmazonAWSの存在感が際立ちます。同社はAWSを優先クラウドプロバイダーとし、モデルをAWSTrainiumチップ向けに最適化する方針です。これはNvidiaのAIチップに対抗する動きと言えます。

創業陣の経歴も注目に値します。CEOのオリバー・キャメロン氏は自動運転新興企業VoyageをGM傘下のCruiseに売却した実績を持ち、CTOのジェフ・ホーク氏は英自動運転企業Wayveの出身です。自動運転由来の知見が、世界モデルのデータ収集手法に生かされています。

エンジェル投資家陣も豪華です。Jeff Dean氏やElad Gil氏、Garry Tan氏、Guillermo Rauch氏、Cruise創業者のKyle Vogt氏らが名を連ねています。AIの次の主戦場とされる世界モデルへ、有力な資本が集まり始めています。

DeepLがMixhalo買収 ライブ翻訳に進出

買収の概要

独翻訳大手DeepLがMixhalo買収
ライブ会場の音声配信技術を獲得
米サンフランシスコに新拠点開設

狙いと背景

音声翻訳製品の実演の場に活用
会議向けからイベント領域へ拡張
Mixhaloは既存のDeepL顧客

独翻訳大手のDeepLは6月17日、リアルタイム音声配信を手がける米新興企業Mixhaloを買収すると発表しました。狙いは、講演やパネル討論を多言語で同時配信するライブイベント向け翻訳の強化です。買収に伴いDeepLはサンフランシスコに拠点を開き、米国事業を拡大します。

Mixhaloは2016年設立で、累計3900万ドル超を調達してきました。当初はコンサート観客向けの音響改善を掲げ、その後スポーツやライブ会場のリアルタイム音声配信へと事業を広げています。出資元にはFortress InvestmentやFounders Fundなどが名を連ねます。

DeepLは長らくテキスト翻訳の主役でしたが、近年は音声製品に力を入れてきました。2024年に33言語超の音声からテキストへの翻訳を投入し、2026年4月には多言語会議を想定した音声から音声への翻訳を発表しています。Mixhaloの買収で、この製品群をライブイベント領域へと押し広げる構えです。

両社の接点は自然な形で生まれました。MixhaloはもともとDeepLを主要な翻訳基盤として使う長年の顧客で、CEOのVik Singh氏が顧客向け夕食会でDeepLのCTOと隣り合わせたことが対話の始まりだったといいます。会議向け音声や文書翻訳、ライブイベントにまたがる重なりが、話すほど明確になったと振り返ります。

Singh氏は、台頭する音声AIが直接の買収理由ではないとしつつ、モデル企業が巨大化すれば価格競争で不利になる懸念を示しました。DeepLのKutylowski CEOは、Mixhaloを製品であると同時にマーケティングの実例と位置づけ、会場で同社技術がどう動くかを示す場にすると語っています。競合にはWordly AIやPalabraがいます。

Genesis、人型でない汎用ロボEno発表

外見より能力

頭部や脚を持たない設計
車輪付き折り畳み式の土台
人の能力を基準に開発
単一作業でなく汎用を志向

投入計画

手は人の手と同形状で再現
2026年末に生産・顧客導入
製造・研究所・物流から開始

フランスの新興企業Genesis AIは2026年6月17日、汎用ロボット「Eno」を発表しました。元グーグルCEOのエリック・シュミット氏が支援する同社は、Enoを人間の見た目ではなく人間の能力を基準に設計したと説明しています。頭部や脚を持たず、車輪付きの土台の上でデッキチェアのように折り畳める姿も想定されるといいます。

同社は「人型ロボットは人間に似ている必要はない」との考えを示します。洗濯物を畳むといった単一作業向けの機械ではなく、完全な汎用ロボットを目指す点が特徴です。多様な現場で幅広い仕事をこなす設計思想が、独特な外観の理由となっています。

一方で、人間に近い要素も残しています。Enoの手は「人間の手の形状と機能に正確に一致する」よう設計され、人向けに作られた道具や物をそのまま扱えるとしています。新たに専用の環境や器具を用意せずに既存の作業へ入り込める狙いがうかがえます。

Genesisは2026年末までに生産と顧客向けの導入を始める計画です。まずは製造業・研究所・物流から着手し、その後に病院やホテル、一般消費者へと用途を広げる方針を示しています。同社は別形態のロボットも開発中だとしており、汎用ロボットの量産化に向けた競争が一段と熱を帯びそうです。

AI学習対価、音楽家に還元する技術が台頭

新興企業の動き

SureelをWarner Music買収
学習データ利用を追跡し課金
スウェーデンSTIM提携

技術的な課題

影響度の因果帰属が難点
報酬狙いの作品乱造リスク
懐疑論と簡易契約案も浮上

生成AIの学習データに使われた楽曲に、音楽家が継続的に対価を得る仕組みづくりが2026年に動き出しました。Warner Music買収した新興企業Sureelや、SoundVerseが、利用された創作物の対価を測定する技術を開発しています。録音やストリーミングと同じく「使われるほど報酬が増える」原則を、AI時代に再現する狙いです。

Sureelの仕組みは、楽曲などのデータに所有者が設定した指示を付与し、AI企業が学習で自由に使えるか、影響を制限するか、除外するかを指定できます。そのうえで実際の利用状況を追跡し、ライセンス料を算定します。同社はスウェーデンの著作権団体STIMと提携し、帰属レポートを基にした音楽家とAI企業の契約づくりを進めています。

SoundVerseは一回限りの買い取りを不十分だとし、創作者がAIの収益に継続参加する仕組みを提唱します。生成物がジャズ調ならジャズの学習データが、より大きく寄与したとみなし、出力ごとに各データへ差をつけて報酬を配分する考え方です。Sureel共同社長は「帰属は旧来の経済を再現するのではなく、近似でしかなかったものを初めて測ることだ」と語ります。

ただ技術的なハードルは高く、出力との表面的な類似度だけでなく、学習データと学習済みモデルの因果関係をどう測るかが核心になります。報酬を狙って既存の名曲を模倣した作品が量産され、本来の創作から収益をそらすという、悪用されやすい構造への懸念も残ります。

業界内には懐疑論もあります。SourceAudioのシルバースタイン氏は「帰属は一見明白な答えだがAIでは欠陥がある」とし、学習時点での価格を取り決める単純な交渉契約を支持します。実際、著作権訴訟は減り、Universal、Warnerと大手AI企業の間で、合意のうえモデルを学習する個別契約が増えています。

筆者は、いかに高度なアルゴリズムでも最後は人間の判断に委ねられると指摘します。だからこそ帰属の仕組みは監査可能で透明であるべきで、計算機科学や法律、経済の専門知が要るとします。さらに、大手AIへの課税と創作者への再分配もまた一つの「AI帰属戦略」だと結びます。

カナダ年金、印データセンターに1100億円投資

投資の概要

CPPが最大700億ルピー拠出
CtrlS株式8.2%を取得
ハイパースケール合弁設立

インド市場の加熱

米巨大企業の相次ぐ投資
AirTrunkが300億ドル表明
電力・水資源への懸念

カナダ最大の年金運用機関CPPインベストメンツは6月17日、インドデータセンター事業者CtrlSに最大700億ルピー(約7億4100万ドル)を投じると発表しました。世界の投資家がAIブームを支えるインフラへ資金を投入する中、クラウドとAI基盤の構築で存在感を増すインド市場に賭ける形です。

投資の内訳は、400億ルピー(約4億2300万ドル)でCtrlS株式の8.2%を取得し、残る最大300億ルピー(約3億1700万ドル)をハイパースケール拠点を開発する合弁会社に拠出するものです。合弁の出資比率はCtrlSが52%、CPPが48%となります。

2007年設立のCtrlSはハイデラバードを拠点に、インド国内で15を超えるデータセンターを運営しています。クラウド事業者や企業、そしてAIワークロードからの需要増に応えるため、設備を急速に拡張してきました。

インドはAIインフラ投資主要な投資として急浮上しています。アマゾンやグーグル、マイクロソフトOpenAIが相次いで投資を表明したほか、今月にはブラックストーン傘下のAirTrunkが300億ドルを投じて5ギガワット規模の能力を整備すると発表し、メタもリライアンスと提携しました。

背景には政府の後押しがあります。インド国内のデータセンターで処理する条件で、海外向けクラウドサービス2047年まで非課税とする優遇策などを打ち出し、デジタルインフラの世界的拠点を目指しています。一方で、独自のフロンティアAIモデル開発は遅れ、基盤技術の多くを米国企業に依存している点は課題です。

急速な建設ラッシュは電力と水資源への負荷を高めるとの指摘もあります。AIインフラ拠点を目指すインドの野心には、こうした環境面の制約がついて回ることになりそうです。

Anthropic、炭素除去FrontierにAI企業初参加

拠出の概要

新たな拠出枠9億1500万ドル
Frontier累計18億ドルへ倍増
純AI企業として初参加
Googleは創設メンバーで支援拡大

戦略転換

少数の大型案件へ集約
ギガトン級除去を選別基準
契約は8〜10年、最長2040年まで

AI大手のAnthropicは6月17日、炭素除去の共同調達枠組みFrontierへ参加すると発表しました。新設された9億1500万ドル規模の拠出枠に資金を投じ、純粋なAI企業として初めて同連合に加わります。これによりFrontierへの累計拠出額はほぼ倍増し、18億ドルに達しました。

Frontierは2022年にStripeGoogle、Shopifyらが立ち上げた事前購入の仕組みです。各社が掲げる排出ゼロ目標のうち、航空など現時点で削減しきれない排出を炭素除去クレジットで相殺する狙いがあります。これまでに50超のプロジェクトと約7億ドルを契約し、180万トンの炭素除去を進めてきました。

今回はGoogleも創設メンバーとして支援を拡大し、岩石風化の促進やバイオマス由来の除去など長期的な技術への投資を継続します。一方でAnthropicにとっては初の気候関連の取り組みであり、同社はまだ持続可能性報告書を出していません。エネルギー調達では「あらゆる選択肢」を重視する姿勢を示してきただけに、今回の参加は社内の意識変化を映す可能性があります。

Frontierは資金配分の方針も転換します。今後は審査を厳しくし、年間でギガトン級、つまり10億トン規模のCO2を除去できる見込みの高い案件に絞り込む方針です。新規契約の期間は8〜10年とし、最長で2040年まで結ぶとしています。これは最大の購入者であるMicrosoftが少数の大型案件へ移行している動きとも重なります。

ただし企業側は市場を永続的に支え続けるつもりはないと明確にしています。新規契約では除去事業者に対し「政府の補助や支援につながる道筋」を示すよう求めており、最終的な負担は各国政府に移ると見込んでいます。国連IPCCは炭素除去技術がネットゼロ達成に不可欠だとしており、民間が築いた市場をいかに公的支援へ引き継ぐかが次の焦点になりそうです。

Pinterest、対話型AIショッピングアプリを試験公開

新アプリの狙い

対話型の商品発見を試験
独自データ「Taste Graph」を活用
本体アプリと分離して実験
保存済みピンで回答を個別化

広告主向け施策

広告管理にAIアシスタント導入
クリエイティブ最適化AIを世界展開
MCP対応で外部ツール連携

Pinterestは6月17日、対話型のショッピング体験を探る実験的アプリ「Ask Pinterest」を限定公開しました。自然言語で質問すると、同社が保有する利用者の興味や好みのデータ「Taste Graph」を使い、個別化した商品提案やヒントを返す仕組みです。将来は本体アプリへの統合も視野に入れています。

発表は、広告業界の年次イベント「Cannes Lions」の直前に行われました。今年のテーマはAIが広告主やマーケターをどう支援できるかで、Pinterestもこの流れに合わせて複数のAI施策を打ち出した形です。

Ask Pinterestは、従来の検索では扱いにくい複雑な質問や複数段階の相談に対応します。たとえばディナーパーティーの計画や、時間をかけた部屋の模様替えといった用途を想定し、セッションをまたいで文脈を保持する点が特徴です。サインインすれば、利用者自身が保存したピンやボードも回答に反映されます。

背景には、AIチャットボットが従来の検索エンジンと利用者の注目を奪い合う構図があります。GoogleはAIで買い物支援を進め、ChatGPTMeta、Shopifyもエージェント型のショッピングを試しており、Pinterestもこの競争に独自データで参入します。同社は外部へのライセンス提供よりも、自社データで自前のAIを鍛える戦略を取ってきました。

広告主向けには、米国のAds Manager上でベータ版のAIアシスタントを導入したほか、最も成果が出やすい広告素材を自動で選ぶ「Performance+ creative」を世界展開しました。さらにModel Context Protocol(MCPの基盤を整え、第三者のエージェントツールから標準的な形でキャンペーンを管理できるようにします。最高事業責任者のLee Brown氏は、今後の発見は「キーワードだけでなく、文脈や好み、信頼できる推薦に形作られる」と述べ、ここに自社の強みがあると語りました。

Google、米大学のGemini導入事例を公開

無償の安全策

Gemini for Educationを無償提供
データは学習・広告不使用
リスクデータの保護も対応

人材育成と研究

教員向け研修教材を整備
生成AI講座を一般無償公開
助成金執筆を24時間支援
学生主導のアプリ開発も活発

Googleは6月17日、米国の複数の大学が同社のAIツールを導入している事例を自社ブログで公開しました。Gemini for EducationNotebookLMを活用し、データ保護を前提に学内研修や研究支援を進めている点が特徴です。AIを学ぶ学生と教職員の準備を後押しする狙いがあります。

中心となるのはデータ保護です。Gemini for Educationは企業水準のデータ保護を無償で提供し、利用データはモデル学習や広告配信に使われません。バージニア工科大では高リスクデータでの利用も承認され、UCリバーサイドは独自のAIアシスタント「The Grove」を立ち上げています。

人材育成の取り組みも広がっています。ケース・ウェスタン・リザーブ大は学内全体にGeminiを展開し、会議やオンライン教材で職員研修を実施。インディアナ大は看板講座「GenAI 101」を一般向けに無償公開し、学外の学習者にも門戸を開きました。

研究現場でも活用が進みます。アルバータ大ではGeminiを使った専用ツールが教員の研究助成金の執筆を24時間支援。ニューヨーク大のハッカソンでは、学生が花粉や天候データから健康的な歩行ルートを薦めるアプリを開発しました。

Googleは今後も、データ保護を備えたツールの無償提供と教育者向け研修を通じ、大学のAI導入を安全に進める方針です。経営者やリーダーにとっても、機密データを守りながらAIを全社展開する際の実践的な参考事例といえます。

スマホ依存に反発、スロウテック市場が拡大

再評価される旧機種

iPod Shuffle再注目
中古端末市場の成長
フィットネス端末88%増
若年層に支持拡大

脱・常時接続の動き

米成人53%が削減希望
意図的な摩擦の価値
AIで時間を取り戻す発想

米国でスマホ依存からの脱却を目指す「スロウテック」と呼ばれる消費トレンドが2026年6月、TechCrunchの報道で改めて注目を集めています。中古端末販売のBack Marketが、画面を持たないiPod Shuffleの広告をニューヨークの地下鉄に出すなど、あえて機能を絞った旧世代機器が若年層を中心に支持を広げています。背景には、アプリやアルゴリズムが生活のあらゆる場面を仲介する常時接続への疲労があります。

iPodの生みの親として知られるトニー・ファデル氏は、自身が20年以上前に設計した端末の広告を駅で目にし驚いたと語ります。Back MarketのCMOジョイ・ハワード氏は、これまでの「ファストテック」が摩擦の排除を追求してきたのに対し、いまや人々は摩擦をむしろ自分を守る機能として歓迎していると指摘します。米国の成人の約53%がスクリーンタイムを減らしたいと答えているとのデータも紹介されています。

この動きは単なる懐古ではなく、ビジネスの数字にも表れています。市場調査会社Circanaによると、米国のフィットネストラッカー支出は前年比88%増となり、画面のないOura ringやWhoopが売上を牽引しました。中古市場やフリップフォン、e-ink端末のLight Phoneなど、注意を奪わない製品への需要が静かに高まっています。

一方で、完全な「ダムフォン」への移行には限界もあります。スクリーンタイム削減アプリMOQAを開発するオースティン・マレー氏は、銀行取引やホテルのチェックインなど、スマホ前提の社会では端末を手放すのは難しいと述べます。多くの消費者は極端な乗り換えではなく、スマホを使いながら利用時間を減らす中間的な手段を選んでいます。

注目すべきは、AIがこの潮流の両義的な存在である点です。AIは「ファストテック」の象徴である一方、ユーザーに代わって作業をこなし画面から離れる時間を生む道具にもなり得ます。159ドルのAIしおり「Mark」や、サポート終了したハードを再生する事例など、AIで自分の時間と主導権を取り戻そうとする使われ方が現れています。経営者エンジニアにとって、利便性と注意力のどちらを設計の軸に置くかが、今後の製品づくりの論点になりそうです。

Snap、2195ドルのARメガネ発表で株価下落

発表と市場反応

新ARメガネSpecsを披露
想定価格は約2195ドル
発表後に株価5%超下落
過去1年で株価3割安

高価格への賛否

CEOは「高性能PC並み」と説明
主力客の10代に手が届かず
重さ最大136gで装用に難

Snapは6月17日、長年開発してきたARメガネ「Specs」を披露しましたが、市場の反応は厳しいものでした。想定小売価格は約2195ドルと高額で、発表翌日に株価は5%超下げ、火曜の5.86ドルから水曜朝には4.83ドルまで落ち込みました。Snap株はこの1年で3割下落しており、今回の発表後も発表前の水準を回復できていません。

価格への懸念が市場で広がっています。Snapの主力ユーザーは10代であり、2000ドル超の端末を買える層とは言い難いためです。エバン・シュピーゲルCEOはCNBCのインタビューで自ら同製品を着用し、価格を問われると「Specsはコンピューターと捉えるのが最も重要で、高性能なノートPCと同等の価格だ」と正当化しました。

シュピーゲル氏はSpecsの市場での立ち位置も強調しました。低価格だが処理能力の低いMetaのRay-Ban型と、高性能だが大型で高額なApple Vision Proの中間に位置し、「装用しやすく、没入型コンピューティングに極めて高い能力を持つ」製品だと説明しています。スマホ依存から人々を解放し、「コンピューティングを世界に持ち込み、より人間的にする」狙いだといいます。

一方で、デザインと装着感への批判は根強いものがあります。フレームは分厚く角張ったアビエーター風で、腕の部分も大きく重い印象です。47mm版で132g、52mm版で136gと、一般的なスマートグラスの40〜70gの倍近い重さで、長時間の装用は難しいとの指摘が出ています。視力矯正が必要な人にとっては主用メガネにはなりにくく、2195ドルを払って予備のメガネを持つ形になりかねません。

Snap自身もこの製品が大衆向けの大ヒット商品にはなりにくいと自覚しているとみられます。だからこそ高級ファッション路線を前面に出し、ヴォーグなどで知られる写真家スティーブン・マイゼルを起用した広告で、カイア・ガーバーらの著名モデルを起用しました。狙いはアーリーアダプターであり、次世代以降でより一般受けする製品につなげる戦略だと考えられます。スマートグラス市場の競争が熱を帯びる中、好機を逃さない構えです。

セコイア元代表ボサ氏、IPO直後のスペースXの取締役に

取締役就任の概要

スペースX取締役会に就任
監査委員会にも加わる
取締役は計9人体制に
次回株主総会まで任期

背景と人脈

セコイアマネージングパートナー
マスク氏とは25年来の関係
史上最大IPO直後の人事

セコイア・キャピタル元マネージングパートナーのローロフ・ボサ氏が、スペースXの取締役会に加わります。同社が史上最大の新規株式公開(IPO)を実施してから1週間も経たないタイミングでの就任で、6月17日に米証券取引委員会(SEC)への提出書類で明らかにされました。監査委員会にも参加します。

スペースXは提出書類で、ボサ氏が「取締役会の既存の空席を埋めるため」に選任されたと説明しています。同氏は数多くの上場企業の取締役や監査委員を務めてきた経験を持ち、上場企業としての豊富な知見を備えていると評価されました。任期は次回の年次株主総会までとされています。

今回の人事で注目されるのは、ボサ氏とイーロン・マスク氏の25年以上に及ぶ関係です。マスク氏は2000年、南アフリカ出身という共通点を持つボサ氏をペイパルの財務部門責任者として迎え入れました。ボサ氏は「彼は米国で私に最初に仕事を提供してくれた人物だ」と過去のインタビューで語っています。

ただしスペースXの取締役会は、他の上場企業とは性質が大きく異なります。マスク氏が議決権の80%超を握り、株主が経営に異議を唱える余地はほとんどありません。取締役会の構成変更もマスク氏が支配しており、株主の権限は限定的です。

ボサ氏の加入で取締役は9人となり、マスク氏の側近らが顔を揃えます。提出書類では、ボサ氏の家族が2025年1月からスペースXのエンタープライズ運営チームに在籍し、報酬が12万ドルの開示基準を超えていることも明かされました。セコイアは2019年にスペースX投資し、IPO直前時点で約1.5%の株式を保有していたとされます。