OpenAI、医療AIを無料版にも拡大

ChatGPT医療強化

週2億3千万人が健康相談
GPT-5.5 Instantを無料提供
上位思考モデル並みの精度
誤情報の指摘が71%減

希少疾患の診断支援

未解決376例を再解析
新たに18件の診断確定
診断率4.8%上乗せ
AIは仮説提示に限定

OpenAIは6月18日、対話AI「ChatGPT」の健康分野の能力を大幅に高めたと発表しました。新モデル「GPT-5.5 Instant」を全ての無料利用者に提供し、緊急受診の必要性の判断や不確実性の説明、複雑な情報の平易化を改善。週に2億3千万人が利用する健康相談で、上位の思考型モデルに匹敵する精度を実現したとしています。

進歩を支えるのは医師主導の評価です。OpenAIは60カ国260人超の医師と連携し、これまでに70万件超の応答例を検証してきました。医師が書いた回答とモデルの回答を比較した3500件の評価では、GPT-5.5 Instantが正確性や完全性などで医師や旧モデルを上回る評価を得たといいます。

実運用の効果も数字に表れています。プライバシーに配慮した監視で本番トラフィックを追跡したところ、健康分野の応答で事実性に関する問題が指摘された割合は、直近2カ月で71%低下しました。週あたり数十億件のメッセージを対象にした比較で、改善が裏付けられた形です。

同じ6月18日、OpenAI医療研究の成果も公表しました。ボストン小児病院やハーバード大学との共同研究で、推論モデル「o3 Deep Research」を使い、これまで未解決だった376例の遺伝性希少疾患を再解析。専門家の確認と追加検査を経て、新たに18件の診断が確定し、4.8%の診断率上乗せにつながりました。

希少疾患は遺伝子検査をしても約半数が診断に至らず、手がかりが膨大な変異情報や断片的な記録に埋もれがちです。研究ではモデルを既存の解析基盤の上に置く説明優先の推論として設計し、臨床所見や遺伝形式、変異の証拠、文献を結び付けて人間が検証できる根拠を示させました。

ただしモデルは診断や臨床判断を一切行いません。あくまで証拠に紐づく仮説を提示し、専門家がACMG/AMPの基準で評価し、CLIA認証検査機関が確認して初めて診断と認められます。AIは医師の判断を置き換えるのではなく、知識が更新され続ける希少疾患の再解析を拡張可能にする役割を担うといえるでしょう。

Copilot等の脆弱性で企業AIの信頼境界欠如が露呈

相次ぐ脆弱性

Copilotメール窃取連鎖
LiteLLMでCVSS9.9の権限昇格
Langflowで遠隔コード実行
供給網汚染の自己増殖ワーム

共通の根本原因

外部入力への信頼境界不在
AIエージェント権限統治欠如
対策はプラミングの問題

6月中旬、企業向けAIツールで同種の脆弱性が相次いで公表されました。15日にVaronisがMicrosoft Copilotのデータ窃取実証コードSearchLeakを、その4日前にはObsidian SecurityがAIゲートウェイLiteLLMの権限昇格連鎖を開示しています。共通する原因はただ一つ、企業AIが外部入力を信頼境界なしに受け入れる構造的欠陥です。

SearchLeakは、細工されたmicrosoft.comのURLをクリックさせるだけで、Copilotが利用者のメールボックスを検索し、Bing経由でデータを外部へ送り出す連鎖攻撃です。URLのパラメータがLLMへの指示として渡り、出力の無害化処理より先に画像タグが発火する競合状態を突きます。これはVaronisが12か月で確認した3例目Copilot窃取連鎖であり、企業版は利用者の全権限を継承するため影響範囲が広がります。

LiteLLMはOpenAIAnthropicなど複数プロバイダーの鍵を1つのプロキシ裏に保持します。Obsidianの連鎖は権限検証の不備を突いて管理者へ昇格し、サンドボックスを脱出して遠隔コード実行に至り、評価値はCVSS9.9でした。別のコマンド注入欠陥CVE-2026-42271はCISAの悪用既知リストに載り、6月22日が修正期限に設定されています。

同じ境界の崩壊はLangflowやnpmを狙うMini Shai-Huludワームでも確認され、4チームが4ツールで同一の運用上の失敗を証明しました。市場もこのリスクを織り込み始めており、CrowdStrikeのAI検知防御製品AIDRは年間経常収益が前四半期比250%超伸び、6月17日にはAWSのBedrockなどへ対象を拡大しています。

実務家も同じ問題を平易な言葉で指摘します。American Express GBTのCISOは「これは新しい影のIT、いわばシャドーAIだ」と語り、NIST枠組みなど基礎の徹底を導入前の前提に置きます。Enkrypt AIのMerritt Baer氏は「企業が承認したのはインターフェースであって奥のシステムではなく、リスクはモデルとデータをつなぐ接合部に潜む」と構造を言い当てました。

記事は対策として、各脆弱性をCVEや市場シグナルに対応づけ、検証コマンドと経営層向けの一文まで添えた5項目の信頼境界監査を提示します。これらはフロンティアモデルの問題ではなく、ゲートウェイ認証層といった配管の問題だと結論づけます。問われるのはベンダーが修正するかどうかではなく、攻撃者より先に自社が欠陥を見つけられるかどうかです。

Anthropic、輸出規制で最新モデル停止

規制発動の経緯

Fable 5へ輸出規制発動
外国籍利用の全面禁止
Anthropicが両モデル停止
90分の停止通告
Amazon発の脱獄懸念

業界への波紋

場当たり的な規制運用
事実上の認可制移行
他社へ広がる警戒感

トランプ政権は6月、AI大手Anthropicに対し最新モデル「Claude Mythos」と「Fable 5」への輸出規制を発動しました。外国籍の利用を全面的に禁じる内容で、社内研究者やAppleMetaなど顧客企業も利用できなくなり、Anthropicは両モデルを停止せざるを得ませんでした。発動から1週間が経っても、両者は復旧の条件で対立したままです。

発端はAmazonの研究者が見つけたとされる脱獄の懸念でした。Andy Jassy最高経営責任者がScott Bessent財務長官にこの懸念を伝えたことで政権が反応し、Anthropicに「90分以内の停止」を通告したと報じられています。Anthropicは詳細の説明を求めましたが、政権は猶予を与えませんでした。

政権側はAnthropicが無謀だったと主張し、同社は具体的な規則違反はないとの立場です。専門家は、規制をほとんど整えてこなかった政権が、現実のAI能力に直面し場当たり的に対応していると指摘します。当初は中国との関係懸念、後には大統領令違反など、政権の説明は日々変わっています。

皮肉にも、政権は守ろうとしたはずの技術革新を自ら妨げる形になりました。問題の脆弱性OpenAIの「GPT-5.5」など他社モデルでも再現可能とされ、なぜAnthropicだけが標的になったのかという疑問が業界に広がっています。背景には、軍事利用を巡る対立など、政権との根深い信頼関係の崩れがあるとの見方もあります。

今回の混乱は、AI規制が「無法地帯」に入ったことを示しています。先月の大統領令は任意の事前審査制度を定めていましたが、今回の対応で事実上の認可制が生まれたと元政権高官は語ります。他のAI企業も同様の事態を避けようと、政権への事前通知や早期アクセス提供に動き始めました。

経営者にとっての教訓は明確です。AIを巡る規制は予測しづらく、企業は政治リスクを事業計画に組み込む必要が出てきました。実際に海外企業との予備契約を結ぶ動きも出ており、米国AIの先行きへの不透明感が広がっています。明確で一貫した規制の枠組みづくりが、改めて問われています。

Anthropic、Opus 4.7が自律でロボット犬を操作

実験の概要

off-the-shelf製ロボットを使用
人間の補助なしで自律操作
Claude Code3試行を実施

性能と限界

最速人間チームの約20倍速
生成コード量は約10分の1
ボール回収の精密制御は失敗
物理エージェントAIの幕開け

AI開発企業のAnthropicは6月18日、社内のFrontier Red Teamによる検証「Project Fetch」の第2フェーズの結果を公開しました。市販のロボット犬を題材に、最新モデルClaude Opus 4.7が人間の補助なしでセンサー接続や制御プログラム作成といった作業を自律的にこなせるかを検証したものです。2025年8月の初回実験では人間チームを支援する役割にとどまっていたAIが、今回は単独で課題に挑みました。

結果は顕著でした。完了した全課題でOpus 4.7は最速の人間チームより少なくとも10倍以上速く、平均では約20倍の速度を記録しました。両方の人間チームが達成した4課題に絞ると、Claude非搭載チームの37倍超、Claude支援チームの18倍超という差がつきました。

効率の高さはコード量にも表れています。Opus 4.7は人間チームと同等以上の成功を収めながら、生成コードは約10分の1にとどまりました。多くのコードが一発で機能し、センサー接続でも最適な手法を即座に選び取ったといいます。一方で、旧式の物体検出アルゴリズムを初期選択するなどの不完全さも残りました。

ただしAIがロボティクスを克服したわけではありません。ビーチボールを正確に押し戻す「フェッチ」の核心部分では、ボールの位置を見て次の動きを微調整する閉ループの精密制御に苦戦し、人間同様に失敗しました。この最終課題は、ロボティクス経験のある研究者が別途プログラムで達成しています。

同社はこの進歩がロボット能力の向上を狙った成果ではなく、より一般的なスケーリングから自然に生まれたものだと強調しています。AIが既存のソフト編集ツールを使いこなしてエージェントコーディングへ移行したように、今や市販の物理ツールも比較的容易に扱える世界に近づいているとし、物理的なエージェントAIの初期段階に入りつつあると結論づけました。

AI最適化Arbor、Codexら2.5倍上回る

性能の成果

検証可能な改善が2.5倍以上
検索精度45%→67%
既存エージェント50%台で停滞
MLE-Bench Liteで最高成績

仕組み

仮説を木構造で蓄積学習
司令役と実行役の役割分離
テスト合格時のみ統合するマージゲート

中国人民大学とMicrosoft Researchの研究者は、AIシステムの自律最適化を担う新フレームワークArborを発表しました。試行錯誤の繰り返しを、過去の失敗から学んで改善を積み上げる累積的な学習プロセスへと引き上げる狙いです。実環境のエンジニアリング課題で、同じ計算資源のもとCodexClaude Codeの2.5倍以上の検証可能な性能向上を実現しました。

従来のコーディングAIは各試行を独立して扱い、得た知見が会話履歴に埋もれて失われる弱点がありました。タスクが数百ターンに及ぶと文脈の上限を超え、初期の失敗で行き詰まるか、評価のぶれに振り回されてしまいます。複数の研究方針を同時に保持し比較する仕組みも欠いていました。

Arborは戦略立案と実装作業を分けて解決します。コーディネーターと呼ぶ司令役が仮説と方針を管理し、自身はコードを直接編集しません。実際の実装と評価は短命のエグゼキューターが担い、独立したgitワークツリー上で一つの仮説だけを検証して結果を報告します。

中核となるのが仮説ツリー精緻化(HTR)です。仮説・成果物・事実証拠・抽出した洞察を結びつけた節点を枝分かれさせ、失敗した実験は負の制約として記録します。これにより同じ誤りの反復を防ぎ、複数の競合する方針を安全に並行探索できます。

過剰適合を防ぐため、HTRは厳格なマージゲートを設けます。開発スコアが高くても、別の評価データで実際に改善が確認できなければ統合しません。検索エージェント課題では精度を45.33%から67.67%へ高め、50%台で止まったCodexClaude Codeを大きく上回りました。

企業のAI活用では、複雑な実システムの継続的改善を自動化できる点が直接の価値となります。あなたの開発チームが抱える最適化のボトルネックも、こうした構造化された記憶を持つ手法で解きほぐせるかもしれません。

Adobeが主要制作アプリにAIエージェント搭載

対応アプリと役割

Premiere・Photoshop等に公開ベータ
アプリ別の専門エージェント
退屈な準備作業の自動化

Fireflyの新機能

再利用素材ライブラリElements
文脈記憶層のProjects
ブランドキットの自動生成

企業向けの位置づけ

最終判断は人間の手に
他社AI基盤との連携

Adobeは2026年6月18日、主力ソフト群Creative CloudにAIエージェントを組み込むと発表しました。Premiere Pro、Photoshop、Illustrator、InDesign、Frame.ioで公開ベータが同日始まり、自然言語の指示から複数工程の制作作業を実行します。従来の生成AIが画像を出すだけだったのに対し、今回は各アプリのAPIを直接操作するオーケストレーション層として動く点が新しさです。

各アプリには役割特化型の専門エージェントが用意されました。Premiereでは素材の自動仕分けやクリップの一括改名、Illustratorでは表計算データから50通りの版を生成したり印刷前の色モード確認を行います。PhotoshopやInDesignは背景の一括除去やレイアウト全体へのブランド更新を担い、いずれも退屈な定型作業を肩代わりする設計です。

生成AIスタジオFireflyも刷新されました。新機能Elementsはキャラクターや背景に名前を付けて保存し、再利用することで生成の見た目を統一します。もう一つのProjectsは素材や生成履歴、文脈をまとめて保持する記憶層で、作業の続きから再開できます。ロゴや配色を含むブランドキットの自動生成も加わりました。

Adobeはこの仕組みを、人間をクリエイティブディレクターに据える発想だと説明します。同社のデビッド・ワドワニ氏は、制作者が自らの判断に集中できるようにすると述べました。調査では創作者の85%が最終判断は人間の手に残すべきだと答えており、自律的な創作ではなく運用支援としてのAIが受け入れられています。

エージェントOpenAIChatGPTAnthropicClaudeMicrosoft 365 Copilotなど外部基盤にも順次連携し、GoogleGeminiSlackへの対応も予定されます。一方で経営層には注意点も残ります。Adobeの独自APIに依存する商用SaaSのため、利用には有効なCreative Cloud契約が必要で、APIの外部公開やMCP対応の有無、データの保管場所はまだ明らかにされていません。

HuggingFaceがLoRA超え検証、最適手法は用途次第

LoRA一強の現状

モデルカードの98.4%LoRA
画像生成でも95%占有
人気が自己強化する構図

公平な比較基盤

同条件で40以上の手法を評価
論文の自社有利な比較を回避
VRAM・忘却・速度も計測

用途別の最適解

画像生成ではOFTが上回る
config一行で手法切替

米AI企業のHugging Faceは2026年6月18日、自社ブログでパラメータ効率の良い微調整手法(PEFT)の比較検証結果を公表しました。広く使われるLoRAが本当に最適かを同社の標準ライブラリで検証し、用途によっては他手法が上回ると結論づけています。経営者エンジニアが開いたモデルを自社データで調整する際の指針となる内容です。

PEFTは、モデル全体を何度も載せる必要がある微調整のメモリ負荷を大幅に下げる技術群です。少ないメモリで量子化モデルも調整でき、チェックポイントが小さく、既存知識を忘れにくい利点があります。同社が開発するPEFTライブラリは、多数の手法を統一APIで扱える点が特徴です。

LoRAは早期に登場し効果が高かったため、現在は圧倒的な普及率を誇ります。同社の調査では、PEFT手法を一つだけ挙げたモデルカードの98.4%LoRAで、画像生成のチェックポイントでも約95%を占めました。ただしこれは性能の証明ではなく、解説や周辺対応の充実が人気を呼ぶ自己強化の可能性も指摘しています。

論文に基づく手法選びには問題があると同社は警告します。研究者は既存指標を超える結果を出す圧力にさらされ、比較対象や評価基準も論文ごとに異なるため、再現が難しいのです。実際、学習率の調整だけでLoRAが他手法に並ぶという研究もあります。

そこで同社は同一の基盤モデル・データ・ハードウェアで全手法を評価する基準を整備しました。数学データセットでの推論学習と、猫のぬいぐるみという新概念を学ぶ画像生成の二つを用意し、テスト性能に加えVRAM使用量や忘却、実行時間、チェックポイント容量まで追跡しています。

結果として、数学課題ではLoRAが性能とメモリの均衡点に位置する一方、画像生成ではOFTが高い類似度と低メモリで上回りました。同社は、LoRAが悪い選択ではないものの自動的な既定にすべきではなく、config一行で手法を切り替えて自分の用途に最適な手法を試すよう促しています。

Amazon、自社AIチップを外販しNvidiaに挑む

外販方針の転換

Trainium外販を協議中
Jassy書簡が起点
年商500億ドル規模見込み
従来は外販拒否の姿勢

Nvidiaとの競争

Nvidia3260億ドル規模
Intel並みの売上水準
TSMC争奪が課題

Amazon傘下のAWSが2026年6月18日、自社開発のAIチップ「Trainium」を他社のデータセンター向けに外販する協議を進めていると明らかにしました。AI責任者のピーター・デサンティス氏がBloombergに語ったもので、買い手企業名は明かしていません。Nvidiaが圧倒的に支配するAIチップ市場への、これまでで最大級の挑戦となる可能性があります。

外販構想の起点は、Jassy最高経営責任者が4月の株主向け書簡で示した発言です。同氏はチップ事業が単独なら年商約500億ドルに達するとし、需要の高さから「将来は第三者にラックごと販売する可能性が高い」と述べました。AWS広報も外販の可能性を認めています。

もっとも、AWSはこれまで外販に慎重でした。理由はチップ自体の収益に加え、ストレージやセキュリティネットワークなど周辺サービスでも課金できる「滝のような」収益構造があるためです。自社クラウドで使わせる方が利益は厚くなります。

供給面の制約も重くのしかかります。現行Trainiumは即時完売し、1年以上先のTrainium4も予約で埋まりました。外販には既存顧客を待たせるか、TSMCで増産する必要がありますが、同社最大の顧客となったNvidiaを押しのけねばなりません。

500億ドル規模は、売上が3260億ドル規模で推移するNvidiaを揺るがすほどではなく、Intelの年商に近い水準です。それでもNvidiaのフアン氏がCPU市場へ拡大する一方、JassyはAIチップNvidiaの牙城により深く食い込む構えを見せています。

GitHub、低品質プルリク氾濫を抑える上限機能を導入

機能の仕組み

書き込み権限なしユーザーへの上限設定
上限到達で新規作成前にクローズ必須
Copilot等AIのPRも上限対象
下書きPRは上限の対象外
信頼貢献者はバイパス可能

背景と狙い

月間PRが3.6倍に急増
AIによる量産で審査負担増大
貢献者の自己選別を促進

今後の展開

低品質PRのアーカイブ機能
Issue数の上限制御
信頼シグナルによる自動緩和

GitHubは2026年6月18日、リポジトリ単位で開かれたままのプルリクエスト数に上限を設定できる新機能を発表しました。書き込み権限を持たない利用者を対象に、上限に達した場合は既存のPRをクローズまたはマージしなければ新規作成できなくなる仕組みです。オープンソースに押し寄せる低品質な投稿の氾濫を抑え、価値ある貢献を見つけやすくすることが狙いです。

この機能の特徴は、CopilotなどのAIエージェントが作成したPRも上限に算入される点にあります。一方で下書き状態のPRは対象外とされ、信頼できる貢献者はバイパスリストに登録すれば上限を免除されます。GitHubには従来から一時的なクールダウンを課す制限機能がありましたが、今回の上限は恒久的で設定可能な点が異なります。

背景には開発エコシステムの急変があります。2023年1月には月間約2500万件だったマージ済みPRが、現在は9000万件超へと約3.6倍に膨らみました。作成のコストが審査のコストを大きく下回り、善意の投稿であっても一人の管理者が処理しきれない量に達しているのです。

上限の導入は貢献者の行動も変えると同社は説明します。数件しか同時に開けないとなれば、貢献者はどの変更を審査に出すか優先順位を自ら判断するようになります。AutoGPTやHomebrew、OpenClawの管理者からは、審査意欲の回復やスパム対策の負担軽減につながったとの評価が寄せられています。

GitHubは今回を第一歩と位置づけ、さらなる管理機能を予告しました。低品質なPRを一覧から隠すアーカイブ機能、Issueへの同様の上限、過去のマージ実績やアカウント年齢などの信号で自動的に制限を緩める仕組み、複数リポジトリにまたがる投稿への対策などを順次検討・開発中としています。

リサーチAIの検索ログから機密漏洩、新手法で大幅抑制

モザイク漏洩の脅威

検索クエリ経由の情報漏洩
断片の組み合わせで機密復元
観測対象は外部クエリ履歴のみ

性能と機密の対立

性能向上訓練で漏洩悪化
禁止指示の効果は限定的
ベンチマークは1001連鎖

新手法PA-DRの成果

強連鎖成功率58.7%
漏洩を34%から9.9%

ServiceNowとHugging Faceの研究チームは6月18日、ディープリサーチAIが外部検索を通じて社内機密を漏らす危険を測る新ベンチマークMosaicLeaksを公開しました。社内文書とWeb検索を併用するAIは、一見無害なクエリを重ねるうちに、断片を統合すれば機密が復元できるモザイク効果を招きます。攻撃者は検索ログだけから企業情報を推測できる点が核心です。

漏洩は三段階で測定されます。検索ログから調査の意図を推測する意図漏洩、ログに基づき機密の質問へ回答できる答え漏洩、そして何を探すか指示されずとも真の機密を述べられる完全情報漏洩です。後者ほど深刻で、観測者が能動的に機密事実を発見できる状態を意味します。

ベンチマークは社内文書とWeb文書をまたぐ1001件の多段推論連鎖で構成されます。各連鎖では前段の回答が次段の橋渡し情報となり、AIは社内情報を取得しなければ次のWeb検索を組めない設計です。漏洩を誘発しやすい一方、漏らさずに解くことも可能な課題が狙いとされています。

検証では、AIに検索性能だけを学習させると逆効果が生じました。強連鎖成功率は48.7%から59.3%へ上がった一方、答えや完全情報の漏洩は34.0%から51.7%へ悪化したのです。より多くの文脈を検索文に詰める挙動が、性能には寄与しつつ機密保護を損なう構図が浮かび上がりました。

そこで提案されたのが、機密配慮型の強化学習手法PA-DRです。段階ごとの状況報酬と、クエリの漏洩リスクを推定する学習済み報酬を組み合わせ、ログを露見させた計画判断に的確に罰を与えます。結果、強連鎖成功率を58.7%とほぼ維持しつつ、漏洩9.9%まで削減しました。

注目すべきは、検索回数を減らして安全性を得たのではない点です。PA-DRはむしろWeb検索を増やしながら、具体的な数値や年など機密につながる詳細を落とし、適切な公開文書には到達します。社内情報を外部に持ち出さない検索の作法を、AI自身が学べる可能性を示した成果と言えるでしょう。

OpenAI、法人向けにAI利用分析と支出管理機能を追加

新しい利用分析

クレジット利用の一元可視化
ユーザー・製品・モデル別の内訳
利用と支出の傾向把握
Cost APIでの外部分析対応

柔軟な支出管理

ワークスペース全体の既定上限設定
グループ・個人別の上限調整
従業員による追加申請機能

OpenAIは6月18日、法人向けプラン「ChatGPT Enterprise」に新しいクレジット利用分析と支出管理機能を追加したと発表しました。管理者は利用状況や導入の広がり、支出を明確に把握でき、AI活用を重要な事業投資と同じ厳格さで管理できるようになります。本日から利用可能です。

中核となるのが「Global Admin Console」での利用分析です。ChatGPTとコード生成支援「Codex」のクレジット消費を一つの画面に統合し、ユーザー・製品・モデル別に細かく内訳を確認できます。これにより、価値ある業務による利用増加と、精査が必要な利用パターンを見分けやすくなります。

管理者は利用とクレジットの推移を時系列で追い、主要ユーザーや新たな消費傾向を特定できます。同じデータは統合Cost API経由でも取得でき、各社のシステムに取り込んでより深い分析が可能です。

支出管理も強化されました。同社は年初にカスタムロール向けのクレジット利用上限を導入済みでしたが、今回はワークスペース全体の既定上限の設定に加え、特定グループへの上限設定や個人単位の上書きにも対応します。

従業員は自分の予算に対する利用状況を確認し、必要に応じて追加クレジットを申請できます。その際に作業内容を添えられるため、管理者は状況を踏まえて判断できます。全員の上限を引き上げることなく、一部のヘビーユーザーが業務を止めずに作業を続けられる仕組みです。

これらの機能で企業は大規模なAI導入をより慎重かつ柔軟に進められます。管理者は本日から利用を開始でき、対象ワークスペースの利用者も設定画面から自分のクレジット利用を確認できます。

Hugging Faceがエージェント向けツール検証手法を公開

評価手法の狙い

過程まで計測する評価
正解だけでなく手数を測定
ツール改善効果の可視化

検証で得た発見

CLIとSkillで大型は高速化
小型モデルでは精度低下
Qwen3-14Bは正答率半減
Skillの誤認識が失敗要因

AI開発企業のHugging Faceは2026年6月18日、コーディングエージェントが特定のソフトウェアをどれだけ効率的に扱えるかを測る検証手法を公開しました。同社のライブラリ「transformers」を題材に、最終的な正解だけでなく、答えにたどり着くまでの手数やトークン量、所要時間を計測する点が特徴です。

従来のベンチマークの多くは、エージェントが最終的に正しい答えを出せたかどうかだけを見てきました。しかし同じ結果でも、1コマンドで完了する場合と、40行のスクリプトを書いて何度も再実行する場合では、コストや失敗率が大きく異なります。同社はこの過程の差こそが、ライブラリの設計改善に重要だと指摘します。

検証では各タスクを3つの条件で実行しました。素のインストール状態、ソース全体を複製した状態、そしてCLIの文書と利用例をまとめた「Skill」を読み込ませた状態です。すべてHugging Face Jobs上で同一ハードウェアを使い、モデル・改訂版・タスクの組み合わせごとに並列実行しています。

結果として、CLIとSkillを追加した変更は大型の高性能モデルの作業時間を短縮しました。一方で小型モデルでは逆効果となる場面が確認されています。例えばQwen3-14Bは、Skillを加えると全体の正答率が67%から43%へ低下し、感情分類タスクでは100%から0%まで崩れました。

原因をたどると、小型モデルがSkillを実行可能なツールと誤認し、シェルから動かすべきCLIを直接呼び出そうとして処理を断念していたことがわかりました。同社は、エージェント向けのAPIはモデル規模ごとに評価すべきだと結論づけ、検証手法を自社ライブラリにも適用できる形で公開しています。

OpenAI、IPO前にAI著名人2人を招請

今回の人事

Shazeer氏がグーグル退社
OpenAIへ電撃移籍
Transformer論文の共著者
元政府高官Dean Ball氏も入社
新組織「Strategic Futures」率いる
Jason Kwon最高戦略責任者直属

IPOと業界再編

株式上場を前にした布陣強化
ライバルAnthropicは輸出規制で苦境

OpenAIが株式上場(IPO)を前に、AI業界の著名人2人を相次いで迎え入れます。米メディアTechCrunchが6月18日に報じた内容によると、グーグル傘下のDeepMindで「Gemini」開発を主導したNoam Shazeer氏と、トランプ前政権でAI政策を担ったDean Ball氏が、それぞれOpenAIに加わります。上場を控えた時期の人材獲得として注目を集めています。

Shazeer氏は、現代の生成AIの基盤を築いた一人とされる人物です。2017年に発表されTransformerアーキテクチャを提唱した著名論文「Attention Is All You Need」を共著したほか、対話AIの新興企業Character AIを創業しました。2000年から在籍したグーグルを水曜に退社し、今回OpenAIへ移ることになります。

もう一人のDean Ball氏は、政策面での体制を固めるための起用です。同氏はホワイトハウスで米国のAI行動計画の策定に関わった後に退任しており、7月6日付でOpenAIの新チーム「Strategic Futures」を率いると自身のXで表明しました。最高戦略責任者Jason Kwon氏の直属となります。

新チームの役割は、対外的な政策と社内ガバナンスの両面に及びます。Ball氏はブログで、破滅的リスクや再帰的な自己改善、労働市場への影響、そして主要AI研究所と政府・社会との関係を扱うと説明しました。AI研究所がAIガバナンスを主導せざるを得ないとの見方を示しています。

今回の動きは、激しさを増すAI業界の人材争奪を映しています。グーグル、OpenAIAnthropic、メタといった大手の間で人材の移動が続いており、Shazeer氏の移籍もその一例です。一方で競合のAnthropicは、トランプ大統領が最新モデルへの輸出規制を命じたことで、モデルの公開停止を余儀なくされる苦境に立たされています。

Metaの大量再編で社内反発、AI部門の士気崩壊

再編の混乱

約8000人を解雇
約7000人をAI部門へ強制配置
応用AIエンジニアリング部門への不満
会議で経営陣を罵倒する反発

経営陣の対応

CTOが伝達を「ひどい」と認める
ハッカトン案は社員に拒否
業務監視による反発拡大
業績好調でも遅れるAI開発

Metaの新設AI部門で、社員の反発が深刻化しています。同社は先月、全社員の約1割にあたる約8000人を解雇する一方、約7000人をAI関連チームへ配置転換しました。中核研究組織Meta Superintelligence Labsを支える応用AIエンジニアリング部門への異動が、士気の急落を招いています。

配置された社員の多くは、業務内容を不本意なものと受け止めています。AIが処理できない作業を人間が肩代わりする事後学習(ファインチューニング)のような単純作業が中心で、「やりがいがない」「主体性を失った」との声が相次ぎました。配置転換に社員の選択権がなかった点も不満を増幅させています。

反発は公の場にも噴き出しました。応用AI部門の社内会議では、ある社員が通話を遮り自らを「会社の言いなりだ」と発言。さらに特定のAI幹部に対し侮辱的な言葉を伝えるよう求める場面もあったと報じられています。社員の業務をAI学習目的で監視する方針も、不信感を強めました。

経営陣も事態を認識しています。CTOのアンドリュー・ボズワース氏は、再編に関する社内コミュニケーションが「ひどいものだった」と認めました。ザッカーバーグCEOが士気回復策として提案したハッカトンには、社員が「業務で手一杯だ」と反発し、効果は乏しい状況です。

皮肉なのは、Metaが企業としては好業績を続けている点です。広告事業など既存部門が利益を生む一方、AI事業はまだ成果に乏しく、最新モデルの投入も遅れ気味だと指摘されています。OpenAIAnthropicに後れを取る焦りが、性急な組織改編と現場の疲弊を生む構図が浮かび上がっています。

Google、Ad ManagerにAI対話エージェント投入

Ask Ad Manager

Gemini基盤の対話型エージェント
発行者専用データで個別回答
問題のリアルタイム診断
プロンプトで複雑な指標取得
今月ベータ提供開始

エージェント化の拡張

年内にAPI・MCPサーバー提供
Yahooが独自エージェントへ統合
発行者・代理店向け専用エージェント開発

Googleは6月18日、広告配信基盤Google Ad ManagerにAI対話エージェント「Ask Ad Manager」を投入すると発表しました。同社のAIモデルGeminiを基盤とし、媒体社(パブリッシャー)が業績の把握や意思決定を素早く行えるよう支援します。今月中にベータ版を提供開始し、機能を年内に順次拡充する計画です。

最大の特徴は、各媒体社自身のデータのみを用いて個別の回答や提案を返す点にあります。データの安全性を保ちつつ利用者が主導権を握れる設計とし、複数ターンの会話形式で深い洞察を引き出せます。従来は手作業だった分析を、対話だけで完結できる狙いです。

提供される主な機能は3つです。1つ目はリアルタイムの問題診断で、広告枠の不具合をレポート作成なしに特定し収益機会の損失を防ぎます。2つ目はプロンプト1つでカスタム指標や複雑なレポートを生成する機能、3つ目は会話の文脈に応じて最適な画面へ誘導するナビゲーション機能です。

Googleはこれをエージェント型」への進化の第一歩と位置づけます。すでに米Yahooが自社のカスタムエージェントにAd Managerを統合し、需要予測や広告枠の作成、レポート業務を効率化しています。広告テクノロジー業界全体が、AIによる業務自動化へ大きく舵を切りつつあります。

さらに同社は年内に、媒体社の運用を支える開発者向けツール(REST APIとMCPサーバー)を公開する予定です。媒体社・広告代理店向けの専用エージェントや、第一者・第三者エージェントが大規模に連携する基盤も開発中とします。広告の発見から価格交渉、配信実行までを一気通貫で担う未来を見据えた動きと言えるでしょう。

FERC、AIデータセンターの送電網接続を迅速化

命令の中身

大規模送電網6運用者へ迅速接続命令
接続費用はデータセンター側が負担
委員全員一致での承認
送電容量報告まで30日の猶予
電力料金の維持・改定に60日
代替送電技術の検討を指示

背景と狙い

2035年までに電力需要約3倍
発電容量不足は未解決の課題
コスト分散で料金抑制を期待

米連邦エネルギー規制委員会(FERC)は18日、データセンターなど大口電力利用者の送電網接続を迅速化するよう、PJMを含む主要6送電網運用者に命じました。エネルギー省のクリス・ライト長官の指示を受けた措置で、委員全員一致で承認されています。命令は、急増するAI向け電力需要に送電網が追いつかない現状を打開する狙いがあります。

命令の核心は、データセンター側が接続を「迅速かつ秩序立てて」行えることを運用者に示させる点にあります。接続コストはデータセンター側が負担し、既存利用者の料金圧迫を避ける設計です。さらに、需要に応じて負荷を調整できる柔軟な事業者には、審査期間を最短60日とする優先レーンが用意されました。

FERCは送電網運用者に対し、容量の余力を示す報告を30日以内、地域の電力料金の維持または改定を60日以内に提出するよう求めています。固体トランスや超電導送電線といった代替送電技術の検討も指示し、新興企業に商機を開きました。一方で、発電容量そのものの不足には踏み込んでいません。

背景には深刻な電力事情があります。データセンター電力需要は2035年までに約3倍に拡大する見通しで、卸電力価格は5年前比で最大267%上昇した地域もあります。最大手のPJMでは大手電力会社が離脱をちらつかせるなど、混乱が広がっていました。

推進側は、需要が効率的に増えれば送電網の固定費が広く分散され、結果的に料金が下がると主張します。ローレンス・バークレー国立研究所の試算では、州の電力消費が10%増えるごとに小売価格が約6セント下がるとされ、ノースダコタ州では23のデータセンター誘致後に全米最大の値下げが起きました。AI競争力の維持を急ぐ米政権の姿勢が、今回の命令に表れています。

サンダース氏、AI大手に50%課税し国民へ富分配案

法案の骨子

大手AI企業株への一度限り50%課税
総額7兆ドル規模の国富ファンド
年間売上2億ドル超の企業が対象
国民1人に年1000ドル超を配当

国民の監督権

超党派の独立委員会が運用監督
議決権で企業判断を拒否可能

業界の反応

Altman氏らとは依然隔たり
高利益移転を渋る企業を批判

米国のバーニー・サンダース上院議員は、大手AI企業から国民へ巨額の富を移転する法案を公表しました。AP通信に共有された概要によると、最大手AI企業の株式に対し一度限り50%の課税を行い、その税収で政府系の国富ファンドを創設する内容です。年間AI売上が2億ドルを超える企業が課税対象となります。

サンダース氏は、このファンドが総額7兆ドル規模に達し、毎年数千億ドルを生み出すと試算しています。資金は国民への直接給付のほか、医療・教育・住宅などの政策に充てられる見込みです。各国民は年5%の配当として1人あたり年1000ドル超を受け取る計算だといいます。

法案は給付にとどまらず、国民が企業の意思決定に直接影響を及ぼす仕組みも盛り込みました。大統領が指名し上院が承認する超党派の独立委員会の7名がファンドを監督します。委員会は保有する議決権を使い、公益を害しかねない企業の決定を拒否できる権限を持ちます。

「公衆がテーブルに重要な席を持たなければならない」とサンダース氏は述べ、AIが一般市民を傷つけず利益をもたらすべきだと強調しました。一握りの富裕企業だけが恩恵を独占すべきではない、という主張です。

一方でAI業界がこの構想を歓迎する可能性は低いとみられます。OpenAISam Altman氏やAnthropicDario Amodei氏は公益還元に一定の理解を示すものの、その案はサンダース氏ほど大胆ではありません。会談でAltman氏と依然として隔たりがあったとされ、サンダース氏は移転割合を渋る企業を強欲だと批判し、ファンド創設を選挙公約に掲げる意向を示しました。

空間推論AIのGeneral Intuition、約300億円調達交渉

巨額調達と評価額

新規調達約300億円
評価額2000億円超
シード後わずか8カ月での再調達
ベゾス氏とシュミット氏が出資
Khosla・General Catalyst継続

独自データと戦略

年間20億本のゲーム映像を活用
空間時間推論エージェント開発
エージェント自体が製品
OpenAIなど大手が関心

ニューヨーク拠点の新興企業General Intuitionが、約300億円規模の資金調達に向けて交渉していることが2026年6月18日、関係者の話で分かりました。実現すれば同社の評価額2000億円超に達し、空間と時間を移動するAIエージェント基盤モデル開発を一段と加速させます。今回の調達はわずか8カ月前のシードラウンドに続くもので、市場の高い期待を映します。

同社は2025年10月、ゲーム映像の共有プラットフォームMedalから約134億円のシード資金とともにスピンアウトしました。今回の出資者にはジェフ・ベゾス氏とエリック・シュミット氏に加え、既存投資家のKhosla VenturesとGeneral Catalystが名を連ねるといいます。Medal共同創業者のピム・デ・ヴィッテ氏が率い、世界モデルやシミュレーション専門家らが集結しています。

強みはMedalが持つ独自データです。月間1000万人の利用者が生む年間20億本のゲーム映像を用い、身体性を備えたAIや世界モデルを訓練します。一人称視点の対話的なプレイ映像から学べる点が他にない価値で、機械にリアルタイムの空間的・時間的推論を教える基盤になると同社は主張します。

この独自データはOpenAIの関心も集めており、同社は過去にMedalの買収を試みたと報じられています。関係者によれば、関心を示した大手AI研究所はOpenAIだけではないといいます。世界モデルの領域はRunwayやDecart、World Labs、グーグルのGenie 3などが相次ぎ参入し、競争が激しさを増しています。

ただGeneral Intuitionの戦略は他社と一線を画します。多くの企業がゲームやロボット訓練向けに世界モデルを販売するのに対し、同社はエージェントを訓練するために世界モデルを構築し、エージェント自体を製品とします。調達資金は計算資源の増強に充て、今夏の終わりから初秋にかけて新製品を投入する計画です。

AI推論基盤Baseten、評価額130億ドルで資金調達へ

巨額調達の概要

15億ドルの新規調達
評価額130億ドル規模
半年で評価額160%
5カ月前はシリーズE3億ドル

調達の構図と背景

評価額を分ける分割価格方式
Spark等が共同主導
推論ゴールドラッシュの波

AI推論基盤を手掛ける米新興企業Basetenが、評価額130億ドルでの15億ドル規模の資金調達を最終調整していると、米紙ウォール・ストリート・ジャーナルが6月18日に報じました。同社はわずか5カ月前に評価額50億ドルでシリーズE3億ドルを調達したばかりで、半年足らずで評価額が約160%跳ね上がる計算です。

今回の調達は通常の一本値ではなく、分割価格方式を採る点が特徴です。一部の投資家評価額130億ドルで、別の投資家は110億ドルで出資すると関係者は説明しています。これは見かけ上の評価額を高く見せ、主導投資家の体裁を整える手法だと同紙は指摘します。

調達はSpark CapitalやSands Capital、Altimeter Capital、Wellington Managementが共同で主導するとされます。直近の資金調達の動きが矢継ぎ早である点が、市場の旺盛な投資意欲を映し出しています。

2019年設立のBasetenが追い風としているのが、いわゆる推論ゴールドラッシュです。AIモデルが利用者の指示を受けて答えを返す推論の層に、ベンチャー投資家が巨額の資金を注いでいます。

Basetenの強みは、処理をタスクに最適なモデルへ振り分け、速度を保ちながらコストを抑える点にあります。特に性能が高く安価なオープンソースの代替モデルを活用し、OpenAIAnthropicより安い選択肢を狙う戦略が、高い評価額を支えています。

音波シナプスでAIを高速・省電力化

研究の核心

音波で動く人工シナプス
脳のシナプスを模倣
電子素子より高速動作
アリゾナ大学の研究
Science Advances掲載

性能と意義

消費電力は最大10分の1
アヤメ分類で精度96.7%
わずか39個のパラメータ

アリゾナ大学のシャオドン・ヤン助教らは2026年6月12日、音波を使う人工シナプスを開発したと科学誌サイエンス・アドバンシズで発表しました。脳の動作を模倣する次世代計算技術「ニューロモルフィック・コンピューティング」で、従来の電子素子より速く、かつ省電力で動くことを実験で示したものです。AIの計算基盤を一新する可能性を持つ成果です。

従来の電子的なニューロモルフィック素子は、人間の神経細胞が持つ膨大な接続のごく一部しか再現できませんでした。研究チームは音波の位相に複数の値を載せる「ファイビット」という仕組みに着目し、1つの素子で複数の計算を同時に処理できるようにしました。これにより配線や消費電力、設計の複雑さを抑えられます。

開発した装置は、長さ約60センチのアルミ棒3本をエポキシ接着剤でつなぎ、両端に超音波の送受信機を取り付けた構造です。音波で画像とラベルのデータを符号化し、棒の中を伝わる音波の相互作用を通じて情報を変換・整理します。生物のシナプスのように結合の強さを変える「可塑性」も再現でき、学習させて多様な課題に対応させられました。

実際に150個のアヤメを3品種に分類する課題では、従来型の多層パーセプトロンを上回る結果を出しました。わずか39個のパラメータで最終精度96.7%を達成し、ピーク精度に20%速く到達したのです。消費電力は最新の電子的ニューロモルフィック機器の最大10分の1にとどまると見積もられています。

さらに棒を1本足すだけで、ドーパミンなど脳内物質「神経修飾物質」の働きも模倣できました。これは1つの回路で文脈に応じて異なる機能を持たせられることを意味します。サンディア国立研究所のブラッド・エイモン氏は、巨大な単一ネットワークの代わりに、自己調整できる小さなネットワークを使える可能性に期待を示しています。

MITが牽引するマサチューセッツのAI覇権構想

技術リーダー選出

地元有力者50人選出
MIT関係者8人が選出
コーンブルース学長も対象
CSAIL所長ら教授陣

AIと起業の推進

無料オンラインAI講座開設
応用AI「AI+X」に注力
寮から起業への支援強化

米マサチューセッツ州の有力紙ボストン・グローブが6月9日、地域の技術・ビジネスを率いる影響力のある50人を選ぶ2026年版「テック・パワー・プレイヤーズ」を発表しました。同リストにはサリー・コーンブルース学長やCSAIL所長のダニエラ・ルス教授らMIT関係者8人が名を連ね、多数のMIT卒業生も含まれています。

報道はMITの研究室や起業文化、新たなAI施策を取り上げ、州の技術的優位を保つ姿勢を強調しました。コーンブルース学長は「マサチューセッツはこの次の波を確実に主導できる」と述べ、製造業や生命科学、量子技術、エネルギーまで幅広い分野での前進に期待を示しています。

MITはAI分野で、バイオテクノロジーやロボティクス、防衛、クリーンエネルギーなど地域の強い領域での推進を図っています。同時に、ハッカソンからベンチャー資金まで支援を整える「寮から起業へ」の取り組みで、学生が在学中に会社を立ち上げる流れを広げようとしています。

学長は誰もが受講できる無料の入門講座を含む新たなオンラインAI授業を公開し、企業だけでなく人々が技術の恩恵を受けられるよう後押しします。一部の大学は技術を企業や病院、研究機関の生産性向上に役立てる応用AI「AI+X」を専門領域として確立しつつあります。

MITスタートアップは地域の起業エコシステムを支える存在です。同校は150を超える講座と85のセンターやプログラムを擁し、コーンブルース学長とチャンドラカサン教務担当副学長は研究成果の事業化を加速する委員会(CATE)を新設しました。起業支援の拡充を受け、加速プログラムへの応募は前年から倍増しています。

MITスタートアップ、Liquid AIは線虫の脳構造に着想を得たAIモデルを開発し、大規模言語モデルより消費電力を大幅に抑えられます。同社は北米で販売する車載システムへの技術搭載でメルセデス・ベンツと契約したほか、GE Vernovaは5年間で5000万ドルを投じMITとの人材連携を進めています。