Anthropic、Fableの隠れた制限を謝罪し撤回

撤回の経緯

蒸留対策の不可視ガードレール
研究者からの強い反発
回答を密かに改変する設計
通知なしで品質を劣化

今後の対応

旧主力Opus 4.8へ振り分け
発動時はユーザーに毎回明示
他の高リスク領域と同じ方式

米AI企業のAnthropicは6月11日、新モデル「Claude Fable 5」に組み込んでいた不可視の安全装置について謝罪し、撤回すると発表しました。この装置は、競合モデル開発のためにFableを蒸留しようとする試みを密かに妨害するもので、研究者や競合他社の利用を損なうと批判されていました。同社は今後、制限が作動する場面をより透明にすると表明しています。

問題となったのは、AnthropicがFableのシステムカードで説明していた蒸留対策です。蒸留とは、大規模モデルの出力を使って小型モデルを訓練する手法を指します。同社は蒸留の試みと判断したクエリに対し、回答を密かに改変・劣化させる設計を採用していました。ユーザーには安全装置が作動した事実も、回答が変更された事実も知らされませんでした。

新たな方針では、該当するクエリは旧主力モデルのClaude Opus 4.8に振り分けられます。AnthropicはX上の投稿で、作動時には「毎回ユーザーに表示される」と説明しました。これは生物学や化学、サイバーセキュリティなど他の高リスク領域での処理方法と同様で、これらの領域でもクエリはOpus 4.8経由で処理されます。

今回の変更は、AI研究コミュニティからの激しい批判を受けたものです。批評家は、競合モデルへの蒸留を疑われた利用者を密かに制限する仕組みが、最先端モデルを評価しようとする第三者にも影響しうると警告していました。Anthropicは過去にも、中国DeepSeekなどが自社モデルを「産業規模」で不当に蒸留していると非難してきた経緯があります。

同社は「可視の安全装置は探られるため堅牢である必要があり、調整に時間がかかる。不可視の装置はより狭く対象を絞れるため迅速に展開できた。だがそれは誤った判断だった」とコメントしました。透明性を欠いた点を認め、利用者が安全装置の存在と理由を把握できるべきだとして謝罪しています。なお生物学分野では制限が広く設定されすぎ、Fableが基本的な質問にも答えられない状態が指摘されています。

OpenAIがChatGPTを統合スーパーアプリ化、Codexが基盤

新体制と狙い

Sottiaux氏が中核製品責任者に就任
ChatGPTCodexを統合しスーパーアプリ
週間約10億人の消費者製品を刷新

技術と勝算

Codex汎用エージェントへ転換
Sora等を閉鎖し資源を集約
Visa提携で決済を自動化
IPO控え成長再加速を狙う

OpenAIは6月11日、ChatGPTを単純なチャット画面から、仕事や私生活のあらゆる作業をこなすパーソナルAIエージェントへと作り変える計画を明らかにしました。同社が「スーパーアプリ」と呼ぶこの全部入りプラットフォームは、これまでで最大級の賭けであり、その成否を左右する立場にThibault Sottiaux氏が立っています。先月、同氏はChatGPTCodexの両方を統括する中核製品責任者に就任しました。

Sottiaux氏は、OpenAIで最も急成長する収益源の一つとなったCodexの構築を主導してきた人物です。これまで開発者やAI研究者と向き合ってきた同氏が、今度は週間で約10億人が使う消費者向け製品の刷新を任されました。本人はこの役割について「とてもわくわくすると同時に、少し恐ろしい」と語っています。

スーパーアプリの実現に向け、OpenAI動画アプリのSoraや科学者向けプラットフォームなど複数の独立製品をすでに閉鎖しました。これらを率いた幹部の多くは退社する一方、Sottiaux氏の社内での影響力は拡大し、現在はGreg Brockman氏に直属しています。閉鎖で生まれた資源は本プロジェクトに振り向けられましたが、中核チームは今も比較的小規模だといいます。

技術面では、スーパーアプリは主にCodexで駆動されると同氏は説明します。利用者が自然言語で頼むと、エージェントが裏側でコードを書き、API呼び出しを実行し、ウェブを操作してタスクを完了させますが、その過程は利用者には見えません。同社は昨年Operatorやその後継のChatGPT Agentで同様の試みをしましたが、いずれも普及しませんでした。Sottiaux氏はそれらを「時期尚早だった」とし、今はモデルの信頼性が十分に高まったと主張します。

OpenAIが描くのは、WeChatのようなアジア型スーパーアプリとは異なる構想です。米国などには既にGmailやクレジットカード、Venmoが普及しているため、同社のアプリは既存サービスへ接続する必要があります。今週はVisaとの提携でAIエージェントによる決済を可能にしたほか、メールやSlack、カレンダーとの連携も進めています。

最終的にOpenAIは、その下にあるウェブサイトやアプリ、APIを利用者が意識せず済むほど強力な共通インターフェースの構築に賭けています。ただしこの戦略は、基盤サービスを握る競合への依存という弱点も抱えます。GoogleAnthropicとの競争が激化しIPOが迫るなか、同社はChatGPTのスーパーアプリ化で成長を再加速できるかが問われます。

Microsoft、AIスキルを自動最適化するSkillOptを公開

技術の仕組み

モデル重み不変のスキル最適化
スキル.md文書を学習対象化
提案と検証の反復改良ループ
編集予算で学習率制御

性能と実用性

GPT-5.5で平均23.5点向上
全52組合せで既存手法に勝利
スキル1件の訓練費1〜5ドル

Microsoftは6月11日、AIエージェントのスキルを自動で改良するオープンソース基盤SkillOptを公開しました。基盤モデルの重みを変えずに、指示文をまとめたマークダウン文書を「学習可能な対象」として扱い、性能評価のフィードバックに基づいてスキルを進化させる点が特徴です。MITライセンスで提供され、企業の複雑な業務にエージェントを適応させる手間を大きく減らすことを狙います。

従来、エージェントのスキル調整は手作業が中心で、各ファイルの指示文を書き直しながら改善点を当て推量する非効率な作業でした。SkillOptは深層学習の発想を取り入れ、課題を実行するモデルとスキルを最適化するモデルを分離します。実行で得た成功・失敗の軌跡を分析し、追加・削除・置換の編集を提案したうえで、検証用データで性能が改善した場合のみ採用する仕組みです。

重要なのは、変更が「数学的に妥当な改善か」を保証する設計です。Microsoft Research Asiaの研究者は、チームがスキルを変更できるかではなく、その変更が改善である保証がないことが課題だと指摘します。SkillOptは編集予算を学習率のように使い、検証ゲートで誤った修正を排除し、失敗した編集を記録して再発を防ぎます。

性能面では、評価した52通りのモデル・ベンチマーク・実行環境のすべてで既存手法を上回りました。GPT-5.5ではスキルなしと比べ平均23.5点の改善を示し、小型モデルでも文書理解や逐次的な意思決定で大幅な向上が見られました。最終的なスキルは2000トークン以内に収まり、中央値は約920トークンと、人間が短時間で確認できる読みやすさを保ちます。

実用面では移植性と効率性が強みです。Codex CLIで訓練した表計算スキルをClaude Codeへそのまま移すと、標準設定比で59.7点向上したといいます。スキル1件あたりの訓練費は1〜5ドル程度で済み、導入時に完全に回収できる一度きりの費用とされます。一方で、数十件の代表例と採点可能な評価指標が必要で、主観的な課題には不向きという制約も示されました。

BBVA、ChatGPTを10万人に展開しOpenAIと提携

全社展開の規模

従業員約10万人が利用
月間アクティブ率70%超
週あたり約3時間の削減
金融業界で最大級の導入

業務変革の実例

カスタムGPT2万件超を作成
ペルーで応答時間80%短縮
経営層250人への研修実施

スペインの金融大手BBVAは2026年6月11日、OpenAIとの戦略的提携のもと、全世界の従業員約10万人ChatGPT Enterpriseを利用していると発表しました。法務・リスク・営業など全部門で生成AIを業務に組み込み、金融セクターでも最大級の導入事例となっています。

両社の関係は2024年、3000人規模での試験導入から始まりました。利用が現場主導で自然に広がったことを受け、BBVAは段階的に対象を拡大。2025年末には「The Eight」と呼ぶ8つの変革ロードマップを軸とした全社的な提携へと発展しました。

効果は数字にも表れています。展開済み従業員の70%以上が週次で利用し、1人あたり週約3時間を削減。特定業務では最大80%の効率化を実現したといいます。従業員が作成したカスタムGPTは2万件を超え、うち約4000件が世界中のチームで日常的に使われています。

具体的な活用も進んでいます。信用リスク部門では年次報告書やESG開示から非構造化データを抽出する「Credit Analysis Pro GPT」を開発。法務では年間約4万件の顧客関連照会への回答を支援するアシスタントを構築しました。ペルーでは3000人超が使う社内アシスタントが、平均応答時間を約7.5分から1分へと約80%短縮しています。

規制の厳しい銀行業界での全社展開にあたり、BBVAは信頼・ガバナンス・体系的な学習の3本柱を据えました。消費者向けAIの無許可利用を避け、企業向けの安全な環境と研修プログラムを提供。CEOや会長を含む250人の経営層を早期に研修し、トップ自らが利用を主導した点が普及を加速させました。

BBVAにとってChatGPTの導入は、より大きな変革の一部に過ぎません。同社は「The Eight」を通じ、顧客対応からリスク管理、ソフトウェア開発まで銀行業務全体をAI中心に再設計する長期構想を掲げています。単なるツール導入ではなく、AIネイティブ時代における銀行の運営そのものを問い直す狙いです。

Google、生成4倍速の拡散型モデルを公開

拡散方式の仕組み

256トークンを並列生成
全位置が相互に注意
誤りを自己修正
Apache 2.0で公開

性能と適用範囲

H100で最大1008トークン毎秒
標準版より品質は低下
ローカル推論で優位

Googleは6月11日、テキストを拡散方式で生成するオープンソースの実験モデルDiffusionGemmaを公開しました。画像生成で使われる拡散の原理を文章生成に本番規模で適用したもので、GPU上で標準モデルの最大4倍の速度を実現すると説明しています。Gemma 4を基盤にApache 2.0ライセンスで提供され、推論基盤vLLMがネイティブ対応した初の拡散言語モデルとなります。

従来の言語モデルはタイプライターのように左から右へ1トークンずつ生成し、確定した出力を後から修正できません。これに対しDiffusionGemmaは256個のランダムな仮トークンの塊から始め、ブロック全体を何度も並列で精緻化します。各パスで確信度の高い位置を確定し、不確実な位置は次のパスで再評価するため、自己修正と双方向の文脈参照が可能になります。

この構造はコード補完やテンプレート生成など、左から右への生成では失敗しやすい制約付きタスクに構造的に適しています。Googleは数独ソルバーで実証し、ファインチューニング後に成功率80%へ到達。確定ステップ数も48から12へと大幅に減り、早期停止による効率化を示しました。

速度面では、単一のNvidia H100でバッチサイズ1のFP8版が毎秒1008トークン、H200では1288トークンに達し、標準的な自己回帰方式の約6倍にあたります。一方でモデルは26BのMixture of Experts構成で、推論時に動かすのは3.8Bパラメータのみ。量子化すればRTX 4090など消費者向けGPUの18GB VRAMに収まります。

ただし速度の優位は条件付きです。GPUに余力があるローカル推論や低並列の用途で効果を発揮する一方、数百件を同時処理する高スループットのクラウド配信では効果が薄まります。Google自身も出力品質は標準Gemma 4より低いと認め、最高品質が必要な用途には標準版を推奨しています。

経営層やエンジニアにとって、専用GPUでの遅延削減はこれまで小型モデルへの妥協を意味していました。DiffusionGemmaは同じパラメータ規模のまま第三の選択肢を提供し、当日からvLLMで使えます。品質とのトレードオフは現実的ですが、ローカル推論や制約付き生成を扱うチームには試す価値があります。

新研究、LLMの文脈を16倍圧縮しKVキャッシュ超え

技術の中身

入力を事前圧縮する新方式
デコーダ手前で16倍圧縮
従来比8.8倍高速
符号化器0.6Bと復号器4Bの構成

精度と実用性

4倍圧縮で精度91.76%維持
100万トークンも単一GPUで処理
RAG連携には調整が必要

米ニューヨーク大学やコロンビア大学などの研究チームは2026年6月11日、大規模言語モデル(LLM)の入力文脈を圧縮する新手法「潜在文脈言語モデル(LCLM)」を発表しました。デコーダに到達する前に入力トークン列を圧縮することで、長大化する文脈が生む計算コストと処理速度の課題を解決します。モデルはHuggingFace上でオープンソース公開されました。

従来主流のKVキャッシュ圧縮は、全キャッシュを生成してから不要部分を削除します。これに対しLCLMはデコーダのprefill前に入力そのものを圧縮するため、高い圧縮率がそのまま計算量とメモリの削減に直結します。論文によると、長文脈ベンチマーク「RULER」で16倍圧縮時、KVキャッシュ基準より出力が8.8倍高速になりました。

精度の劣化が小さい点も特徴です。4倍圧縮では文脈を4分の1に減らしながら精度91.76%を保ち、無圧縮の94.41%から3ポイント未満の低下にとどまりました。16倍圧縮で入力の93.75%を除いた場合でも精度は75.06%で、同条件のKVキャッシュ手法をすべて上回りました。

アーキテクチャは0.6Bの符号化器4Bの復号器を組み合わせ、3500億トークン超で訓練されました。継続事前学習推論や長文脈タスクの教師ありデータ、細部を保持させる補助的な再構成タスクの3種を混ぜることで、圧縮と汎用性能の両立という従来の課題を克服しています。探索の結果、符号化器より復号器を拡大する方が効果的と判明しました。

実用面では既存のLLMと差し替えて使える設計です。共同責任者でコロンビア大学のミカ・ゴールドブラム氏は、文書を文脈に投入する前に圧縮器を通すだけだと説明します。人間が内容をざっと読んでから重要箇所を精読する動きに近く、エージェントが必要なテキストだけ選択的に復元する仕組みも示されました。

一方で課題も残ります。RAGパイプラインを持つ企業は、導入前に検索品質の指標に対して圧縮の挙動を検証する必要があります。さらに推論トレースのオンライン圧縮は未解決で、生成中に随時圧縮する素朴な手法が機能するかは今後の検証次第とされています。コードとモデルはGitHubHuggingFaceで公開されています。

Capital Oneが説く実運用でAIを成功させる規律

実装が止まる理由

実験ではなく実運用化でつまずく
研究と現場の断絶が失敗の原因
遅延要件と本番データの壁

本番化の要件

概念実証は測定可能な実機で評価
失敗パイロットも有益な判断材料
本番化は部門横断の総力戦

文化と継続学習

軌道修正を許す組織文化
見栄えより精度を優先

企業が直面する課題は、AIの実験ではなく実運用化にあります。Capital OneのAI Foundations部門で執筆を担うリズ・ボシェ氏は2026年6月11日、有望な試作から信頼できる本番規模のシステムへ移す段階で、多くの取り組みが停滞すると指摘しました。成功には最新モデルの採用だけでなく、基礎研究と実システムをつなぐ規律ある研究開発が欠かせないと論じています。

なぜ研究室で動くAIが本番で失敗するのでしょうか。研究が学術的な真空に置かれ運用の現実から切り離されると、オフライン環境で好成績のモデルも、現実の遅延要件や本番データの複雑さに直面して力を発揮できません。同氏は、利用者にとって本当に効果のある点を見失わないため、研究と応用を一つの組織にまとめ、基礎研究から高度に応用的な課題解決までを横断する設計が重要だと述べます。

具体例として、複数のAIエージェントを協調させるマルチエージェント研究を挙げています。顧客の状況調査と書類準備を同時にこなす構成は、人間の推論を模して顧客に代わり行動する自動車購入支援「Chat Concierge」の立ち上げを支えました。用途に研究をひも付けることで、現実世界で実際に拡張できる最先端の成果を加速できるといいます。

本番移行には率直な評価が前提となります。概念実証はスライドではなく測定可能な実機で示すべきで、否定的なパイロット結果も失敗ではなく重要な判断材料です。同氏は、パイロットが常に成功するなら判断点として機能せず、ただ本番への緩慢な約束になってしまうと警告します。

本番化はソフトウェア工学、科学、製品設計、運用など部門横断の総力戦だと強調されます。技術的突破は必要条件にすぎず、Capital Oneは精度や遅延などの指標を重視し、見栄えより精度を優先することが継続的な改善を可能にすると説明しています。

最後に、持続的なAI革新は技術と同じく文化に依存すると結論づけています。「うまくいっていない」と認めることが許される組織は、問題を隠さず解決へ向かいます。リーダーはツールだけでなく研究開発のプロセスと文化投資し、責任ある形で革新を拡張すべきだと提言しました。

OpenAIがOnaを買収しCodexのクラウド基盤を強化

買収の狙い

Codexクラウド実行基盤を拡張
長時間稼働エージェントに対応
顧客管理型の安全な実行環境

Codexの利用拡大

500万人が利用
年初比400%
規制当局の承認が前提

OpenAIは2026年6月11日、クラウド実行基盤を手がけるOna買収を発表しました。同社の安全なクラウド実行・オーケストレーション技術を、急成長するCodexエコシステムに統合し、ソフトウェア開発から知識労働まで長時間稼働するエージェントの基盤を強化する狙いです。買収は規制当局の承認など通常の完了条件が前提となります。

背景にはCodexの急速な普及があります。現在は週500万人が調査・分析・開発・自動化に利用しており、年初から400%増加しました。当初は開発者向けのツールでしたが、今では幅広い職種の人が初期の依頼から完成まで複雑な業務をこなす用途に広がっています。

OpenAIが重視するのは、作業時間の長期化です。Codexの最も価値ある仕事は数分ではなく数時間から数日にわたって進むようになっており、利用者が起点となった端末に縛られず、外出先からでも進捗確認や指示、意思決定、結果のレビューができる状態を目指しています。Onaの永続的な実行環境がこれを可能にします。

Onaはこれまで、ソフトウェア開発をローカル端末からクラウドへ移行させる取り組みを進めてきました。200万人開発者が安全で再現可能なクラウド環境で作業するのを支援した実績があり、ノートPCを閉じても顧客のクラウド環境内でエージェントが作業を継続できる点が、Codexの次の段階に直結すると説明しています。

企業が実運用にエージェントを展開する際は、高性能なモデルだけでは不十分だとOpenAIは指摘します。Onaの顧客管理型の実行モデルにより、エージェントは企業自身のクラウド環境内で動作し、OpenAIが知能とオーケストレーションを提供します。実行場所やアクセス範囲、認証情報の制御、活動の記録といったセキュリティと統制の要件を満たしつつ、Codexの能力を損なわない構成です。

買収完了まで両社は独立した企業として運営されます。完了後はOnaのチームがOpenAIに加わり、Codexチームと連携して企業向けの安全で永続的な実行能力を高め、世界中のより多くの企業へCodexを展開していく計画です。

天文学者がCodexでブラックホール計算を高速化

研究の壁

プラズマ粒子の螺旋運動計算
極小タイムステップの負荷
数十年来のシミュレーション限界

AIの活用

Codexが候補アルゴリズムを導出
検証可能な数値手法の提案
誤りも試験で排除

今後の展望

数兆粒子の計算可能性
未踏の物理現象の解明

アリゾナ大学のチー・クワン・チャン研究員が2026年6月11日、OpenAICodexを用いてブラックホール周辺のプラズマを模擬する新たな計算アルゴリズムを導出していると明らかにしました。従来の手法では極端な物理現象を現実的に再現できず、数十年にわたり研究の壁となってきた課題に、AIで挑む取り組みです。

チャン氏は、史上初のブラックホール画像を2019年に公開した国際協力プロジェクト「イベント・ホライズン・テレスコープ(EHT)」の一員です。チームは現在、M87銀河中心の超巨大ブラックホールを対象に、初の動画制作へ向けた観測を進めています。観測を科学的理解に変えるには、膨大なデータ処理と極限の物理を扱うシミュレーションが欠かせません。

最大の難所が、ブラックホール周辺のプラズマのモデル化です。高温で希薄な領域では電子とイオンがほとんど衝突せず、磁力線の周りを螺旋状に回ります。この運動を正確に追うには微小なタイムステップが必要で、世界最速のスーパーコンピューターでさえ、本来調べたい大きな挙動より粒子の細かな動きの計算に時間の大半を費やしてしまうのです。

そこでチャン氏は、粒子の運動を数学的に変換し、細かな螺旋を直接追わずに済む新手法に着目しました。手作業ですべての可能性を探るには膨大な時間がかかるため、Codexに候補アルゴリズムの導出と既知解との照合を任せたのです。生成された手法には誤りも多く含まれますが、検証可能であれば問題ないと同氏は言います。

Codexの特徴は、結論だけでなく数値手法そのものを提示し、研究者が検査・試験・物理的理解できる点にあります。「アインシュタインや優秀な学生、AIモデルから出た案だから受け入れるのではない。繰り返し試験して初めて受け入れる」とチャン氏は強調しました。検証と再現性に根ざす科学こそ、現在のAIの最良の用途の一つだとの見方です。

もしこの手法が成功すれば、ブラックホール周辺の数兆個の粒子を模擬できるようになる可能性があります。それは数十年にわたり手の届かなかった物理現象の解明につながると、同氏は期待を寄せています。

AIのボトルネックはGPUよりデータ経路と指摘

ベンチマークの盲点

遅延を加えるとS3スループット急落
本番環境を再現しない試験条件
ジッターより遅延が主因

データ経路の価値

GPUデータ供給次第で価値変動
AIは遅延スパイクに脆弱
ストレージ前段に制御点配置

企業のAIインフラ投資GPU確保や学習スループットに集中してきましたが、見落とされているのがストレージと計算をつなぐデータ経路だと、F5の専門家らが2026年6月11日付の寄稿で指摘しました。本番環境では遅延スパイクやネットワークのジッター、ノード劣化が発生し、実験室では好成績でも実運用で停滞するパイプラインが生まれると警告しています。

問題を増幅させているのが、ベンチマーク手法そのものだといいます。F5のポール・ピンデル氏は「ベンチマークは最も現実的な結果ではなく、最良の性能を出すよう設計されている」と述べ、本番で必ず生じる遅延を試験に組み込んでいない点を問題視します。実際にF5とMinIOが劣化したネットワーク条件下で検証したところ、わずかな遅延でもS3のスループットが大きく低下し、長距離通信に近づくほど劣化が深刻になることが分かりました。

意外だったのは、スループット低下の主因が想定していたジッターではなく遅延だった点です。この結果は、S3オブジェクトストレージを理想的な条件ではなく、実際に直面する劣化した環境を前提に設計すべきだという教訓を企業のアーキテクトに突きつけます。

F5のタヌ・ムトレジャ氏は「GPUは最も目立ち高価なため注目されるが、本番ではデータ経路が供給する分だけの価値しか生まない」と語ります。データ経路が劣化すると、GPUの稼働率低下だけでなく、推論性能の悪化やAI出力の品質低下、不要なデータ複製によるegressコスト増など影響が連鎖します。

AIワークロードは従来の業務システムより構造的に脆弱です。データベースやERPはキャッシュやバッファで一時的な遅延を吸収できますが、大規模並列のGPUクラスタにはその保護がなく、小さな遅延でもクラスタ全体に波及してしまいます。

解決策として同社が示すのが、ストレージの前段にアプリケーション配信・セキュリティ基盤を置き、制御点とする方式です。F5のBIG-IPがデータ経路上でMinIOの分散ストレージノードの健全性を監視し、正常なノードのみへ通信を振り分けることで、効率を保つとしています。複数リージョンやクラウドにまたがる場合は、データの所在や管轄権がデジタル主権上の設計制約になるとも強調しました。

DeepMind系創薬AI、隠れた標的を発見

IsoDDEの実力

未公開のcryptic pocketを予測
結合様式まで正確に再現
構造・ポケット・親和性を統合

創薬への波及

NovartisとLillyが提携
21億ドルを調達
抗体や分子糊にも応用
創薬解決には程遠いと釘刺し

Google DeepMindから独立したIsomorphic Labsが、従来は狙えなかったタンパク質の隠れた結合部位をAIで特定する技術を進めています。同社は2月、新システム「Isomorphic Drug Design Engine(IsoDDE)」の技術報告を公開し、薬剤が結合する「ポケット」の発見やタンパク質と薬剤分子の相互作用予測を可能にしました。

同社の機械学習部門でグループリーダーを務めるAdrian Stecuła氏によると、ノーベル賞を受けたAlphaFold2はタンパク質の折りたたみ問題をほぼ解決し、AlphaFold3は核酸や小分子リガンドなど他の生体分子との相互作用も単一の枠組みで扱えるようにしました。ただ訓練データから遠い新規ポケットほど性能が落ちる弱点があり、未知の作用機序を狙う創薬には不十分でした。

IsoDDEはこの限界に挑む統合システムで、構造予測・ポケット同定・結合親和性予測という3つの出力を備えます。検証では、今年1月にNature誌が初めて報告したcereblonという重要タンパク質の新規cryptic pocketを、配列情報だけから正確に予測できました。

cryptic pocketとは、単体のタンパク質を見ても空洞が存在せず、適切なリガンドが結合した時にだけ開く非自明な部位です。同社のモデルは結合部位の場所だけでなく、既知部位と新規部位それぞれへのリガンドの結合様式まで、論文の結晶構造を再現する形で言い当てました。

この成果は事業面でも裏付けられています。同社はNovartisやEli Lillyと大型の創薬提携を結び、最近のシリーズBで21億ドルを調達しました。手法は小分子だけでなく抗体や分子糊、ペプチドにも一般化し、これまで「薬で狙えない」とされてきた疾患関連タンパク質を治療対象に広げる可能性があります。

ただStecuła氏は、構造を正確にモデル化できたからといって創薬が解決済みというのは誤解だと釘を刺します。実用には多数の出力を備えた統合システムが必要であり、同社は公開済み・未公開の指標の双方で性能向上を続ける構えです。仮説生成から検証、結果分析までをAIが担うエージェント型の創薬も、将来像として描いています。

Hugging Face、PyTorchの推論最適化を解説

nn.Linearの実態

転置はメタデータ書換のみ
バイアス加算はGEMM融合
addmmが単一カーネル化
compileは融合余地なし

MLPの融合効果

MLP1回で5カーネル
compileがGeLUとmulを融合
中間テンソルのHBM往復削減

手書きカーネル

Ligerは形状非依存で再コンパイル不要

Hugging Faceは6月11日、PyTorchの処理を可視化するプロファイリング連載の第2回を公開しました。今回は深層学習の基本部品であるnn.Linearを題材に、GPUカーネルの実際の挙動を追い、torch.compileやLiger製の手書きカーネルとの違いを実測値で示しています。対象読者はモデルの推論速度を詰めたいエンジニアです。

まず単一のnn.Linearでは、行列積と転置、バイアス加算が一見すると別々の処理に見えますが、実態は異なります。転置を担うaten::tはGPU上でカーネルを起動せず、テンソルの形状とストライドというメタデータを書き換えるだけです。バイアス加算もcuBLASのGEMMカーネル末尾に折り込む「エピローグ」として統合され、最終的にaten::addmmという単一カーネルで完結します。

そのため単一のLinearではtorch.compileが融合する余地はほぼ残っていません。compileが消すのはGPUの計算ではなく、ビュー処理を発行するCPU側の数マイクロ秒のオーバーヘッドです。Inductorがコンパイル時にストライドを計算し、addmmを直接呼び出すよう書き換えるため、GPUの計算内容は変わりません。

効果が表れるのは三つのLinearを積んだMLPです。GeGLU構成のMLPは1回の順伝播で3つのGEMMとGeLU、乗算の計5カーネルを起動します。torch.compileはこのうちGeLUと乗算、リシェイプを1つのTriton融合カーネルにまとめ、約50MBの中間テンソルがHBMを往復する無駄を排除します。これがコンパイルによる最大の改善点です。

記事は最後に、人手で調整したLiger製カーネルを比較対象に挙げます。Ligerの実行時間は92.8マイクロ秒で、特定形状向けに最適化されたInductorの89.4マイクロ秒よりわずかに遅く見えます。しかしInductorは入力形状が変わるたびに再トレースとコンパイルが必要で、Ligerは形状が変わっても再コンパイル不要です。数マイクロ秒と引き換えに形状変化への頑健さを得ているわけです。

筆者が一貫して勧めるのは「先に予想し、それから見る」という習慣です。トレースを開く前にカーネル数や種類を予測し、想定と食い違った点こそ最も学びが多いと説きます。次回はMLPからアテンション、最終的には完全なモデルへと解説を進める予定です。

AnthropicとDXC、規制業界にClaude導入で提携

提携の概要

数万人のClaude認定エンジニア育成
銀行・航空・保険の基幹系に導入
Claudeパートナーネットワーク参加

自社実証と展開領域

OASISのコード95%超Claude生成
開発速度10倍と試算
保険・近代化・防御・運用の4分野

AIスタートアップAnthropicとIT大手のDXCテクノロジーは6月11日、複数年にわたる世界規模の提携を発表しました。DXCは数万人規模のClaude認定の常駐エンジニアを育成し、銀行や航空会社、保険会社、政府機関などが依存する基幹システムにAIアシスタントClaude」を組み込みます。

対象となるのは、DXCが数十年にわたり運用してきた取引・保険金請求・業務処理の基幹系です。これらは厳格なセキュリティコンプライアンス要件のもとで稼働しており、規制業界へのAI導入における信頼性が問われる領域だといえます。DXCは今回、Anthropic提携企業ネットワークClaudeパートナーネットワーク」にも加わりました。

DXCはまず自社で実証しました。70カ国・約11万5000人の自社運用にClaudeを導入し、4月に投入した運用管理基盤「DXC OASIS」ではコードの95%超Claudeが生成したとしています。同社はソフトウェア開発が10倍速まったと試算し、OASISはすでに50社以上の顧客に提供されています。

エンジニア育成では、DXCが既存の開発チームから人材を集め、Anthropicの認定プログラム「Anthropic Academy」で資格を付与します。さらにDXC独自のカリキュラムを上乗せし、顧客が運用する基幹システムに特化した訓練を施す計画です。

提携は当初、DXCがすでに大規模運用を担う4分野で始まります。保険の基幹刷新、レガシーコードを近代化する「Modernization as a Service」、常時稼働する防御サブエージェントを置くサイバーセキュリティ、そしてアプリケーション運用です。両社は業界ごとに段階的にClaudeを各環境へ広げる方針です。

AnthropicのPaul Smith最高商務責任者は、DXCが顧客と同じ要件のもとで先に自社実証した点を強調しました。DXCのRaul Fernandez社長兼CEOは「業界にとって節目だ」と述べ、信頼と経験を最先端AIと組み合わせる狙いを示しています。

GitHub、5月に9件の障害 AI需要急増で基盤刷新

5月の障害状況

1カ月で9件の障害発生
Actions関連が多発
プルリクやCopilotに影響
DB移行起因の障害が複数

信頼性への投資

AIとエージェントで需要急増
Azure移行で容量を倍増
DB分離で障害連鎖を遮断
「可用性優先」の方針掲げる

GitHubは6月11日、2026年5月に発生した9件の障害をまとめた月次可用性レポートを公開しました。プルリクエストやGitHub Actions、Copilotなど広範なサービスで性能低下が起き、原因の多くがデータベース移行や設定変更に集中したと説明しています。同社はAIを活用した開発需要の急増を背景に、インフラの全面刷新を進めていると強調しました。

今回のレポートで同社が異例なのは、個別障害の説明に先立ち信頼性向上の進捗を共有した点です。GitHubのトラフィックはAI支援型・エージェント型の開発ワークフローによって急速に拡大しており、これに対応するためモノリスの分割やAzureへの移行を進めています。現在、モノリスのトラフィックの40%をAzureから配信し、2月の8%から大きく伸ばしました。4カ月で実効容量を2倍以上にしたといいます。

障害の中で影響が大きかったのが、5月4日のスキーマ移行に起因する障害です。大規模で高頻度アクセスのテーブルに対する移行が、週次ピークの本番トラフィックと重なり、データベースの接続容量を飽和させました。プルリクエストが最も深刻な影響を受け、IssuesやActions、Codespaces、Copilotなど依存サービスにも波及しています。

GitHub Actionsをめぐる障害も目立ちました。5月5日と6日には、ホスト型ランナーの障害が連鎖し、前日の復旧作業が翌日の設定不具合を招くという二次障害が発生しています。さらに5月26日には、自動アカウント審査システムがActionsの認証用サービスアカウントを誤って停止し、新規ジョブが起動できなくなりました。同社は停止対象外とするサービスアカウントの許可リストを導入したと述べています。

上流プロバイダー起因の障害も報告されました。5月28日にはResponses APIの不具合により、GPT-5.2やGPT-5.4などのモデルでエラー率が上昇し、Copilotが影響を受けています。GitHubは影響モデルからトラフィックを退避させて対処し、自動フェイルオーバーの改善を進めるとしました。経営者エンジニアにとって、AI開発基盤の安定性がいかに事業継続に直結するかを示す事例といえるでしょう。

同社は「可用性、次に容量、最後に機能」という原則を掲げ、ユーザー認証や認可を独立ドメインに分離する作業を完了に近づけています。ステートレスな認証トークンの展開により、トラフィック急増時の負荷増幅を引き起こしていたリクエストごとのDB参照も排除しつつあります。構造的な変更によって障害要因を恒久的に取り除く方針です。

MIT、3択順位付けで選好予測を高精度化

研究の核心

100年続く2択比較の限界を証明
選好間の相関は2択では検出不能
3択順位付けで相関を抽出可能

AIへの応用

ランダム効用モデルの精度向上
LLMの選好学習と整合に直結
実験数は項目数に対し非指数的

マサチューセッツ工科大学(MIT)の研究チームが2026年6月11日、人の選好を予測する数理手法を改良する成果を発表しました。従来の2項比較では選択肢間の相関を捉えられないと数学的に証明し、3つの選択肢を順位付けさせる方式が高精度な予測を可能にすると示しました。経営者エンジニアにとって、推薦システムやAIの精度を左右する基盤技術となります。

土台にあるのは、約100年前に心理学者サーストンが提唱したランダム効用モデル(RUM)です。人が複数の選択肢から最も価値の高いものを選ぶという前提に立ち、行政や産業界で「ある幹線道路が封鎖されたら人々はどう通勤するか」といった反実仮想の予測に広く使われてきました。AIアシスタントのGabriele Farina氏は、人それぞれ好みが異なり時間でも変わるため、モデルは本質的に確率的だと説明します。

問題は、モデルの推定に使うデータがサーストン以来ほぼ2択比較に偏ってきた点にあります。AかBのどちらを選ぶかは答えやすい一方、Constantinos Daskalakis教授は「2つずつ見る方式では多数の選択肢間の相関を見つけられない」と指摘します。たとえば独立系映画を好む人は外国映画も好む傾向がありますが、2択データだけではこうした結びつきが見えないのです。

チームは、2択比較のみから相関情報を得るのは不可能だと証明しました。一方、多数の人が3つの選択肢を好みの順に評価すれば相関を識別でき、3択ベストと2択ベストの組み合わせでも同じ情報が得られます。PhD学生のSobhan Mohammadpour氏は、個々の順位結果を一つの大きなモデルに統合する手法を開発したと述べています。

実用面でも追い風があります。Farina氏によれば、必要な実験数はカタログの項目数に対して指数的に増えないため、効率的なアルゴリズムが成立します。この成果は4月にリオデジャネイロで開かれた国際会議ICLRで発表されました。

Daskalakis教授は、RUMが1990年代後半以降のインターネット経済に不可欠だったように、今後はAIモデルの整合(アライメント)にも中心的役割を果たすと強調します。LLMの学習では人が候補出力を順位付けし、モデルが好まれる文体や内容を学びます。なぜ3択が鍵なのか。膨大な選択肢すべてを聞き出せない以上、少ない問いで相関まで捉える設計が、より正確な予測モデルへの実践的な道筋になるからです。

OpenAI、EUのAI生成物透明性規範を支持

規範への支持表明

EU透明性規範を正式支持
AI法実装の重要な一歩
数百の関係者と共同策定

来歴技術の取り組み

2024年からC2PA採用
画像に来歴メタデータ付与
SynthID透かしを併用
公開検証ツールを提供

残された課題

メタデータは剥離リスク
来歴技術は発展途上

OpenAIは2026年6月11日、欧州委員会が公表したAI生成コンテンツの透明性に関する行動規範への支持を表明しました。同規範はEUのAI法を実装し、より透明性の高いデジタル環境を築くための重要な一歩と位置づけられています。同社は数百の関係者とともに規範策定に貢献したとしています。

今回の支持は、AI生成物の来歴(プロベナンス)を強化してきた数年来の取り組みの延長線上にあります。OpenAIは2024年、画像生成ツールDALL·E 3にC2PAメタデータを付加し始めました。その後も標識付けや検出手法を改良し、最初の公開検証ツールも公開しています。

来歴情報をより強固にするため、同社は複数のシグナルを組み合わせる多層的な手法を採用しています。ChatGPTCodex、APIで生成した画像にはC2PAメタデータとSynthIDの電子透かしの両方を付与します。メタデータは豊富な情報を運べる一方、透かしは異なる環境でも信号を保ちやすいという利点があります。利用者は専用ページで画像に来歴情報が含まれるかを確認できます。

もっとも、来歴技術はまだ発展途上の分野です。メタデータはアップロードやダウンロード、ファイル形式の変換、画面のスクリーンショットなどで失われる恐れがあり、透かしも劣化する場合があります。OpenAIはこうした限界を認めつつ、技術の信頼性や相互運用性の向上にはエコシステム全体の協力が不可欠だと指摘しています。

OpenAIは2025年、米国企業として初めてEUの汎用AI行動規範に署名しており、今回の支持も同じ方針に沿うものです。明確で実行可能なルールがAIの責任ある発展を促すとの考えのもと、同社は今後も製品の透明性強化や相互運用可能な標準づくりに取り組む姿勢を示しています。経営者にとっては、規制対応とAI活用を両立させる動きとして注目に値するのではないでしょうか。

Deezerが他社配信のAI楽曲を判定する無料ツール

ツールの仕組み

20の主要配信サービスに対応
Spotifyなどからプレイリスト取り込み
AI生成曲を自動検出
27言語で利用可能な無料公開

背景と狙い

他社が技術導入せず直接提供
新規アップロードの44%がAI生成
タグ付け中心の競合と差別化

音楽配信のDeezerは6月11日、SpotifyやApple Musicなど他社サービスのプレイリストを走査し、AI生成楽曲を判別できる無料ツールを公開しました。専用サイトで配信サービスを選び、アクセスを許可するとプレイリストが取り込まれ、AIコンテンツの有無が通知されます。対応プラットフォームは20種類に及び、27言語で利用できます。

Deezerは大手配信の中でいち早くAI生成楽曲のラベル付けを始め、その検出技術を他社にも提供してきました。しかし導入する企業は現れず、「我々の先例に続く企業はまだない」とCEOのアレクシス・ランテルニエ氏は述べています。そこで同社は技術を企業向け販売から、利用者へ直接届ける方針へと切り替えました。

競合との違いは姿勢の強さにあります。Apple MusicやSpotifyが任意のタグ付け方式を採るのに対し、DeezerはAI楽曲を推薦から除外し、編集プレイリストからも外しています。今回の無料ツールは、AI音楽に最も厳しく対峙する配信という立ち位置を一段と鮮明にし、消費者への訴求材料にもなり得ます。

背景には深刻な数字があります。同社の発表によると、毎日アップロードされる新曲の44%がAI生成で、その量は1日約7万5千曲、月間200万曲超に達します。ただし再生に占める割合は全体の1〜3%にとどまり、しかもその約85%は不正と判定され収益化対象から除外されています。

Deezerは今後の対応として、供給元ポリシーの更新やコンテンツ削除も検討していると明らかにしました。これは今年AI音楽を全面禁止したBandcampに続く動きとなります。AI生成音楽の流入が止まらない中、配信各社が透明性と不正対策をどう設計するかが問われています。

GrokがIPO直前のSpaceX傘下で性的偽動画を放置

放置される偽画像

xAIGrok性的ディープフェイクを放置
著名人や下院議員AOCを標的化
公開リンク数百件をWIRED検証
他社AIが拒否した指示にも生成対応

IPOと法的リスク

親会社SpaceXが金曜に大型IPO
法的対応に5.3億ドル引当
カナダ当局が安全策を不十分と判断

イーロン・マスク氏のxAIが運営するチャットボットGrok」が、女性の同意なき性的なディープフェイク画像動画の生成と公開に依然として使われていることが、米メディアWIREDの調査で明らかになりました。親会社のSpaceXが金曜に史上最大級の新規株式公開(IPO)を控えるなか、AIの安全対策の不備が改めて問われています。

WIREDがGrok.com上に公開された数百件のリンクを精査したところ、その多くが性的なAI画像動画につながっていました。対象には複数の著名人に加え、米下院議員のアレクサンドリア・オカシオコルテス氏も含まれます。動画の一部は写実的で、女性が巨大な男性の手に握られるなど、本人の意に反する状況を描いていました。

注目すべきは安全対策の格差です。Grokで生成に使われた指示文の一部を、OpenAIChatGPTAnthropicClaude、メタのAIで試したところ、いずれも不適切として拒否しました。専門家は、Grokが年初の「脱衣」画像問題への反発を受け一部修正したものの、主要ツールの水準には達していないと指摘します。

xAIは1月以降、規制当局の調査や集団訴訟に直面してきました。同社は同意なき性的ディープフェイクの生成を禁じると繰り返し表明し、WIREDの指摘後には該当画像の多くが閲覧不能になりました。一方でマスク氏はGrokを「成人の上半身ヌードを許容すべき」とし、「Spicy」「Unhinged」といった刺激的なモードを残してきました。

金融面でのリスクも無視できません。SpaceXは5月、Grok関連を含む法的対応費として5.3億ドルを引き当てたと投資家に警告しました。提出書類では、これらのモードが評判の毀損や違法コンテンツ生成といった高いリスクをはらむと自ら認めています。

カナダのプライバシー当局はIPOを前に、xAIが当初から適切な安全策を講じず連邦法に違反したとの予備調査結果を公表しました。同社は新たな対策を導入したと説明しますが、当局は「その有効性が証明されていない」として、現時点で改善を評価していません。

SpaCEX、史上最大の上場で7.5兆円調達

記録的IPO

1株135ドルで価格決定
調達額750億ドルで史上最大
募集の4倍の応募超過
Musk氏が初の兆万長者

SPV投資家の不安

最大5層のSPV構造
ロックアップで配分が長期化
手数料による持ち分目減り
詐欺的運用者の露呈懸念

イーロン・マスク氏率いるSpaceXは6月11日、新規株式公開(IPO)の発行価格を1株135ドルに決定し、総額750億ドル(約7.5兆円)を調達したと発表しました。2019年のサウジアラムコによる249億ドルを大きく上回り、史上最大のIPOとなります。13日からナスダック市場でSPCXのティッカーで取引が始まります。

今回の上場は異例の手法を採りました。通常は上場初日に市場で価格が定まりますが、SpaceXはロードショー開始前から投資家に対し135ドルの目標株価を提示し、結果として募集株式の4倍という強い需要を集めました。仮条件超過分として8330万株の追加売り出し枠も用意され、行使されれば初値で110億ドルの上乗せ調達が見込まれます。

最大の受益者はマスク氏本人です。1株1票のクラスA株を約8.5億株、1株10票のクラスB株を最大56億株保有しており、この価格水準で世界初の兆万長者(トリリオネア)になる見通しです。Valor ManagementのAntonio Gracias氏は約680億ドル相当の持ち分を得るほか、約400人のベンチャー投資家にも巨額の利益が及びます。

一方で、特別目的事業体(SPV)を通じて投資した個人は不透明な状況に置かれています。SpaceXは需要の高さから、SPVの株を元に新たなSPVが組成され、4層から5層に積み重なる前例のない構造が生まれました。AnthropicやAndurilがこうした多層SPVを禁止する中、SpaceXはその正当性が問われる初の大型試金石となります。

下層の投資家は、自分が何株保有するのか、そもそも株を受け取れるのかさえ分からないケースがあります。段階的なロックアップ解除は約4か月かけて進み、最下層への分配は8〜9か月後になる可能性があると指摘されています。さらに各層で抜かれる手数料により、想定より持ち分が目減りする例も出ています。

より深刻なのは詐欺のリスクです。Anduril関連で実在しない割当を偽装したSestante Capitalの運営者は禁錮4年の判決を受けました。連絡の取れなくなったSPV運用者の事例も報告されており、ロックアップ解除後に不正な事業体が露呈するとの見方も出ています。記録ずくめの上場の裏側で、投資家保護という課題が浮かび上がっています。