OpenAI、Codexで自己改善する税務AI構築

実証された成果

税務申告7,000件を処理
準備時間を約3分の1削減
下書き精度最大97%達成
処理スループット約50%向上

自己改善の仕組み

現場補正を構造化シグナル
Codexが評価セットで原因調査
他税務スケジュール横展開

OpenAIとThrive Holdingsは2026年5月27日、会計事務所Creteの実務家と共同開発した税務AIエージェント「Tax AI」の運用成果を公開しました。過去6カ月で7,000件の申告を処理し、準備時間を約3分の1削減、下書き精度は最大97%、処理量は約50%増えたと報告しています。鍵となるのは、Codexを核に据えた自己改善ループです。

従来、運用開始後に発覚する不具合は、エンジニアが個別に原因を探って修正する手作業でした。Tax AIはこの工程を変え、実務家による修正をフィールド単位の構造化データとして蓄積します。導入直後は4分の1の申告しか「75%正答」に届きませんでしたが、6週間後には86%が同水準に到達したと示しています。

改善の中核はCodexによる自動調査です。たとえば賃貸物件の「公正賃貸日数」欄を継続的に取りこぼすパターンが評価指標で浮かぶと、Codex抽出スキーマ・マッパー・採点器を横断的に点検し、修正案とプルリクエストを提示します。広範な回帰評価を通った上で人間のレビューに回り、曖昧な事例は製品チームへ差し戻します。

OpenAIとThriveは三つの柱を掲げます。第一に実務家との密接な連携、第二に入力から最終提出までの完全なプロダクション・トレース保全、第三にCodexによる評価駆動の改善ループです。賃貸物件で90%の精度・再現率に達するまで6週間を要しましたが、得た抽象化はSchedule CやAなどへ流用できると説明します。

Thriveは持株会社として現場企業を直接運営しているため、ベンダーではなくパートナーとして製品開発を進められる点を強みに挙げます。同じ設計図を簿記、監査、IT支援などへ展開する計画です。実務家の判断が学習を導き、製品が証拠を残し、エージェントが改善を回す。この三位一体が、これからの業務特化型AIの基本構造になりそうです。

メルクとマスターカード、AI基盤先行で実成果

メルクの実装事例

創薬サイクル3割短縮
販促資料最大8割迅速化
AWS2500口座など基盤先行

マスターカードの挑戦

不正請求対応にエージェント活用
信頼維持と効率化の両立
許容リスクの事前見極め

共通する教訓

配管整備を最優先
AIがAIを監督し精度向上

米製薬大手メルクと決済大手マスターカードが、AIエージェントの本番運用で具体的な成果を上げ始めています。VentureBeat主催イベントで両社幹部が登壇し、成功の鍵は派手なモデル選定ではなく基盤インフラの先行整備だったと明かしました。場当たり的な導入を避け、全社で再利用できる仕組みを敷いた点が共通項です。

メルクのデジタルプラットフォーム担当VPショーン・フィナティ氏によると、AI活用創薬の一研究サイクルが33%短縮され、患者への新薬到達が1年早まる見込みです。販促資料の作成でも、規制順守のチェックを担うAIが初稿で「99%正しい」品質に達し、レビュー期間を月単位から日単位に圧縮、納品を最大80%加速しました。アプリ近代化でもJavaScriptをPythonに書き換えるなど、従来は数カ月かかった作業をエージェントが代行しています。

ただし基盤がなければ成立しない、というのが同氏の核心です。メルクはAWSアカウントを2500、Azure・GCPも併用し、47拠点のエッジと数百のデータベースをMCPやA2Aで接続。「配管」と呼ぶ共通インフラを先に敷設したからこそ、現場が安全かつ摩擦なく多様なワークロードを走らせられると説明します。後付けでは数千の負債が積み上がり、革新を妨げると警告しました。

一方、マスターカードのチーフデータオフィサー、アンドリュー・レイスキンド氏は、チャージバックや不正請求の処理にエージェントを投入しています。決済ネットワーク・加盟店・消費者をまたぐ非構造データを束ね、決定論的判断と確率論的判断を組み合わせる難題に挑む構えです。効率化を進めつつも、消費者を疑うような誤判定で信頼を損ねるリスクを常に天秤にかけると語りました。

両社が口を揃えるのが、設計段階での許容リスクの定義です。レイスキンド氏は「ピーナツバターサンドと七面鳥サンドの取り違え」と「セリアック病患者への小麦提供」のたとえで、致命的な誤りと許容できる誤りを峻別すべきだと主張。1%の誤答が許されるか否かを先に決めれば、対策設計が前に進むとしました。

幻覚対策では、メルクがAIがAIを評価する多段検証を導入し、ClaudeMicrosoft Copilotが互いの出力を採点する仕組みで信頼度スコアを引き上げています。コスト算定は依然難しいものの、構成要素に分解すれば見通しは立つというのが両氏の結論です。インフラと統制の二本柱が、エージェントAIを実装フェーズへ押し上げているといえます。

NVIDIAが提唱する「AIファクトリー」の全容

トークン生産の経済学

エネルギーをトークンに変換する新インフラ
GB300 NVL72で前世代比50倍の効率
コスト・電力・稼働率が収益を左右

フルスタック設計と展開

Vera Rubinで性能電力比さらに35倍
DSX設計でGW級施設を標準化
Omniverse双子で設計・運用を最適化

エコシステムと実績

Cisco・Dell・HPEら5社と協業
NVIDIA社内で数百のAIエージェント稼働

NVIDIAは、AIの推論処理を大規模かつ常時稼働で行う新たなインフラカテゴリー「AIファクトリー」の構想を公式ブログで発表しました。産業革命期の発電所がエネルギー電力に変えたように、AIファクトリーはエネルギーをトークンに変換し、推論モデルエージェントに知能を供給する施設と位置づけています。その経済性は、秒間トークン数・ワットあたりトークン数・トークン単価・稼働率で測定されます。

性能面では、NVIDIA GB300 NVL72システムがメガワットあたりのトークン生成量で前世代Hopperの50倍を達成し、トークン単価を35分の1に削減したとしています。推論ワークロードをリアルタイムで効率的にさばくため、Dynamoフレームワークがロングコンテキスト推論と大規模スループットを統合管理します。次世代のVera Rubinプラットフォームは、LPXアーキテクチャにより性能電力比をさらに最大35倍に引き上げる設計です。

こうしたAIファクトリーはフルスタックで最適化されます。GPU・CPU・高速ネットワーク・液冷システム・推論ソフトウェア・ストレージが一体設計され、自律型マルチエージェントが常時稼働するワークロードを処理します。エージェント推論・計画・コード生成・ツール利用を自律的に行い、さらにサブエージェントを生成して専門スキルを獲得するため、推論負荷は従来よりはるかに大きくなっています。

NVIDIA DSXリファレンス設計は、ギガワット級のAIファクトリーを標準化するもので、設計・シミュレーション・運用をOmniverse DSX Blueprintのデジタルツインで統合します。Cisco、Dell、HPE、Lenovo、Supermicroといったパートナー企業と協力し、企業データセンターへの導入を推進しています。NVIDIA自身も社内AIファクトリーを運用し、数百の自律AIエージェントエンジニアリングや業務を支援している実例を示しています。

NVIDIA創業者兼CEOであるジェンスン・ファン氏は、6月1日のCOMPUTEX併催GTC Taipeiで基調講演を行う予定です。AIファクトリーは金融・ライフサイエンス・製造・公共部門などあらゆる産業が「構築するか借りるか」を問われる時代の基盤インフラだと、NVIDIAは訴えています。

CEOの「AI精神病」が大量解雇を加速

現場を知らないCEOの過信

Box創業者が「AI精神病」と命名
プロトタイプ体験で全自動化を過信
現場の検証・修正工程への理解不足
ClickUp CEOが社員22%を解雇しAI代替

研究が示す生産性の現実

UC Berkeley分析でAI導入生産性に相関なし
MIT研究、AIが人並みになるのは2029年以降
HBR調査でボトルネックが経営層へ移動
体感と実測の生産性に大きな乖離

テック業界のCEOたちがAIの能力を過大評価し、非合理的な経営判断を下す現象が広がっています。クラウドストレージ大手Boxの創業者アーロン・レヴィ氏はこれを「AI精神病」と呼び、CEOが現場業務から離れているがゆえにAIの限界を理解できていないと指摘しました。レヴィ氏自身はAI推進派の投資家でもあり、その警鐘には重みがあります。

この現象を象徴するのが、プロジェクト管理ツールClickUpのゼブ・エヴァンスCEOの判断です。同氏は約3,000のAIエージェントを社内に導入し、全社員の22%にあたる人員を解雇したとX上で公表しました。コスト削減が目的ではなく、AIエージェントの出力をレビューする少数精鋭の「100倍組織」を目指すと主張しています。

しかし、学術研究はこうした楽観論を支持していません。カリフォルニア大学バークレー校のメタ分析ではAI導入生産性向上の間に明確な相関は見出されず、全米経済研究所の調査でも体感上の生産性向上が実測値を大きく上回る「生産性パラドックス」が確認されました。MITの研究チームは、AIエージェントが多くのタスクで人間並みの品質を達成するのは2029年頃と予測しています。

さらにハーバード・ビジネス・レビューの調査は、全社員がAIで生産量を増やした結果、承認・判断を行う経営層がボトルネックになるという構造的課題を浮き彫りにしました。2026年はまだ5カ月しか経過していないにもかかわらず、テック業界の解雇者数は152社で11万5,430人に達し、2025年通年の12万4,636人に迫る勢いです。AIへの過信がもたらすのは生産性向上ではなく、組織の混乱かもしれません。

Warp、GPT-5.5でOSS開発をエージェント化

エージェント主導の開発モデル

PR の9割エージェントが作成
人間は意図定義とレビューに集中
GPT-5.5でトークン3割削減

Oz基盤と事業成長

クラウド基盤Ozで長時間稼働を管理
コンテキスト圧縮と永続メモリを実装
ARR前年比35倍に急成長
Fortune 500の56%超が利用

ターミナルアプリを開発するWarpは、自社のオープンソース開発にGPT-5.5を活用した「Open Agentic Development」モデルを発表しました。人間が目的を定義し成果を監督する一方、AIエージェントが計画・コーディング・テスト・プルリクエストの作成までを担います。OpenAIが同OSS リポジトリの創設スポンサーとなっています。

社内の実績では、エージェントプルリクエストの約90%を共同作成しています。GPT-5.5は従来のGPT-5.4と比べてエージェントコーディングタスクあたりのトークン消費を30%削減し、長時間稼働するワークフローの効率化に貢献しています。Warpはこの効率性が大規模なエージェント運用を持続可能にすると説明しています。

エージェントの管理基盤として、Warpはクラウドオーケストレーションプラットフォーム「Oz」を構築しました。Ozはローカルとクラウド両環境でエージェントを展開・調整する制御プレーンとして機能します。コンテキスト圧縮、永続メモリ、専用サブエージェントなどの仕組みにより、長時間ワークフローでもエージェントの精度を維持します。

事業面では、WarpのARRは前年比35倍に成長し、エンタープライズ収益は2025年第4四半期から500%以上増加しました。開発者数は約100万人に達し、Fortune 500企業の56%超が利用しています。エージェントワークフローの柔軟な拡張を求める企業需要が成長を牽引しています。

Warpはこのモデルを「ソフトウェア開発の未来」と位置づけています。個人がコーディングアシスタントを使う段階から、多数の永続エージェントを長期的に協調させるシステムへの進化を見据えています。ターミナルクライアントのオープンソース化により、オーケストレーションや検証の仕組みをコミュニティと共に形成していく方針です。

Remote、AI全社活用で1人あたり売上5割増

AI導入の成果

年間経常収益3億ドル突破
従業員1人あたり売上5割増
コア給与事業は前年比3倍超成長

全社員のAI活用

社内基盤Remote Labs稼働
顧客支援部隊Remote Build新設
新規コードの85%がAI生成

エージェント時代戦略

AI連携基盤Remote MCP公開
採用計画縮小も人員削減なし

オランダ・アムステルダム発の給与計算スタートアップRemoteが、社内のあらゆる階層でAIを取り入れた結果、従業員1人あたりの売上を50%伸ばしたと公表しました。同社は最近、年間経常収益が3億ドルを超え、キャッシュフローも黒字化しています。創業7年で迎えた節目の裏には、人員を増やさずに収益を拡大する新しい運営モデルがあります。

CEOのJob van der Voort氏は、自身のノートPCでClaudeを5つ同時に走らせていると明かします。Slackの議論を要約するエージェントや、エージェント型AIの実験も社内で進行中です。同氏は「採用を増やさずに売上が伸びている」と語り、AI活用が単なる効率化にとどまらず、事業のスケール構造そのものを変えつつあると強調しました。

AI活用は経営層やエンジニアに限られません。全部門の社員が社内向けマーケットプレイスRemote Labsでアプリを公開し、自社の技術基盤を使って業務を自動化しています。さらに同社は、顧客企業に常駐して類似の仕組みを構築するRemote Buildというフォワードデプロイエンジニア部隊を立ち上げ、ノウハウを外部にも展開し始めました。

コア事業である給与計算は前年比300%超の成長を遂げ、世界数万社の雇用コンプライアンスを支えています。一方で同社は、競合が採用したオールインワン型HRプラットフォーム路線とは距離を取り、難度の高い給与・コンプライアンス領域への特化を貫いています。AIによるソフトウェアのコモディティ化が進む中、専門特化が改めて優位性を生むという読みです。

エージェント時代を見据え、同社はModel Context Protocolに基づくRemote MCPを公開しました。BambooHRやWorkdayなどの外部プラットフォームやAIエージェントが、給与・コンプライアンスデータに直接アクセスできる仕組みです。ChatGPTClaudeから給与処理を操作できる未来を見据え、自社UIに依存しない運営も視野に入れています。

社内では新規コードの85%をAIが生成し、エンジニアの貢献量はこの1年で60%以上増えました。採用計画は縮小したものの人員削減はなしで、既存社員のAIスキル習得とAI投資の増額に資金を振り向けています。Remoteの事例は、AIが業務スピードだけでなく企業の拡大の仕方そのものを作り変えつつあることを示す、実証的なデータポイントと言えそうです。

Google検索AI回答化で従来SEO戦略が陳腐化

検索の構造変化

AI生成回答Google検索の中心に
10本の青リンク前提の戦略が無効化
ブランドのAI記述を把握できない企業多数

新時代のSEO対応

AI経由の流入は転換率4倍
ChatGPTが生成AI検索の主流
Google最適化だけでは市場を逃す
サイトのエージェント対応が必須に

Googleが年次開発者会議「Google I/O」でAI生成回答を検索結果の中心に据える方針を正式に打ち出し、長年「10本の青いリンク」を前提に築かれてきたSEO戦略の前提が崩れ始めています。TechCrunchのポッドキャスト「Equity」でAI検索特化スタートアップScrunchのパートナーシップ担当VP、マット・トンプソン氏が、企業マーケターと創業者が直面する地殻変動を解説しました。

最大の課題は、自社ブランドが生成AIにどう説明されているかをほぼ把握できない点にあります。従来のSEO検索順位やクリック率を指標としてきましたが、AIが要約して回答を返す世界では、ユーザーは元のページを訪れずに意思決定を済ませてしまいます。ブランド側の可視性は急速に低下しているのが実情です。

一方でトンプソン氏は、AI経由の流入がもたらす機会にも注目します。AIリファラルは従来のオーガニック検索より転換率が約400%高いと指摘し、量より質の流入として再評価すべきだと訴えました。さらにAI検索全体ではChatGPTが圧倒的なシェアを握っており、Google中心の最適化だけでは市場の大半を取りこぼす危険があるといいます。

対応策の核は「エージェント対応(agent ready)」なサイト構造への移行です。AIエージェントが情報を正確に抽出・引用できるよう、構造化データ、明確な事実記述、機械可読な情報設計を整える必要があります。ところが大企業サイトの多くは依然として人間の閲覧者だけを想定した作りにとどまっています。

経営者・マーケターに求められる発想転換は明確です。検索順位を競う時代から、AIに正しく引用される存在になる時代へ。Googleが提示する従来のSEOベストプラクティスを盲信せず、ChatGPTを含む主要AIプラットフォーム上での自社言及を継続的に監視・最適化する体制づくりが、今後の市場価値を左右する分岐点となりそうです。

AI導入ベンダーの64%がデータ処理先を未開示

シャドーAIの実態

63.6%のAIベンダーがサブプロセッサー未記載
DPA契約と実際のAI利用に大きな乖離
未承認モデルへの個人情報流出リスク

規制強化と企業の対応

米州政府が34億ドルプライバシー罰金
データ削除要求が5年で567%増加
手動処理コストが年150万ドルに到達
プライバシーチームは人員33%削減

プライバシープラットフォームのDataGrailが2026年版レポートを公開し、AI機能を宣伝するソフトウェアベンダー2,400社を調査した結果、63.6%がサードパーティのAIサブプロセッサーをDPA(データ処理契約)に記載していないことが判明しました。企業が導入したAIツールが、契約に明示されていないOpenAIGeminiなどのモデルに個人情報を送信している可能性があります。

同レポートによると、AI機能を開示しているシステムの32.8%が機密情報処理や自動意思決定など高リスク活動にも関与しています。個人データ処理が47.1%、自動意思決定が20.7%、健康・金融情報など機密データ処理が16.5%を占めました。2026年1月に発効したCCPAのリスク評価義務により、こうした未開示の処理は法的リスクを急激に高めています。

規制の執行は急速に強まっています。米国の州政府は2025年に34.25億ドルの罰金を科し、過去5年間の合計を上回りました。データ削除要求は2021年比567%増で過去最高を更新し、全リクエストの87%を占めています。中規模企業の手動処理コストは年間約150万ドルに達し、もはや人力対応は現実的ではありません。

一方でプライバシーチームの人員は最大33%削減されており、AI統治の需要拡大と逆行する状況です。90%のプライバシープログラムがAI対応で業務を拡大したにもかかわらず、成熟したAIガバナンス体制を持つ組織はわずか12%にとどまっています。DataGrailのCEOは、次の脅威としてエージェントAIが未検証のデータ処理を組織全体に自律的に拡散するリスクを指摘しました。

企業が長年依拠してきたDPAは、AIの急速な進化に追いつけず信頼性を失いつつあります。Gartnerは2026年末までに企業アプリの40%にAIエージェントが搭載されると予測しており、人間の監視が及ばない自律的データ処理の拡大は避けられません。プライバシー対策の自動化と、契約書の実態検証を早急に進めることが企業に求められています。

企業IT運用ベンチマークで最先端AIも正答率50%未満

ITBench-AAの概要

IBM等が企業IT障害診断を評価
Kubernetes障害59問で構成
全最先端モデルが正答率50%未満
SRE・FinOps・CISO領域へ拡張予定

モデル性能とコスト

Claude Opus 4.7が47%で首位
GPT-5.5が46%で僅差の2位
OSSモデルGLM-5.1が40%で健闘
試行回数の多さは精度に直結せず

IBMとArtificial Analysisは2026年5月27日、企業向けIT運用タスクでAIモデルの実力を測る初のベンチマーク「ITBench-AA」を公開しました。第1弾はサイト信頼性エンジニアリング(SRE)領域で、Kubernetesの障害対応を題材に59問が用意されています。モデルはログ・トレース・メトリクスなどを読み解き、インシデントの根本原因となるエンティティを特定する必要があります。

評価の結果、最も高いスコアを記録したのはClaude Opus 4.7(Adaptive Reasoning、Max Effort)の47%で、GPT-5.5(xhigh)が46%、Qwen3.7 Maxが42%と続きました。いずれも50%に届いておらず、既存のエージェント向けベンチマークの中で最も飽和度が低い部類に入ります。企業のIT運用自動化においてAIが実用水準に達するにはまだ距離があることが浮き彫りになりました。

興味深い知見として、試行ターン数の多さが精度向上に結びつかない点が挙げられます。GPT-5.5は平均31ターンで46%を達成した一方、Gemini 3.1 Pro Previewは平均83ターンを費やしながら30%にとどまりました。過剰な調査は障害注入メカニズムや付随症状を誤検出として拾いやすく、精度を下げる要因になっています。

コスト効率ではオープンウェイトモデルが存在感を示しています。Gemma 4 31B(Reasoning)はタスクあたり0.14ドルで37%を記録し、2.23ドルのGemini 3.1 Pro Preview(30%)をスコア・コストの両面で上回りました。GLM-5.1(Reasoning)も1.23ドルで40%と、商用モデルに匹敵する性能を低コストで実現しています。首位のClaude Opus 4.7はタスクあたり5.38ドルと最も高額であり、精度とコストのトレードオフが鮮明です。

ITBench-AAは今後、FinOps(財務運用)やCISO(情報セキュリティ)領域にも拡張される予定です。IBMが長年培った企業IT運用の専門知識を基盤としたデータセットと、Artificial Analysisのモデル評価ノウハウを組み合わせた本ベンチマークは、エージェント型AIの企業適用を見極める重要な指標になると期待されています。

Cognition、評価額250億ドルで10億ドル調達

資金調達の概要

評価額250億ドルで10億ドル超調達
8カ月前の102億ドルから約2.5倍に
Lux CapitalとGeneral Catalyst主導
Founders FundやRibbit Capitalも参加

事業の成長実績

年間売上約5億ドル規模に到達
企業利用が6カ月連続で月50%成長
NASAやゴールドマン・サックスが顧客
Windsurf買収で技術基盤を強化

AIコーディングエージェントDevin」を開発するCognitionが、プレマネー評価額250億ドル(約3.7兆円)で10億ドル超の資金調達を実施したと発表しました。2025年9月に評価額102億ドルで4億ドルを調達してからわずか8カ月で、企業価値は約2.5倍に跳ね上がった計算です。

今回のラウンドはLux CapitalとGeneral Catalystが主導し、既存投資家のFounders Fundや8VCに加え、Ribbit Capital、Atreides、Layer Globalが新たに参加しました。大手VCがこぞって出資した背景には、AIコーディング分野で独立系スタートアップが生き残れるという確信があります。AnthropicClaude CodeOpenAICodexGoogleJulesなどプラットフォーム企業が市場を席巻するとの見方が支配的だった中での大型調達です。

Cognitionは2025年にWindsurfの残存資産を買収し、技術基盤を拡充してきました。現在の顧客にはメルセデス・ベンツ、NASA、ゴールドマン・サックス、サンタンデール銀行といった大企業が名を連ねています。年間経常収益(ARR)は4億9,200万ドルに達し、エンタープライズ向けDevinの利用量は過去6カ月にわたり月次50%の成長を続けています。

今回の調達は、AIコーディング市場における競争構図に重要な示唆を与えます。モデル開発元が自社ツールで市場を独占するシナリオが有力視されてきましたが、Cognitionの急成長は、エンタープライズ顧客が専業プレイヤーの実行力を評価していることを示しています。独立系AIコーディングスタートアップにとって、追い風となる資金調達といえるでしょう。

RobinhoodがAIエージェントによる株式自動売買を開始

エージェント取引の仕組み

専用口座とウォレットで資金を分離
MCPでAIエージェントを接続
全取引を通知、一時停止も可能
不正検知チームが不審取引を監視

AI決済カードと今後の展開

Gold会員向けに仮想クレジットカード提供
エージェントが自動で買い物を実行
オプション・暗号資産・先物へ拡大予定
投資全損リスクをRobinhoodが明示

米株式取引アプリ大手のRobinhoodは2026年5月27日、AIエージェントがユーザーに代わって株式を自動売買できる新機能「エージェンティック・トレーディング」のベータ版を発表しました。同時に、AIエージェント専用の仮想クレジットカードも提供開始しています。

エージェント取引では、ユーザーがRobinhood上にAIエージェント専用の口座を作成し、あらかじめ設定した金額を専用ウォレットに入金します。AIエージェントはこのウォレット内の資金のみでポートフォリオ分析や取引戦略の立案、売買注文を実行します。接続にはオープン標準のMCP(Model Context Protocol)を採用しており、セクター分析やアナリストノートの参照も可能です。

リスク管理面では、全取引のプッシュ通知、リアルタイムの活動フィード、いつでも取引を一時停止できる機能を備えています。一部の取引ではユーザーの事前承認が必要となり、Robinhood側でも不正検知チームが不審な取引を監視・対応します。ただしRobinhood自身が「投資全額を失う可能性を含む重大なリスクがある」と明記しています。

もう一つの新機能として、Robinhood Gold Card会員向けにAIエージェント専用の仮想クレジットカードが提供されます。ユーザーが月間利用上限を設定し、エージェントがウェブ上で商品を検索・購入します。たとえばスニーカーが300ドル以下に値下がりした際に自動購入するといった使い方が想定されています。

現時点でエージェント取引は株式のみ対応ですが、今後オプション、暗号資産、イベント契約、先物、予測市場への拡大を予定しています。StripeAmazonGoogleなど大手もAIエージェント決済に参入しており、AIエージェントが金融取引を担う時代が本格的に到来しつつあります。

SnowflakeがAWSと60億ドルのAIチップ契約

大型契約の背景

5年間で60億ドルの契約
AI需要でAWS支出が倍増
Cortex AIがデータ活用を加速
ARM系Gravitonチップが対象

クラウド各社のチップ競争

MetaAWSと大型契約を締結
Google・MSも独自AI半導体を展開
NvidiaはVera CPUで反撃姿勢
クラウド勢がNvidiaの牙城に挑戦

クラウドデータ基盤大手のSnowflakeが、Amazon Web Services(AWS)と5年間で60億ドルの新契約を締結したと両社が5月27日に発表しました。Snowflakeは2012年の創業以来、AWS Marketplace経由で累計70億ドルの売上を記録しており、今回の契約はその総額に匹敵する規模です。

契約拡大の背景にはAI需要の急増があります。SnowflakeのAI構築ツール「Cortex AI」は、企業データに対する自然言語クエリや要約レポート生成などの機能を提供しており、顧客のAWS支出は2025年に前年比2倍の20億ドルに達しました。今回の契約では特にAWSの自社開発ARMベースCPU「Graviton」へのアクセス拡大が重視されています。

AIがモデル訓練から日常利用やエージェント自動化へと移行するにつれ、CPU需要が急増しています。GPUが訓練や推論を担う一方、エージェント関連タスクの大半はCPUが処理するためです。AWSは先月、MetaにもGravitonチップを数百万単位で提供する契約を締結しており、自社チップの価格競争力を武器に大型案件を次々と獲得しています。

一方、NvidiaのジェンスンCEOは新たなAI専用CPU「Vera」を発表し、2000億ドル規模の新市場を見込むと宣言しました。GoogleMicrosoftも独自AIチップの開発を進めており、AI半導体市場ではクラウド大手とNvidiaの競争が本格化しています。いずれの陣営が優勢となるにせよ、AI需要拡大の恩恵はクラウド各社に広く行き渡る構図です。

NVIDIA、台湾に年間1500億ドル投資を表明

巨額投資の全容

年間投資額が10倍超に急増
2030年稼働の新本社を建設
台湾をAI革命の震源地に

米中間の緊張構造

トランプの国内回帰策と矛盾
米国内生産は2025年に開始済
半導体供給網の地政学的課題

業界への波及

時価総額5兆ドル企業の戦略転換
台湾製造拠点の長期的優位性

NVIDIAのジェンスン・ファンCEOは5月27日、台湾への年間投資額を1500億ドル規模に引き上げる計画を発表しました。新たな台湾本社の建設を含むこの投資は、台湾をAI革命の「震源地」として位置づける大規模な戦略です。2026年中に着工し、2030年の稼働を目指します。

ファンCEOによれば、4〜5年前のNVIDIAの台湾への年間支出は100〜150億ドル程度でした。それが現在は1000億ドルに達し、さらに1500億ドルへと拡大する見通しです。投資規模の急激な拡大は、AIチップ製造における台湾の不可欠な役割を如実に示しています。

一方で、この動きはトランプ大統領が推進する米国内AI製造回帰の方針と緊張関係にあります。NVIDIAは2025年4月に米国内でのAIチップ生産を初めて開始しましたが、台湾への大規模投資はその流れに逆行するようにも映ります。ファンCEOはこの矛盾について明確な説明を避けています。

NVIDIAは2025年に時価総額5兆ドルを達成した世界最大の企業です。ファンCEOは台湾本社によって「3〜5年後にはさらに価値が高まる」と自信を示しました。AI需要の爆発的拡大に対応するため、台湾の半導体エコシステムへの依存はむしろ深化する構図が鮮明になっています。

MiniMax、M3モデルで長文推論を16倍高速化

M2の技術的到達点

2300億パラメータのMoE構造採用
98億パラメータのみ活性化し効率確保
全層フルアテンションで推論精度を維持
サブ二次手法は精度劣化で不採用

M3の革新と展望

独自のスパースアテンション機構MSA導入
デコード速度15.6倍の高速化実現
100万トークン長文処理を実用域に
エージェント大規模展開のコスト障壁を解消

中国AIスタートアップMiniMaxが、次期大規模言語モデル「M3」に搭載する新しいスパースアテンション機構「MiniMax Sparse Attention(MSA)」の技術概要を公開しました。MSAにより、100万トークンの長文コンテキストにおいてデコード速度が従来比15.6倍、プリフィル処理が9.7倍高速化されると報告しています。この成果は、長文処理AIエージェントの大規模展開を経済的に実現可能にするものです。

今回の発表に先立ち、MiniMaxはM2シリーズの詳細な技術レポートHugging Faceで公開しました。M2は総パラメータ数2299億、1トークンあたりの活性化パラメータは98億という効率的なMixture-of-Experts構造を採用しています。開発過程では、スライディングウィンドウアテンションやリニアアテンションなどのサブ二次手法を徹底検証しましたが、128Kコンテキストの複雑なタスクでスコアが90.0から72.0に低下するなど深刻な精度劣化が判明し、全層フルアテンションを維持する判断に至りました。

M3で導入されるMSAは、DeepSeekのMulti-head Latent Attention(MLA)とは異なるアプローチをとります。MLAがキーとバリューを低次元の潜在空間に圧縮するのに対し、MSAは標準的なGrouped Query Attention基盤の上でブロック単位の選択的アテンションを行います。圧縮せず実データ上で処理するため、精度低下やプレフィックスキャッシュの問題を回避できます。

プロダクト面では、MiniMaxは強化学習基盤「Forge」を構築し、エージェント能力の訓練を体系化しています。M2.7はこの基盤から生まれた自己進化型モデルで、自身の学習パイプラインの30〜50%を自律的に管理できます。OpenAIのMLE Bench Liteではメダル率66.6%を達成し、GoogleGemini 3.1 Proに並ぶ水準です。MSAの詳細技術ブログも近日公開予定で、M3が長文AIエージェントの実用化を加速させるか注目されます。

中国、民間AI人材にも出国制限を拡大

規制強化の背景

民間AI研究者に出国承認義務
Manus共同創業者出国禁止
Meta買収案の撤回要求が契機

米中AI競争の現在地

性能差は2.7%に縮小
中国は論文・特許数で急追
米国資本の流入にも事前承認
レアアース輸出規制も並行強化

中国政府が民間AI企業の研究者や経営幹部に対し、出国時の事前承認を義務付ける渡航制限を拡大していることが明らかになりました。Bloombergの報道によると、スタートアップ創業者や主要企業の幹部も対象に含まれており、AI人材の流出を食い止める北京の姿勢が一段と鮮明になっています。

規制強化の直接的な契機となったのは、MetaによるAIスタートアップManusの20億ドル買収です。中国当局はManusの共同創業者2名の出国を禁止し、外国投資規制に抵触するかどうかの調査を進めています。Manus側は約10億ドルを外部投資家から調達し、Metaから会社を買い戻す選択肢を検討していると報じられています。

米中間のAI性能格差は急速に縮まっています。スタンフォード大学の最新指標では、米中トップモデルの性能差は2023年の約31%から2026年3月時点で2.7%にまで縮小しました。米国はモデル品質や高インパクト特許で依然リードしますが、論文数・被引用数・特許件数では中国が猛追しています。

渡航制限に加え、中国はMoonshot AI、StepFun、ByteDanceなど主要AI企業が米国資本を受け入れる際にも政府承認を義務付ける方針です。さらに2025年にはレアアース14種の輸出規制を2度にわたり実施し、国営データセンターでの外国製AIチップ使用も禁止するなど、技術覇権をめぐる対抗措置を段階的に強化しています。

HF、差分同期で1兆パラメータ更新を高速化

差分同期の仕組み

bf16精度で99%の重みが不変
変化要素のみ疎形式で送信
ペイロードが1.2GBから最大35MBに
推論の停止時間を約1秒に短縮

分散学習の実現

Hub Bucketで重みを中継
訓練と推論がクラスタ不要で分離
vLLM拡張で30行の実装
Spacesで完全分散学習を実証

Hugging Faceは、非同期強化学習における重み同期のボトルネックを解消する「Delta Weight Sync」をTRLライブラリに実装しました。従来、非同期RLでは訓練ステップごとにモデル全体を推論エンジンに転送する必要があり、7Bモデルで14GB、1兆パラメータ規模では約1TBものデータ転送が発生していました。この技術はオープンソースとしてTRLのPR #5417で公開されています。

Delta Weight Syncの核心は、bf16精度における重み更新の数学的特性にあります。bf16の仮数部は7ビットしかなく、RLの学習率で生じる微小な更新の大部分はbf16の丸めに吸収されるため、連続する2ステップ間でおよそ99%の重みがビット単位で同一のままです。この性質を利用し、変化した要素だけをsafetensors形式のスパースファイルとして符号化することで、Qwen3-0.6Bモデルでは1ステップあたりの転送量を1.2GBから20〜35MBへと大幅に削減しました。

アーキテクチャはHub Bucketを介した3ボックス構成を採用しています。訓練ノードがスパースな差分をBucketにアップロードし、vLLMの推論サーバーがそれをダウンロードして適用します。訓練側と推論側が直接通信する必要はなく、共有クラスタもRDMAもVPNも不要です。vLLM側の実装はWeightTransferEngineの拡張としてわずか30行程度で、フォークなしで既存のvLLMに組み込めます。

実証実験では、訓練用GPU、vLLMを動かすHugging Face Space、Wordle環境を動かす別のSpaceという3つの独立したマシンで完全な分散学習を実行しました。いずれもネットワークを共有せず、Hub Bucketのみで接続されています。報酬は順調に上昇し、差分ペイロードは20〜35MBの範囲を維持しました。

Llama-3.1-405Bに適用した場合の試算では、従来のNCCLによる全同期で約8秒かかる推論停止が、差分転送では数秒に短縮され、転送量は約130分の1になると見込まれています。1兆パラメータ規模ではFireworksの実測値で約50倍の削減が示されており、クラウド間をまたぐ分散学習においてオブジェクトストレージ経由の差分同期が唯一の現実的な選択肢になりつつあります。

NYT労組がAI監視ツール導入に反発

AI監視の実態

DXで個人の生産性を数値化
Gleanが社内文書を横断検索
懲戒面談でAI指標を引用
事実上のノルマと労組が批判

労使交渉の争点

労組が不当労働行為を申し立て
AI利用情報の開示を経営陣が拒否
新契約でAI保護条項を要求
業界全体で同様の対立が拡大

ニューヨーク・タイムズの技術職労組Tech Guildが、経営陣によるAI監視ツールの導入が労働協約に違反するとして苦情を申し立てました。約700人のソフトウェアエンジニアデザイナーで構成される同労組は、DXとGleanという2つの社内AIツールが従業員のパフォーマンス評価に不正に使われていると主張しています。

DXはエンジニア生産性を測定するツールとして導入されましたが、当初は組織全体の改善が目的と説明されていました。しかし数カ月のうちにデータが個人レベルに細分化され、懲戒処分の場で「プルリクエストが業界標準より25%少ない」といった指標が引用される事態になっています。労組のAI委員長ベン・ハーネット氏は、これらの指標が仕事の質や実際の成果を反映していないと批判しています。

もう一つのツールGleanは社内ナレッジベースを横断検索するAIですが、労組は管理職が個人の業績を調べる監視手段としても使われていると懸念しています。最近の懲戒通知の文体がGleanで生成されたものと疑われるケースも報告されており、ツール自体の正確性にも問題があるとされています。

Tech Guildと編集職を代表するTimes Guildの双方が不当労働行為の申し立てを行い、AI利用に関する情報開示を求めました。Times Guildは現在進行中の新契約交渉で、AIツール使用時の人間関与の義務化やAI利用の透明な表示、モデル学習データへの報酬といった保護条項を要求しています。

こうした労使対立はNYTに限らずメディア業界全体に広がっています。ProPublicaでは4月に150人がAI関連の条件をめぐり24時間ストを実施し、McClatchyでは生成AIによる記事の自動リライトに抗議して記者が署名を拒否する動きが出ました。ハーネット氏はAIの全面禁止ではなく、労働者が導入の決定に参加する権利を求めていると強調しています。

Huawei、ムーアの法則に代わる独自設計手法を発表

新手法の概要

微細化ではなく演算速度の最適化
チップ間通信の高速化に注力
2026年冬までに成果を実証予定

制裁下の技術戦略

TSMCの最先端製造を利用不可
2031年に1.4nm相当の性能を目標
3D積層やハイブリッドボンディングを活用
西側との技術格差を縮小する狙い

Huaweiの半導体設計子会社HiSiliconの何庭波(ティンボー・ホー)社長が、IEEE国際回路システムシンポジウムで独自の半導体最適化手法「Tauスケーリング則」を発表しました。トランジスタの微細化に依存するムーアの法則に代わり、チップ・回路・システム全体の演算速度を高速化するアプローチで、中国チップと西側チップの性能差を数年内に縮小できると主張しています。

この発表の背景には、米国の輸出規制があります。HuaweiはTSMCとの取引を禁じられ、旧世代のリソグラフィ装置しか持たない中国SMICに依存せざるを得ません。最先端プロセスとの差は5年以上と推定されており、微細化の延長線上で追いつくのは現実的ではありません。HiSiliconはその制約を逆手に取り、チップ内の論理演算を高速化する「LogicFolding」や、チップ間インターコネクトの改善といった回路レベルの工夫で性能向上を図る戦略です。

何社長は「2026年冬までにサプライズを届ける」と宣言し、2031年までに1.4nmプロセス相当の性能を実現する目標を掲げました。TSMCが1.4nmの量産を2028年に予定していることを踏まえると、実現すれば中国の製造ラグは大幅に縮小します。ただし独立系アナリストのLennart Heim氏は、Huaweiの手法はハイブリッドボンディングや3D積層への依存度が高く、微細化の限界を示しているとも指摘しています。

今回の発表は、米国の制裁が中国半導体産業を抑え込むどころか、独自の技術革新を促している可能性を示唆しています。半導体業界全体がムーアの法則の物理的限界に直面するなか、HiSiliconのシステムレベル最適化が量産段階で成果を出せるかが、今後の米中半導体競争の行方を左右する重要な試金石となるでしょう。

元GoogleとApple研究者、継続学習AI基盤を創業

創業と資金調達

シード1500万ドル調達
投資評価額1.15億ドル
Conviction主導の有力VC
ジェフ・ディーン氏らも出資

事業内容と顧客

利用ログで週次再学習
DecagonらAIネイティブ採用
将来は毎時更新視野

Google DeepMindAppleなどのAI研究者が二十七日、新興企業Trajectoryを立ち上げたと発表しました。利用者の実際の操作データを学習に取り込み、企業のAI製品を継続的に改善する基盤を提供します。シードラウンドで1500万ドルを調達し、投資評価額1.15億ドルに達しました。

出資はベンチャーキャピタルのConvictionが主導し、Bessemer Venture PartnersやRadical VC、BoxGroupも参加しました。個人投資家としてGoogle DeepMindの主任科学者ジェフ・ディーン氏や、スタンフォード大学教授でWorld Labs最高経営責任者のフェイフェイ・リー氏も名を連ねています。最高経営責任者のロナック・マルデ氏は元WindsurfのAI研究者で、買収を経てGoogle DeepMindに移った経歴を持ちます。

同社が挑むのは、学習後に性能が固定化する現行の大規模モデルの限界です。OpenAIGoogleAnthropicが大規模言語モデルの能力を高めてきた一方で、運用中に誤りから学ぶ仕組みは未確立でした。チューリング賞受賞者のリチャード・サットン氏も二〇二五年十二月のNeurIPSで、継続学習が超知能の鍵だと指摘しています。

Trajectoryはオープンソースモデルを起点に、顧客ごとに事後学習を施します。顧客のひとつ、AI接客エージェントを手掛けるDecagonでは、人間に引き継がれた問い合わせなど失敗事例を記録し、おおむね週次でモデルを再学習します。狭い業務領域では、最先端の汎用モデルより高い精度を出せると主張しています。

顧客は法務AIのHarveyや営業AIのClayなどAIネイティブ企業が中心で、今後はフォーチュン500への展開も視野に入れます。共同創業者のマイケル・エラブド氏は、将来は毎日、さらには毎時や対話ごとにモデルを更新する世界を目指すと語ります。社員ごとに専用AIを育てる構想も口にしました。

もっとも、週一更新では真の継続学習とは呼べないとの批判も残ります。同社は静的なAIから動的なAIへの移行を掲げますが、検証が容易なコーディング以外の領域で成果を示せるかが当面の試金石となりそうです。

Reachy Miniが完全ローカルAI会話に対応

完全ローカル音声パイプライン

クラウド不要で音声AI会話を実現
VAD・STT・LLM・TTSの4段構成
Silero VADとParakeet STTを採用
Qwen3-TTSで多言語音声合成

柔軟なLLM構成と導入手順

llama.cppやMLXなど複数推論基盤に対応
Gemma 4推奨、vLLMも利用可能
brew一発でインストール完了
LAN経由でロボットと接続

Hugging Faceは2026年5月27日、小型ヒューマノイドロボット「Reachy Mini」の音声会話機能を完全にローカル環境で実行する方法を公開しました。従来はクラウドへの音声送信が必要でしたが、同社のspeech-to-speechライブラリを使い、VAD(音声区間検出)からSTT(音声認識)、LLM(大規模言語モデル)、TTS(音声合成)までの全パイプラインをローカルマシン上で動作させることが可能になりました。

技術構成はカスケード方式を採用しています。音声区間検出にはSilero VAD v5、音声認識にはParakeet-TDT 0.6B v3、音声合成にはQwen3-TTSを推奨構成として選定しています。各コンポーネントは独立しており、より高品質なモデルが登場すれば個別に差し替えられる設計です。

LLMの推論基盤はllama.cpp、MLX、Transformers、vLLMなど複数の選択肢に対応しています。推奨モデルはGemma 4のE4B量子化版で、llama.cppでは`brew install`一発で導入でき、64Kコンテキストウィンドウとフラッシュアテンションによる高速推論が可能です。Apple Silicon搭載MacではMLX経由でQwen3-4Bも低遅延で動作します。

プライバシーとコスト面のメリットも大きいです。音声データが一切外部に送信されず、APIの従量課金も不要になります。ロボット推論サーバーを別マシンで動かす場合も、LAN内のIPアドレスを指定するだけで接続できます。

Responses APIプロトコルに準拠しているため、ローカル推論だけでなくHugging Face Inference EndpointsやOpenAI互換プロバイダーへの接続も同じインターフェースで切り替え可能です。vLLM 0.21.0以降ではMulti-Token Predictionによるさらなる低遅延化も実現しています。

Google AI検索に優先ソースと引用元表示を追加

優先ソースのAI統合

AI Overviewに優先ソース表示
ユーザー登録済みサイトを明示ラベル化
クリック率が通常の2倍に向上

独自コンテンツの発見支援

話題記事のカルーセル表示導入
フォーラムやSNSの視点も提示
Highly Citedバッジで一次報道を識別
引用関係の可視化で信頼性を担保

Googleは2026年5月27日、AI検索における情報源の可視性と独自コンテンツの発見性を高める複数の新機能を発表しました。これまでトップストーリーに限定されていた「Preferred Sources(優先ソース)」機能が、AI OverviewsおよびAI Modeに拡張されます。ユーザーがあらかじめ登録したお気に入りサイトのリンクが、AI応答内で明確にラベル表示される仕組みです。

優先ソースに登録されたリンクは通常の2倍のクリック率を記録しており、すでに34万5000以上のユニークなソースが登録されています。サイト運営者向けにはドキュメントページが用意され、読者に優先ソース登録を促す方法が案内されています。パブリッシャーにとっても、AI検索経由のトラフィック獲得につながる施策といえます。

さらに、時事的なトピックに関する検索では、関連記事をカルーセル形式で目立つように表示する新機能が導入されます。AIが簡潔な文脈を提示したうえで、複数の記事や視点を並べることで、ユーザーが深掘りする記事を選びやすくなります。オンラインフォーラムやSNSからの一次情報も同様の形式で表示される予定です。

加えて、検索結果ページのウェブ記事リンクに「Highly Cited」バッジを拡大適用します。多くの他記事から引用されている一次報道を視覚的に識別でき、引用元を明示的に参照している記事もその旨が表示されます。これにより、情報の信頼性を素早く判断できるようになります。

一連のアップデートは、AI検索がウェブ上の情報源やクリエイターコンテンツとユーザーを結びつける方向性を強化するものです。Googleはオリジナルコンテンツの保護と可視化を進めることで、AI時代におけるパブリッシャーとの共存モデルを模索しています。