AWSに関する最新ニュース（169件） | 【AI Times】生成AIやLLMの最新情報・ニュース

NVIDIAとAWSが本番AI基盤を拡張、推論4.6倍に

2026年06月24日 NVIDIA Amazon AWS 検索ネットワークエンジニア推論 GPU クラウド投資エージェント RAG

新GPUインスタンス

EC2 G7を新たに提供

Blackwell世代GPU搭載

推論性能は最大4.6倍

最大8GPU構成に対応

検索と学習の強化

ベクトル検索を標準GPU化

索引は最大10倍高速・コスト4分の1

GB300で性能認定取得

詳細を見る

NVIDIAは6月24日、米AWSと連携し、本番規模のAI基盤を強化すると発表しました。両社はクラウド上の計算、検索、学習の各層を一体で改良し、企業が運用負担を抑えながらAIを実運用へ移せる環境を整えます。低遅延の推論や高速なベクトル検索、GPUの価格性能比といった課題に同時に対応する狙いです。

中核となるのが新インスタンス「Amazon EC2 G7」です。NVIDIAのRTX PRO 4500 Blackwell Server Edition GPUを搭載し、AI推論や映像処理、データ分析などの本番ワークロードに対応します。従来のG6と比べ、推論性能は最大4.6倍、グラフィックス性能は最大2.1倍に高まりました。

G7は最大8基のGPUと合計256GBのGPUメモリ、700Gbpsのネットワーク、最大7.6TBのローカルSSDを備えます。1基から8基までの構成に加え、ベアメタルも近く提供される予定です。利用者は過剰な設備投資を避け、用途に合わせて規模を最適化できる点が特徴です。

検索の層では、NVIDIAのライブラリ「cuVS」を使い、GPUによるベクトル索引をOpenSearch Serverlessの標準とします。これにより索引作成はCPU構成と比べて最大10倍速く、コストは4分の1に下がり、数十億規模のベクトルデータベースを1時間以内で構築できるとしています。検索拡張生成(RAG)や意味検索、エージェント型AIの基盤づくりが容易になります。

学習の層では、AWSがNVIDIA GB300向けに「Exemplar Cloud」認定を取得しました。NVIDIAが定める性能基準を満たしたことを示すもので、両社の協業による成果です。開発者は一貫した高性能基盤を前提に学習を進められ、クラウド選定や総保有コストの判断がしやすくなります。

今回の発表は、計算・検索・学習というAI基盤の全層を同時に底上げする内容です。共通する狙いは、運用チームの負担を増やさずに本番規模で性能を発揮できる環境を提供することにあります。企業がAIを計画段階から実運用へ移す動きが、さらに加速しそうです。

出典：NVIDIA公式

靴のAllbirdsがAI基盤企業Smartbirdへ転換

2026年06月19日 OpenAI AWS ディープラーニング半導体インフラクラウドエネルギー欧州ブランド

事業転換の中身

靴事業を4300万ドルで売却

株式市場で1億ドルを調達

社名をSmartbirdへ変更

従業員ゼロからの再出発

新CEOの戦略

元AWS幹部Carlsten氏が就任

データ主権重視の専用基盤狙い

年内に複数顧客へクラスタ展開

詳細を見る

米靴ブランドのAllbirdsが2026年6月、AI基盤企業Smartbirdへと事業を転換しました。同社は靴事業を4300万ドルで売却し、株式市場でさらに1億ドルを調達。直販シューズ会社が一転して、ディープラーニング向けの計算資源を提供する企業へと生まれ変わりました。

新CEOには元AWS幹部で工学博士のNadia Carlsten氏が就任しました。直前まで欧州の計算企業DCAIを率いていた人物で、就任初日を迎えたばかりです。同社にはまだ従業員がおらず、Carlsten氏は「新しいチームを採用し、オフィスも構える。今はインフラ運用を率いる人材探しに取り組んでいる」と語りました。

Smartbirdが狙うのは、データ主権を重視する企業向けの専用基盤です。ハイパースケーラーやニュークラウドとは競合せず、企業内の自前プロジェクトを置き換える形を想定しています。製薬・エネルギー・金融・公共部門など、サーバーを直接制御したい顧客が主な対象です。

Carlsten氏は大規模なチップ調達は不要だと説明します。顧客のニーズは数百から数千個のチップ規模にとどまり、求められるのは規模ではなくクラスタの俊敏性とインフラ制御だと述べました。価格競争にも参入せず、専用サーバーによる効率化で差別化を図る構えです。

ただし成長性には不透明さも残ります。Hewlett PackardやEquinixがすでに同種の単一テナント型サービスを提供しており、クラウド事業ほどの拡大余地があるかは見通せません。Carlsten氏は年内に複数顧客向けの計算クラスタを展開する見込みだと語りました。

今回の転換で、Allbirdsは持続可能性を掲げた公益法人（PBC）の地位を手放しました。OpenAIもAI安全性を掲げるPBCですが、今回の方向転換はPBCの拘束力が必ずしも強固でないことを示しています。Carlsten氏の報酬は年俸70万ドルと約900万ドル相当の株式で、取締役会はAI戦略への長期的な関与を約束したとされます。

出典：TechCrunch

AIエージェント基盤に脆弱性、7000台が遠隔操作の危機

2026年06月19日 LangChain AWS Flow 専門家リスク脆弱性パッチ認証エージェントプロンプト

3つの脆弱性連鎖

LangGraphでSQLi経由RCE

Langflowでパストラバーサル

LangChainで秘密鍵流出

実害と影響

約7000台がネット公開状態

Langflowは実攻撃を確認

API鍵や認証情報が標的

対策の要点

即時パッチ適用が必須

防御製品では検知困難

詳細を見る

AIエージェント開発で広く使われる3つの主要フレームワークに、深刻な脆弱性が相次いで見つかりました。Check Point ResearchはLangGraphのSQLインジェクションを遠隔コード実行(RCE)へ連鎖させ、TenableとVulnCheckはLangflowのパストラバーサルが実際に悪用されていると報告。CyeraはLangChain-coreの不備でAPI鍵が読み取られる危険を指摘しました。いずれも目新しい欠陥ではなく、古典的なバグが新しい基盤に潜んでいた形です。

最も差し迫っているのがLangflowです。ファイルアップロード用エンドポイントのパストラバーサル(CVE-2026-5027)を突くと、攻撃者は任意の場所にファイルを書き込めます。標準設定で自動ログインが有効なため、認証なしの1リクエストだけでシェルを奪取できてしまいます。Censysの調査では約7000台が公開されており、その多くが北米に集中しています。

VulnCheckは6月9日に実際の攻撃を確認しました。修正版1.9.0は4月15日に公開済みでしたが、攻撃開始までの約2カ月間、未更新のインスタンスは無防備にさらされていたことになります。教訓は、米政府のカタログ登録ではなく脆弱性公開の時点でパッチ適用を始めるべきだという点です。

LangGraphはエージェントに記憶を与える永続化層が狙われました。月5000万件超ダウンロードされる同基盤では、SQLインジェクション(CVE-2025-67644)で偽の行を書き込み、msgpackデコーダの欠陥(CVE-2026-28277)と連鎖させてコード実行に至ります。実環境での悪用は未確認ですが、実証コードはすでに公開されています。

LangChain-coreではプロンプト読み込みAPIの不備(CVE-2026-34070)により、.envファイル内のAPIキーなど任意のファイルが読み取られます。さらに環境変数の秘密情報を解決するデシリアライズ欠陥(CVE-2025-68664、CVSS9.3)も併発し、修正バージョンが異なる点に注意が必要です。両方を確実に更新しないと、より深刻な欠陥が残ります。

専門家は、これらが「AIリスク」とは見えない点を警告します。元AWS副CISOのMerritt Baer氏は、WAFは深層で動くデコーダを検知できず、EDRもエージェントサーバの通常動作として見逃すと指摘。輸入したフレームワーク自体を境界として守る発想が欠けていたことが、今回の盲点を生みました。利用企業は速やかなパッチ適用と公開資産の点検を急ぐべきです。

出典：VentureBeat

Copilot等の脆弱性で企業AIの信頼境界欠如が露呈

2026年06月18日 OpenAI Anthropic マイクロソフト Copilot AWS Flow Obsidian 検索リスク脆弱性認証画像エージェント AIゲートウェイ

相次ぐ脆弱性

Copilotのメール窃取連鎖

LiteLLMでCVSS9.9の権限昇格

Langflowで遠隔コード実行

供給網汚染の自己増殖ワーム

共通の根本原因

外部入力への信頼境界不在

AIエージェントの権限統治欠如

対策はプラミングの問題

詳細を見る

6月中旬、企業向けAIツールで同種の脆弱性が相次いで公表されました。15日にVaronisがMicrosoft Copilotのデータ窃取実証コードSearchLeakを、その4日前にはObsidian SecurityがAIゲートウェイLiteLLMの権限昇格連鎖を開示しています。共通する原因はただ一つ、企業AIが外部入力を信頼境界なしに受け入れる構造的欠陥です。

SearchLeakは、細工されたmicrosoft.comのURLをクリックさせるだけで、Copilotが利用者のメールボックスを検索し、Bing経由でデータを外部へ送り出す連鎖攻撃です。URLのパラメータがLLMへの指示として渡り、出力の無害化処理より先に画像タグが発火する競合状態を突きます。これはVaronisが12か月で確認した3例目のCopilot窃取連鎖であり、企業版は利用者の全権限を継承するため影響範囲が広がります。

LiteLLMはOpenAIやAnthropicなど複数プロバイダーの鍵を1つのプロキシ裏に保持します。Obsidianの連鎖は権限検証の不備を突いて管理者へ昇格し、サンドボックスを脱出して遠隔コード実行に至り、評価値はCVSS9.9でした。別のコマンド注入欠陥CVE-2026-42271はCISAの悪用既知リストに載り、6月22日が修正期限に設定されています。

同じ境界の崩壊はLangflowやnpmを狙うMini Shai-Huludワームでも確認され、4チームが4ツールで同一の運用上の失敗を証明しました。市場もこのリスクを織り込み始めており、CrowdStrikeのAI検知防御製品AIDRは年間経常収益が前四半期比250%超伸び、6月17日にはAWSのBedrockなどへ対象を拡大しています。

実務家も同じ問題を平易な言葉で指摘します。American Express GBTのCISOは「これは新しい影のIT、いわばシャドーAIだ」と語り、NIST枠組みなど基礎の徹底を導入前の前提に置きます。Enkrypt AIのMerritt Baer氏は「企業が承認したのはインターフェースであって奥のシステムではなく、リスクはモデルとデータをつなぐ接合部に潜む」と構造を言い当てました。

記事は対策として、各脆弱性をCVEや市場シグナルに対応づけ、検証コマンドと経営層向けの一文まで添えた5項目の信頼境界監査を提示します。これらはフロンティアモデルの問題ではなく、ゲートウェイや認証層といった配管の問題だと結論づけます。問われるのはベンダーが修正するかどうかではなく、攻撃者より先に自社が欠陥を見つけられるかどうかです。

出典：VentureBeat

Amazon、自社AIチップを外販しNvidiaに挑む

2026年06月18日 NVIDIA Amazon AWS ネットワーク半導体クラウドデータセンターセキュリティ Intel TSMC

外販方針の転換

Trainium外販を協議中

Jassy書簡が起点

年商500億ドル規模見込み

従来は外販拒否の姿勢

Nvidiaとの競争

Nvidiaは3260億ドル規模

Intel並みの売上水準

TSMC争奪が課題

詳細を見る

Amazon傘下のAWSが2026年6月18日、自社開発のAIチップ「Trainium」を他社のデータセンター向けに外販する協議を進めていると明らかにしました。AI責任者のピーター・デサンティス氏がBloombergに語ったもので、買い手企業名は明かしていません。Nvidiaが圧倒的に支配するAIチップ市場への、これまでで最大級の挑戦となる可能性があります。

外販構想の起点は、Jassy最高経営責任者が4月の株主向け書簡で示した発言です。同氏はチップ事業が単独なら年商約500億ドルに達するとし、需要の高さから「将来は第三者にラックごと販売する可能性が高い」と述べました。AWS広報も外販の可能性を認めています。

もっとも、AWSはこれまで外販に慎重でした。理由はチップ自体の収益に加え、ストレージやセキュリティ、ネットワークなど周辺サービスでも課金できる「滝のような」収益構造があるためです。自社クラウドで使わせる方が利益は厚くなります。

供給面の制約も重くのしかかります。現行Trainiumは即時完売し、1年以上先のTrainium4も予約で埋まりました。外販には既存顧客を待たせるか、TSMCで増産する必要がありますが、同社最大の顧客となったNvidiaを押しのけねばなりません。

500億ドル規模は、売上が3260億ドル規模で推移するNvidiaを揺るがすほどではなく、Intelの年商に近い水準です。それでもNvidiaのフアン氏がCPU市場へ拡大する一方、JassyはAIチップでNvidiaの牙城により深く食い込む構えを見せています。

出典：TechCrunch

Odyssey、評価額1.45億ドルでAmazonら出資

2026年06月17日 Google NVIDIA Amazon AWS 動画生成シミュレーション創業者投資家半導体クラウド動画ロボティクス投資資金調達評価額プロンプト

資金調達の規模

シリーズBで3.1億ドル調達

評価額14.5億ドル到達

Natural Capitalが主導

出資陣とクラウド戦略

Amazon・AMD・GVが参加

AWSを優先クラウドに採用

Trainiumチップ向け最適化

創業者と世界モデル

自動運転出身者が創業

テキストから動画生成

詳細を見る

世界モデルを開発する米新興企業Odysseyが、2026年6月17日、シリーズBで3億1000万ドルを調達したと発表しました。Natural Capitalが主導し、評価額は14億5000万ドルに達しています。AmazonやAMD Ventures、GVなどが参加し、累計調達額は3億3700万ドルとなりました。

世界モデルは、テキストや対話を扱う大規模言語モデルの次に来るAI技術と位置づけられます。物理世界からデータを集め、正確な物理法則に基づいてシミュレーションする点が特徴です。Odysseyは、人が背中にカメラを背負って撮影するという、Google Earthに似た独自手法でデータを収集してきました。

2023年創業の同社は、ゲーム制作からロボティクスまで幅広い用途向けに複数の世界モデルを提供しています。なかでも、テキストプロンプトから豊かで双方向の動画を生成する技術で知られています。

今回の調達で、AmazonとAWSの存在感が際立ちます。同社はAWSを優先クラウドプロバイダーとし、モデルをAWSのTrainiumチップ向けに最適化する方針です。これはNvidiaのAIチップに対抗する動きと言えます。

創業陣の経歴も注目に値します。CEOのオリバー・キャメロン氏は自動運転新興企業VoyageをGM傘下のCruiseに売却した実績を持ち、CTOのジェフ・ホーク氏は英自動運転企業Wayveの出身です。自動運転由来の知見が、世界モデルのデータ収集手法に生かされています。

エンジェル投資家陣も豪華です。Jeff Dean氏やElad Gil氏、Garry Tan氏、Guillermo Rauch氏、Cruise創業者のKyle Vogt氏らが名を連ねています。AIの次の主戦場とされる世界モデルへ、有力な資本が集まり始めています。

出典：TechCrunch

Vercel、社内AIアプリとエージェントを統制する企業基盤

2026年06月17日マイクロソフト Vercel GitHub Salesforce Slack AWS クラウドセキュリティ認証エージェント Snowflake

発表の柱

企業向け統制基盤を新設

社内アプリとエージェントを一元管理

安全を初期設定とする思想

主な機能

PassportでIdP認証を既定化

Connectで短命の認証情報付与

SSO連携の利用者管理

AWS上での自社運用に対応

詳細を見る

Vercelは2026年6月17日、企業全体が安全にAIアプリやエージェントを構築・公開できる新基盤「Vercel for Enterprise Apps and Agents」を発表しました。同社は過去1年間で社内に数百のエージェントや内部アプリを展開する中で、誰が利用できるか、どのデータに触れてよいか、コストはどれほどかといった統制上の課題に直面し、その解決策を製品化したものです。

中核となるのが認証基盤「Vercel Passport」です。これまで社内向けの公開設定は各プロジェクトで個別に行う必要があり、設定漏れが機密情報の露出につながる恐れがありました。Passportは全ての内部アプリとエージェントを標準でID基盤の背後に置き、OktaやMicrosoft Entra、Auth0などOpenID Connect対応のプロバイダーでアクセスを集中管理できるようにします。

もう一つの柱が「Vercel Connect」です。多くのエージェントは長期間有効な認証情報を環境変数に持つため危険でしたが、ConnectはOAuthやOIDC、秘密情報の注入を一本化し、タスク単位の短命な認証情報を都度発行します。Slack、GitHub、Snowflake、Salesforce、Linearなどへ安全に接続でき、作業完了とともにトークンは失効します。

利用者管理では「Enterprise Managed Users」が、SAML SSOとディレクトリ同期を基盤に全ビルダーのアカウントを一元統制します。入退社に応じた自動的なシート割り当てと権限剥奪を実現し、グループ別アクセス制御やMFA強制を組織全体に適用、全操作を単一の監査証跡に残します。現在はプライベートベータです。

このほか、AIアプリビルダー「v0」がSnowflakeと連携し、技術チケットなしで誰もがデータウェアハウス上のアプリを安全に作れるようになりました。大企業向けには、自社のAWSアカウントとVPC内で計算資源を動かし、Vercelが制御プレーンのみを担う持ち込みクラウド(BYOC)も用意。ソースコードがCIの外に出ない構成で、セキュリティチームが既存の統制を維持できます。

同社は、安全な道筋を初期設定にすることで、アイデアがセキュリティ審査で潰れる従来の構図を変えると説明します。専門知識を持つ現場の担当者が自らツールを作り、有望な試作はそのまま本番へ移行できる。実験が例外ではなく標準になる開発体験を、企業の統制要件と両立させる狙いがうかがえます。

出典：vercel.com

AWSがロボット制御をエージェントに統合するSDK公開

2026年06月17日 NVIDIA AWS ネットワークシミュレーション推論プロンプトインジェクション GPU 認証ポリシーロボットエージェントプロンプト Hugging Face Arm

SDKの中身

AWS製オープンソースSDK

LeRobot機能をAgentTool化

Apache2.0ライセンス

記録・学習・推論を一括統合

実機への展開

引数1つでシミュから実機へ

同一データ形式を共有

Zenoh活用の群制御

人間承認で安全担保

詳細を見る

AWSは6月17日、ロボット開発の各工程を一つのAIエージェントから自然言語で操作できるオープンソースSDK「Strands Robots」を公開しました。Hugging Faceのロボット学習基盤LeRobotの機能をエージェント用ツールとして束ね、これまで記録・学習・シミュレーション・実機展開・複数台連携の5つに分かれていた作業を一本化します。ライセンスはApache2.0です。

最大の特徴は、シミュレーションと実機のコードがほぼ同一である点です。ロボットを生成する関数は標準でMuJoCoベースの仮想環境を返し、引数をmode="real"に変えるだけで物理ロボットに切り替わります。仮想環境で記録したデータも実機の記録も同じLeRobotDataset形式で保存されるため、片方向けに書いた学習スクリプトをもう片方でもそのまま使えます。

ポリシー推論も共通の入口で扱えます。NVIDIAのGR00Tやローカル推論、MolmoAct2のチェックポイントを同じインターフェースで呼び出せるほか、ACTやSmolVLA、π0なども利用可能です。GPUやDocker、Hugging Faceの認証情報がなくても、模擬ポリシーを使えばノートパソコン上でシミュレーションを最後まで動かせる設計です。

複数台の連携には、ブローカー不要のP2PプロトコルZenohを使ったメッシュ機能を採用しました。新しいロボットは起動した瞬間にメッシュへ参加し、エージェントが一斉に指示を出せます。IPアドレスの管理や探索コードの記述は不要です。

物理的に動作する命令には人間の承認を介在させる仕組みが標準で入っています。一斉送信や緊急停止などはLLMの引数とは別経路で操作者の許可を求めるため、プロンプトインジェクションで承認を偽装する攻撃を防げます。本番運用ではmTLS認証が必須とされ、信頼できないデータを与えない設計が推奨されています。

この統合の狙いは、LeRobotが持つ資産を作り直さず、エージェントから扱える表層だけを足すことにあります。Hub上のあらゆるデータセットがエージェントの拡張・学習・展開の対象になり、仮想と実機の境界は設計上の分断ではなく単なる展開手順の違いになります。AWSはArmと協力した本番向けネットワーク層「Device Connect」も用意しており、コードを変えずに規模を広げられるとしています。

出典：Hugging Face

Datadog出身者がAIコーディング新興企業Niteshift設立、700万ドル調達

大手AI依存からの脱却

Greylock主導で700万ドル調達

Reid Hoffmanら著名エンジェル参加

モデル間を自動切り替えする基盤提供

トークン課金ではなく分単位の従量制

競合と差別化戦略

CursorやCognitionが先行する激戦市場

コードの検証・運用まで一貫対応

Datadog時代の大規模運用経験が武器

OpenAI・Anthropicの垂直展開を警戒

詳細を見る

AIコーディングエージェントの新興企業Niteshiftが、Greylockのジェリー・チェン氏主導で700万ドル（約10億円）のシードラウンドを完了しました。同社はDatadogの初期エンジニアだったサジド・メフムード氏とコナー・ブラナガン氏が共同創業し、Reid Hoffman氏やDatadog共同創業者のオリビエ・ポメル氏らも出資しています。

Niteshiftの中核にある発想は、AIコーディングにおける大手AIベンダーへのロックイン回避です。メフムード氏はDatadog時代、AmazonのEC事業と競合するためAWSを避けるeコマース企業を多く見てきました。同じ構図がAI業界でも起きていると指摘し、AnthropicやOpenAIが法務・医療・金融など垂直市場に進出する「SaaSpocalypse（SaaS崩壊）」を警戒する企業に選択肢を提供します。

技術面では、Claude CodeやCodexといった主要コーディングエージェントを置き換えるのではなく、プロジェクトの要件に応じて複数モデル間を自動ルーティングする仕組みを構築しています。課金モデルもトークン販売ではなく、クラウドプロバイダーのような分単位の従量制を採用しました。メフムード氏は「我々はAIに対してソフトウェアを売っている」と説明しています。

ただし、参入する市場は競争が激しいのも事実です。CursorはSpaceXによる600億ドル買収提案が報じられ、Cognitionは260億ドル評価額で10億ドルを調達しました。Amazon BedrockやOpenRouterなど大手も競合に名を連ねます。モデル非依存という考え方自体は新しくなく、先行者の優位は大きいといえます。

メフムード氏はこうした懸念に対し、創業チームの実務経験で差別化できると主張します。Datadogをスタートアップから数十億ドル企業に成長させる過程で培った大規模エンジニアリング運用の知見は、AIが生成するコードの実行・テスト・検証を本番環境で自律的に行うインフラ構築に直結すると述べています。

出典：TechCrunch

Microsoft公式パッケージ73件に認証情報窃取マルウェア混入

2026年06月08日マイクロソフト GitHub AWS エンジニア専門家インフラクラウドコンテンツセキュリティ認証コーディング開発ツールエージェント

攻撃の手口と被害

73件のパッケージが汚染

AIコーディングエージェント経由で発動

AWS・Azure・GCP等90超の認証情報を窃取

クラウド経由で横展開し他端末にも感染

Microsoftの対応と背景

GitHubは当初「規約違反」と表示

5月のdurabletask汚染に続き2度目

OIDC署名トークンの悪用で検証を突破

攻撃者TeamPCPのMiasmaマルウェアと特定

詳細を見る

Microsoftの公式リポジトリで公開されていたオープンソースパッケージ73件が、認証情報を窃取する高度なマルウェアに汚染されていたことが判明しました。開発者がAIコーディングエージェントでこれらのパッケージを開くと悪意あるコードが実行される仕組みで、複数のセキュリティ研究者が報告しています。

マルウェア「Miasma」は28KBのペイロードを実行し、AWS、Azure、GCP、Kubernetes、パスワードマネージャーなど90種以上の開発ツールから認証情報を抜き取ります。さらにクラウドインフラを通じて横方向に拡散し、他の開発者のマシンにも感染を広げる機能を持っています。攻撃者グループ「TeamPCP」によるもので、同グループが公開した「Mini Shai-Hulud」ツールキットの派生です。

今回の手口はSLSA（ソフトウェア成果物のサプライチェーンレベル）の完全性証明に使われるOIDCトークンを窃取し、正規のMicrosoft署名を悪用するものです。暗号署名による検証をすり抜けるため、開発者が通常のセキュリティチェックだけでは異常を検知できません。

この事件は5月にMicrosoftのdurabletask Python SDK（月間40万ダウンロード）が同様の手口で汚染された事案に続く、わずか数週間での2度目のサプライチェーン攻撃です。GitHubは当初パッケージを「利用規約違反」として無効化しただけで、マルウェア混入を明示しませんでした。Microsoftも月曜日になってようやく「潜在的な悪意あるコンテンツを調査中」と認めており、影響を受けた開発者はシステムが侵害されている前提で対応すべきだと専門家は警告しています。

出典：Ars Technica

NotionがAnthropic全モデルを一時無効化、障害後に復旧

2026年06月07日 Anthropic GitHub Notion Claude AWS Opus インフラ

障害の経緯

Opus 4.7/4.8の性能劣化を検知

Anthropic全モデルを一時無効化で対応

約12時間後にアクセス復旧

反響と各社の見解

投稿が約1,200回リポスト

Notion側は「一時的な障害」と説明

モデル品質問題との憶測を否定

Anthropicもインフラ障害と認め解決報告

詳細を見る

Notionは6月7日早朝、AnthropicのOpus 4.7および4.8モデルで性能劣化が発生し、Notion AIでこれらのモデルを選択したユーザーのエラー率が上昇していると公表しました。対応として、NotionはAnthropic製モデルすべてを一時的に無効化する措置を取りました。

約12時間後、Notionのプロダクト責任者Max Schoening氏はモデルへのアクセスを復旧したと報告しました。同氏は、この件がモデル品質の問題として拡散されていることに「驚いている」と述べ、あくまで一時的なサービス障害であると強調しています。

Notion側の投稿はX上で約1,200回リポストされ、大きな注目を集めました。Schoening氏は「こうした障害はNotionでもGitHubでもAWSでも起こりうること」と述べ、特定のモデル品質低下を示すものではないとの認識を示しました。

Anthropicも声明を発表し、「短時間のインフラ障害により複数のClaudeモデルでエラーが増加したが、問題はすでに解決済み」と説明しました。AI基盤サービスの安定性が、プロダクティビティツールの信頼性に直結する構図が改めて浮き彫りになった事例です。

出典：TechCrunch

NVIDIAが金融向け取引基盤モデルの構築支援を本格展開

2026年06月02日 NVIDIA Stripe AWS エコシステムエンジニア強化学習リスククラウドエージェント基盤モデルトランスフォーマー RAG

基盤モデルへの転換

個別AIモデルのサイロ化が限界に

トランスフォーマーで統一的な行動表現を学習

文脈理解により不正検知・与信の精度向上

手作業の特徴量設計が不要に

大手金融の採用状況

Revolutが240億イベントで基盤モデル構築

Mastercardが数百億件規模の独自モデル開発

Stripeが年間1120億ドルの不正をブロック

エコシステムの整備

NVIDIAが開発者向けテンプレートを公開

AWS・Nebiusのクラウド基盤で即時利用可能

詳細を見る

NVIDIAは2026年6月2日、金融機関が自社の取引データを活用してトランスフォーマーベースの基盤モデルを構築するための開発者向けテンプレート「Build Your Own Transaction Foundation Model」を公開しました。金融業界では不正検知・与信・レコメンドなど用途ごとに個別のAIモデルを運用してきましたが、サイロ化による非効率が課題となっており、統一的な基盤モデルへの移行が加速しています。

先行事例として、RevolutはNVIDIAと共同で「PRAGMA」と呼ばれる基盤モデル群を構築しました。26カ国・2600万ユーザーの240億件のイベントデータで訓練され、与信スコアリングや不正検知など複数領域で既存の専用モデルを上回る性能を示しています。従来数週間から数カ月かかっていた特徴量エンジニアリングが不要になった点も大きな成果です。

Mastercardは数百億件規模の匿名化された取引データで独自の大規模テーブル基盤モデルを開発中で、不正検知やパーソナライゼーションなど幅広い用途を見込んでいます。Adyenは1兆ドル規模の決済処理に基盤モデルを導入し、強化学習でコンバージョン最大化とリスク最小化を実現しています。Stripeは昨年1120億ドルの不正をブロックし、不正率を平均38%削減しました。

NVIDIAの調査によると金融機関の65%がすでにAIを活用し、42%がエージェント型AIの利用・評価を進めています。今回のテンプレートはAWSのSageMaker HyperPodやNebius AI Cloud上で利用可能で、EXL・Infosys・GFT・Thoughtworksなどのサービスパートナーが導入支援を提供します。既存のパイプラインに統合できる設計のため、ゼロからの再構築なしに基盤モデルの恩恵を得られる点が特徴です。

出典：NVIDIA公式

OpenAIの先端モデルとCodex、AWSで提供開始

2026年06月01日 OpenAI Amazon AWS Codex AI導入エンジニアリスクパッチセキュリティコンプライアンスコーディングデバッグコードレビューエージェント

提供開始の概要

AWS上でOpenAI先端モデルを一般提供

Amazon Bedrock経由で利用可能

週500万人利用のCodexも対応

商用・GovCloud両リージョン対応

企業導入の狙い

既存のセキュリティ・統制で利用

調達・審査の摩擦を低減

本番展開までの時間短縮

今後の展開

セキュリティ向けDaybreak提供予定

詳細を見る

OpenAIは2026年6月1日、同社の先端AIモデルとコーディングエージェント「Codex」をAWS上で一般提供開始したと発表しました。数百万に及ぶAWS顧客が、普段から業務に使うプラットフォーム上でOpenAIの能力を活用できるようになります。商用リージョンと政府向けのGovCloudの両方に対応します。

提供形態は2つあります。「Amazon Bedrock上のOpenAIモデル」は、AWS標準のセキュリティと統制機能を使ってAIアプリを構築できます。もう一方の「Bedrock上のCodex」は、週に500万人超が利用するソフトウェアエンジニアリング・エージェントを、開発チームが既に使う環境に持ち込み、コードの記述・レビュー・デバッグ・刷新を支援します。

今回の狙いは、企業のAI導入を阻む最大級の障壁を取り除く点にあります。セキュリティ審査やコンプライアンス、調達、課金、ガバナンスといった既存の業務フローを通じて先端AIを本番投入できるため、評価段階から実運用への移行を加速できます。チームが信頼する管理体制をそのまま使えることが利点です。

OpenAIは今後、AWS経由で利用できる機能を拡大する方針です。その一つが、ソフトウェアの構築と防御を変えることを目指す「Daybreak」です。サイバーモデルとCodex Securityを含み、安全なコードレビューや脅威モデリング、パッチ検証、依存関係のリスク分析などを日々の開発フローに組み込み、防御側がリスクを早期に把握できるよう支援します。

こうした専門機能が顧客に提供される際も、AWSはセキュリティチームが慣れ親しんだ枠組みで導入を進める経路となります。OpenAIとAWSの連携により、より多くの組織が高度なAIを本番環境で活用できる体制が整いつつあります。

出典：OpenAI公式

AmazonがBuzzFeed作品をAIアニメ化、原作者が猛反発

2026年05月29日 Amazon Instagram AWS AI活用クリエイターコンテンツ

AI番組化の経緯

BuzzFeedがキャラ「Cuppy」をPrime Videoにライセンス

GenAIクリエイターズ・ファンド発の企画

原作者Brantzは元社員、現在はIP非保有

原作者の主張と反応

「全アーティストへの攻撃」と声明

BuzzFeedとAIアニメのボイコット呼びかけ

契約時にAI利用は想定外と主張

法的手段も検討中

詳細を見る

Amazon Prime Videoが、BuzzFeedからライセンスを受けたキャラクター「Good Advice Cupcake（Cuppy）」を使い、AIツールで制作するアニメシリーズ「Cupcake & Friends」を企画していることがわかりました。この番組はAWSとAmazon MGM Studiosの共同イニシアチブ「GenAI Creators' Fund」から生まれた3作品のうちの1つです。キャラクターの原作者であるLoryn Brantz氏は、この動きに強く反発しています。

Brantz氏は2014年からBuzzFeedでライターおよびイラストレーターとして活動し、2017年にCuppyのコミックがSNSでバイラルヒットしました。もともと児童書向けに考案したキャラクターで、BuzzFeedは2019年にウェブシリーズ全8話を制作しています。Brantz氏は2023年にBuzzFeedを退社しましたが、CuppyのIPはBuzzFeedが保有しており、自身のコンテンツでは同社からライセンスを受けて使用していました。

Brantz氏はInstagramで「これは全アーティストへの攻撃だ」と宣言し、BuzzFeedとAI制作アニメのボイコットを呼びかけました。契約当時はAI技術が存在しなかったため、AIによるキャラクター利用は想定外だったと主張しています。一方BuzzFeedのJonah Peretti氏は、人間のクリエイティビティが中核にあると説明し、AIはディズニーがゼロックス技術を採用したのと同様の制作ツールだと反論しました。

Brantz氏はこのゼロックスとの比較を「深く誤解を招く」と批判し、公開討論を呼びかけています。ファンからは「勇気ある告発」として支持が集まっています。Brantz氏は法的手段の検討も進めていますが、「いつもほどは楽観的ではない」と語っており、クリエイターのIP保護とAI活用の境界線をめぐる議論は今後さらに激しくなりそうです。

出典：WIRED

AWSがAIエージェント向けにクラウド基盤を刷新

2026年05月28日マイクロソフト Vercel Cloudflare AWS 検索インフラクラウドエージェント Databricks Snowflake

OpenSearch新世代

コンピュートとストレージの分離

エージェント待機時は課金ゼロ

数秒でスケールアップ可能

VercelやKiroと標準連携

業界全体の転換

ボットがHTTP通信の31%を占有

2027年前半に非人間通信が過半へ

Azure・Snowflake・Cloudflareも対応急ぐ

エージェント前提の設計思想が主流に

詳細を見る

AWSは2026年5月28日、AIエージェント専用に設計した次世代OpenSearch Serverlessを発表しました。従来のクラウド基盤は人間のアクセスパターンを前提に構築されていましたが、AIエージェントは予告なく大量のサブエージェントを起動し、数百のデータベースやAPIを一斉に呼び出したあと瞬時に消えるという全く異なる負荷をかけます。この新サービスはそうしたエージェント特有のワークロードに対応するものです。

技術面での最大の変更点は、コンピュートとストレージの分離です。従来のサーバーレス版では最低1インスタンスの常時稼働が必要でしたが、新世代ではエージェントのトラフィック急増に合わせて数秒でコンピュートを拡張し、待機時にはゼロまで縮小できます。利用していない時間の課金がなくなるため、企業のコスト効率が大幅に改善されます。

この動きはAWS単独のものではありません。Cloudflareによると、過去6か月間でボットがHTTPトラフィック全体の31%を占め、2027年前半には非人間トラフィックが人間を上回る見通しです。DatabricksやSnowflakeはAI向けメモリ・検索基盤へと転換を進め、MicrosoftもAzureでエージェント間のメモリ共有機能を提供し始めています。

AIエージェントの本番導入が進むほど、機械生成ワークロード前提のインフラ再設計への圧力は強まります。それはエージェントの運用コストを下げ、大規模展開を容易にする好循環を生む可能性があります。クラウドの設計思想そのものが、人間中心からエージェント中心へと移行しつつあるのです。

出典：TechCrunch

Anthropic、650億ドル調達で評価額1兆ドルに迫る

過去最大級の資金調達

650億ドルのシリーズH完了

評価額は9650億ドル

Amazonから50億ドル含む150億ドルが既約分

年間売上高は470億ドル突破

初の営業黒字が視野に

計算資源の大規模確保

Amazon・Google・SpaceXと計算契約

Samsung・SK Hynix・Micronが戦略出資

SpaceXとの契約に食い違い

マスク氏は180日リースと発言

S-1書類には3年契約と記載

詳細を見る

Anthropicは2026年5月28日、シリーズHで650億ドル（約9.8兆円）を調達したと発表しました。ポストマネー評価額は9650億ドルで、1兆ドルの大台に迫ります。Altimeter Capital、Dragoneer、Greenoaks、Sequoia Capitalが共同リードを務め、Blackstone、Fidelity、GICなど世界有数の機関投資家が参加。IPO前の最後の民間資金調達となる可能性があります。

同社の年間売上高は今月470億ドルを超え、130%の増収により初の営業黒字が見込まれています。調達資金は安全性・解釈可能性の研究推進、計算能力の拡大、製品・パートナーシップの強化に充てる方針です。同日にはフラッグシップモデルClaude Opus 4.8も発表され、エージェント型タスクやコーディング能力の向上が打ち出されました。

注目すべきは計算資源の確保戦略です。Amazonと最大5ギガワットの新規容量契約、GoogleおよびBroadcomと次世代TPU5ギガワット契約、さらにSpaceX傘下のxAIが運営するColossusクラスタへのアクセス契約を締結しました。半導体大手のSamsung、SK Hynix、Micronも戦略的パートナーとして出資に参加。Claudeは主要3クラウド（AWS、Google Cloud、Microsoft Azure）すべてで利用可能な初のフロンティアモデルとなっています。

一方、SpaceXとの契約期間をめぐり不透明な点が浮上しています。イーロン・マスク氏はXへの投稿で「180日リースで、90日前通知による双方解約が可能」と説明しました。しかしSpaceXのS-1届出書には「顧客は2029年5月まで月額12.5億ドルを支払うことに合意した」と複数箇所に記載されており、3年間の契約を示唆しています。IPO申請中の企業としては矛盾する情報発信であり、証券法上の懸念を指摘する声も出ています。

競合のOpenAIは今年3月に1220億ドルを調達し評価額8520億ドルを記録しています。またxAIと合併したSpaceXはIPOで2兆ドルの評価額を目指しており、AIスタートアップの資金調達規模はかつてない水準に達しています。Anthropicの今回の調達は、安全性研究と商業成長の両立を掲げる同社が、熾烈な開発競争の中でどこまで存在感を示せるかを占う試金石です。

出典：TechCrunch | Anthropic公式 | TechCrunch

Amazonがデータセンター網を刷新、電力4割減を実現

2026年05月28日 Amazon AWS ネットワークエンジニアデータセンターエネルギードイツ

準ランダム型設計の突破口

準ランダム型ネットワーク構造を開発

従来のファットツリー構造の課題を解消

光学装置ShuffleBoxで配線を自動化

大幅なコスト削減効果

ルーター・スイッチ数を69%削減

データ処理速度が33%向上

消費電力40%・運用コスト27%削減

世界展開の現状

2024年にダブリンで初導入

新設データセンターの標準仕様へ

詳細を見る

Amazonは、データセンターのネットワーク設計で大きな技術的突破を果たしたと発表しました。「RNG（Resilient Network Graphs）」と名付けられた新方式は、従来の構造化されたネットワークとランダム型の性能優位性を組み合わせた「準ランダム」設計です。2024年後半から実際のデータセンターに静かに導入されてきました。

データセンターのネットワークは1980年代半ばから「ファットツリー」と呼ばれる階層型構造が主流でした。安定性は高いものの、構造が硬直的で配線が複雑になるという課題がありました。イリノイ大学の研究チームが2012年に提案した「Jellyfish」というランダム型ネットワークの概念は有望でしたが、実用規模への拡張には成功していませんでした。Amazonのチームは2023年からこの課題に取り組み、ペンローズ・タイリングの着想を経て、最終的に準ランダム型の設計にたどり着いたといいます。

この設計で鍵となるのが、ShuffleBoxと呼ばれるAmazon独自開発の光学装置です。ルーター間の接続を内部で自動的にシャッフルし、従来のような複雑な配線を大幅に簡素化します。WIREDの取材によると、従来型の雑然としたケーブル群と比べ、ShuffleBoxを通す新設計のケーブルは整然としているとのことです。

性能面の改善は顕著です。従来のネットワークと比較して、ルーターとスイッチの数を69%削減し、データスループットは33%向上しました。ネットワーク関連の消費電力は40%減少し、運用コストも27%下がっています。AWS ネットワークエンジニアリング担当バイスプレジデントのMatt Rehder氏は「ネットワークを平坦化することで、従来設計に伴うボトルネックを排除した」と述べています。

注目すべきは、この技術が生成AI向けではなく、日常的なデータセンター運用の効率化を目的としている点です。AI訓練のデータパターンは集中的に統制されており、ランダムグラフとは相性が異なるとRehder氏は説明しています。最初の導入先はアイルランドのダブリンで、その後ドイツやスペインにも拡大。現在は新設データセンターのほとんどにRNG方式が採用されています。

出典：WIRED

AIトークン先物市場が世界で始動、上海やCMEが整備へ

2026年05月28日 Google OpenAI NVIDIA オラクル AWS GPT-5 投資家推論 GPU インフラクラウドデータセンタークラウドサービス中国投資

先物市場の動き

上海先物取引所がAIトークンデリバティブを設計中

CMEグループがGPUレンタル先物を準備

NYSE親会社ICEもGPU計算先物を計画

H100のレンタル価格は時間1.40〜4.27ドル

市場形成の背景

AIインフラ投資が数千億ドル規模に拡大

トークン課金がAPI利用の標準に

ネオクラウド企業群が推論特化で参入

企業の計算コストヘッジ需要が顕在化

詳細を見る

2026年5月28日、中国の上海先物取引所がAIトークンのデリバティブ市場を設計していることがロイターの報道で明らかになりました。同時期に米CMEグループとNYSEの親会社であるインターコンチネンタル取引所（ICE）も、それぞれGPUレンタルの先物契約の立ち上げを発表しています。金や石油と同様に、AIの計算資源が金融商品として取引される時代が近づいています。

GPUレンタル市場はすでに一定の成熟を見せています。AI Mining Co.のデータによると、28のマーケットプレイスとクラウドプロバイダーにおけるNVIDIA H100の中央値価格は時間あたり1.40〜4.27ドル、H200は2.34〜5ドルで推移しています。しかしトークンそのものの先物市場は未整備であり、ここに新たな金融インフラの商機が生まれています。

背景にあるのは、AIインフラへの空前の投資です。クラウドサービスプロバイダーやプライベートエクイティ、インフラ企業が数千億ドル規模の資金をデータセンター建設に投じています。推論特化型のネオクラウド企業も台頭し、OracleやAWS、Google Cloudといった大手と競合する構図が鮮明になっています。

上海先物取引所のトークンデリバティブが実現すれば、企業や投資家、データセンター運営者がAIの計算コスト変動をヘッジする手段を得ることになります。OpenAIのGPT-5.5が100万入力トークンあたり5ドル、出力トークン30ドルで課金されるように、トークン単価はAIサービスの原価に直結しています。この市場の成立は、AI産業の金融化における重要な転換点となる可能性があります。

出典：TechCrunch

SnowflakeがAWSと60億ドルのAIチップ契約

2026年05月27日 Google NVIDIA マイクロソフト Meta Amazon AWS 推論半導体 GPU クラウドエージェント Snowflake

大型契約の背景

5年間で60億ドルの契約

AI需要でAWS支出が倍増

Cortex AIがデータ活用を加速

ARM系Gravitonチップが対象

クラウド各社のチップ競争

MetaもAWSと大型契約を締結

Google・MSも独自AI半導体を展開

NvidiaはVera CPUで反撃姿勢

クラウド勢がNvidiaの牙城に挑戦

詳細を見る

クラウドデータ基盤大手のSnowflakeが、Amazon Web Services（AWS）と5年間で60億ドルの新契約を締結したと両社が5月27日に発表しました。Snowflakeは2012年の創業以来、AWS Marketplace経由で累計70億ドルの売上を記録しており、今回の契約はその総額に匹敵する規模です。

契約拡大の背景にはAI需要の急増があります。SnowflakeのAI構築ツール「Cortex AI」は、企業データに対する自然言語クエリや要約レポート生成などの機能を提供しており、顧客のAWS支出は2025年に前年比2倍の20億ドルに達しました。今回の契約では特にAWSの自社開発ARMベースCPU「Graviton」へのアクセス拡大が重視されています。

AIがモデル訓練から日常利用やエージェント自動化へと移行するにつれ、CPU需要が急増しています。GPUが訓練や推論を担う一方、エージェント関連タスクの大半はCPUが処理するためです。AWSは先月、MetaにもGravitonチップを数百万単位で提供する契約を締結しており、自社チップの価格競争力を武器に大型案件を次々と獲得しています。

一方、NvidiaのジェンスンCEOは新たなAI専用CPU「Vera」を発表し、2000億ドル規模の新市場を見込むと宣言しました。GoogleやMicrosoftも独自AIチップの開発を進めており、AI半導体市場ではクラウド大手とNvidiaの競争が本格化しています。いずれの陣営が優勢となるにせよ、AI需要拡大の恩恵はクラウド各社に広く行き渡る構図です。

出典：TechCrunch

メルクとマスターカード、AI基盤先行で実成果

2026年05月27日マイクロソフト Claude Copilot AWS AI活用ネットワークリスクインフラ創薬エージェント MCP

メルクの実装事例

創薬サイクル3割短縮

販促資料最大8割迅速化

AWS2500口座など基盤先行

マスターカードの挑戦

不正請求対応にエージェント活用

信頼維持と効率化の両立

許容リスクの事前見極め

共通する教訓

配管整備を最優先

AIがAIを監督し精度向上

詳細を見る

米製薬大手メルクと決済大手マスターカードが、AIエージェントの本番運用で具体的な成果を上げ始めています。VentureBeat主催イベントで両社幹部が登壇し、成功の鍵は派手なモデル選定ではなく基盤インフラの先行整備だったと明かしました。場当たり的な導入を避け、全社で再利用できる仕組みを敷いた点が共通項です。

メルクのデジタルプラットフォーム担当VPショーン・フィナティ氏によると、AI活用で創薬の一研究サイクルが33％短縮され、患者への新薬到達が1年早まる見込みです。販促資料の作成でも、規制順守のチェックを担うAIが初稿で「99％正しい」品質に達し、レビュー期間を月単位から日単位に圧縮、納品を最大80％加速しました。アプリ近代化でもJavaScriptをPythonに書き換えるなど、従来は数カ月かかった作業をエージェントが代行しています。

ただし基盤がなければ成立しない、というのが同氏の核心です。メルクはAWSアカウントを2500、Azure・GCPも併用し、47拠点のエッジと数百のデータベースをMCPやA2Aで接続。「配管」と呼ぶ共通インフラを先に敷設したからこそ、現場が安全かつ摩擦なく多様なワークロードを走らせられると説明します。後付けでは数千の負債が積み上がり、革新を妨げると警告しました。

一方、マスターカードのチーフデータオフィサー、アンドリュー・レイスキンド氏は、チャージバックや不正請求の処理にエージェントを投入しています。決済ネットワーク・加盟店・消費者をまたぐ非構造データを束ね、決定論的判断と確率論的判断を組み合わせる難題に挑む構えです。効率化を進めつつも、消費者を疑うような誤判定で信頼を損ねるリスクを常に天秤にかけると語りました。

両社が口を揃えるのが、設計段階での許容リスクの定義です。レイスキンド氏は「ピーナツバターサンドと七面鳥サンドの取り違え」と「セリアック病患者への小麦提供」のたとえで、致命的な誤りと許容できる誤りを峻別すべきだと主張。1％の誤答が許されるか否かを先に決めれば、対策設計が前に進むとしました。

幻覚対策では、メルクがAIがAIを評価する多段検証を導入し、ClaudeとMicrosoft Copilotが互いの出力を採点する仕組みで信頼度スコアを引き上げています。コスト算定は依然難しいものの、構成要素に分解すれば見通しは立つというのが両氏の結論です。インフラと統制の二本柱が、エージェントAIを実装フェーズへ押し上げているといえます。

出典：VentureBeat

Kore.aiが新AIエージェント基盤Artemisを発表

2026年05月21日 Google マイクロソフト GitHub Salesforce AWS 推論クラウドコンプライアンスデプロイ CI/CD 米国医療投資エージェント

プラットフォームの技術的特徴

YAML基盤の独自言語ABLを開発

AI設計からデプロイまで自動化

LLMと業務ルールの二重頭脳構造

175種のAIモデルに対応

大手に挑むベンダー中立戦略

Microsoft Azure上で先行提供

Agent 365との深い連携を実現

マルチクラウド展開で囲い込み回避

規制業界で500社超の顧客基盤

詳細を見る

エンタープライズAI基盤を手がけるKore.aiは2026年5月21日、AIエージェントの設計・構築・運用を根本から刷新する新プラットフォーム「Artemis」を発表しました。Microsoft、Salesforce、Googleなど大手テック企業がAIエージェント基盤の覇権を争うなか、同社はベンダー中立と独自の中間言語を武器に差別化を図ります。

Artemisの技術的中核は「Agent Blueprint Language（ABL）」と呼ばれるYAMLベースの宣言型言語です。ABLはAIエージェントの定義・検証・ガバナンスを標準化し、GitHubでのバージョン管理やCI/CDパイプラインとの統合を可能にします。さらに「Arch」と呼ばれるAIシステムが、自然言語のビジネス要件をABLコードに変換し、テストデータ生成からデプロイ、運用後の最適化まで自動で実行します。

規制産業への対応として、Kore.aiは「デュアルブレイン・アーキテクチャ」を採用しました。LLMによる推論エンジンと、業務ルールを決定論的に実行するエンジンが共有メモリを介して並行動作する仕組みです。ガードレールはモデル側ではなくプラットフォーム層で強制されるため、銀行や医療など厳格なコンプライアンスが求められる業界でも安全に運用できます。

同社はMicrosoft Azureを初期提供先とし、Azure Foundry、Agent 365、Dynamics 365との深い連携を実現しています。一方で175種のAIモデル対応やAWS・Google Cloudへのマルチクラウド展開を掲げ、ハイパースケーラーへのロックインを回避する中立的選択肢として自社を位置づけています。

導入実績も大規模です。米国最大級の薬局チェーンでは年間約7億5000万件の電話対応にKore.aiを活用し、契約から6カ月で全9000店舗への展開を完了しました。世界第2位の投資銀行では13万5000人の従業員・請負業者が同社のAI for Workを利用しています。累計調達額は約2億2300万ドルに達し、Gartner、Forresterの各調査でリーダーに選出されるなど、アナリスト評価でも存在感を示しています。

出典：VentureBeat

GitHub内部3800件がVS Code拡張経由で流出

2026年05月20日 Google マイクロソフト GitHub Claude AWS Claude Code エコシステムリスクインフラセキュリティ認証デプロイ開発ツール Intel

侵害の経緯と影響

VS Code拡張機能経由で従業員端末が侵害

内部リポ約3800件が窃取対象

TeamPCP（UNC6780）が犯行声明

窃取データを5万ドルから販売開始

連鎖するサプライチェーン攻撃

npm639バージョンに偽造署名付きマルウェア

Microsoft公式Python SDKも汚染

Nx Console拡張機能も前日に侵害

攻撃ツールがオープンソース化され模倣犯拡大

詳細を見る

2026年5月20日、GitHubは従業員の端末にインストールされた汚染済みVS Code拡張機能を起点に、約3800件の内部リポジトリへの不正アクセスが発生したことを公式に認めました。脅威グループTeamPCP（Google Threat Intelligence GroupがUNC6780として追跡）が犯行を主張し、窃取したリポジトリを5万ドルから売り出しています。GitHubは「攻撃者の主張は調査結果と概ね一致する」と述べています。

この侵害は孤立した事件ではありません。同時期にTeamPCPによるサプライチェーン攻撃が複数の経路で展開されました。5月19日にはAlibaba系の@antvエコシステムで639の悪意あるnpmパッケージバージョンが検出され、合計で週間1600万ダウンロードに影響が及ぶ規模です。この攻撃波では、Sigstore署名証明書を実行時に偽造する手法が初めて導入されました。

さらに同日、Microsoftの公式Python SDK「durabletask」もPyPI上で3つの悪意あるバージョンが公開されました。過去のTeamPCP攻撃で侵害されたGitHubアカウントが悪用され、AWS、Azure、GCPなど90以上の開発ツール設定から認証情報を窃取するペイロードが仕込まれていました。月間40万ダウンロード以上のパッケージが対象です。

前日の5月18日には、220万インストールのVS Code拡張機能Nx Consoleも侵害され、GitHub、npm、AWSなどのトークンに加え、Claude Codeの設定ファイルまで窃取対象となっていました。Trend Micro、StepSecurity、Snykの調査では、TeamPCPは2026年3月以降少なくとも7波の攻撃を実施したと確認されています。

企業にとって深刻なのは、攻撃チェーン全体がMicrosoft系エコシステム内で完結している点です。VS Code拡張機能のマーケットプレイスに対するセキュリティ審査の不備は以前から指摘されており、今回の事態はその懸念が現実化した形です。GitHubは最重要認証情報の即時ローテーションを実施しましたが、流出した内部リポジトリにはインフラ設定やデプロイスクリプトが含まれており、二次被害のリスクが残ります。

出典：VentureBeat | GitHub公式

Cerebras上場初日に株価2倍、時価総額1000億ドル突破

2026年05月14日 OpenAI NVIDIA Groq Cerebras AWS 投資家推論リスク半導体クラウドデータセンター投資提携買収 IPO オープンソースモデル TSMC

史上最大級のAI半導体IPO

公開価格185ドルで55億ドル調達

初値385ドル、108%上昇で取引開始

完全希薄化後の時価総額1000億ドル超

OpenAI・AWSとの大型契約

OpenAIと200億ドル規模の推論計算契約

AWSが初のハイパースケーラー提携先に

推論クラウド収益が前年比94%増

残る経営リスク

UAE顧客が売上の86%を依然占有

非GAAP純損失は7570万ドルに拡大

詳細を見る

AIチップメーカーのCerebras Systemsが2026年5月14日にNasdaqに上場し、公開価格185ドルに対して初値385ドルと108%の急騰を記録しました。調達額は55億ドルで、2019年のUber以来最大の米テックIPOとなります。完全希薄化ベースの時価総額は1000億ドルを突破し、世界有数の半導体企業の仲間入りを果たしました。

Cerebrasは独自のウェハースケールエンジン（WSE）を開発しています。シリコンウェハー1枚をまるごと使う巨大チップで、第3世代WSE-3は4兆個のトランジスタと90万個のコアを搭載しています。NVIDIAのB200チップと比較して58倍の面積と2625倍のメモリ帯域幅を持ち、オープンソースモデルで最大15倍高速な推論を実現すると同社は主張しています。

事業面では2つの大型提携が成長の柱です。OpenAIとは750メガワットの推論計算容量を提供する200億ドル超の契約を2025年12月に締結し、わずか35日で最初のモデル稼働にこぎつけました。AWSとも2026年3月に提携し、Cerebrasのチップが初めてハイパースケーラーのデータセンターに導入されます。推論クラウド事業の売上は2025年に1億5160万ドルと前年比94%増に達しました。

一方で課題も残ります。2025年の売上5億1000万ドルのうち、UAE関連の2顧客（G42とMBZUAI）が依然として86%を占めています。非GAAPベースでは7570万ドルの純損失を計上し、営業損失も1億4590万ドルに拡大しました。半導体製造をTSMCに全面依存している点や、OpenAI契約に含まれる競合制限条項なども投資家が注視すべきリスクです。NVIDIAが2025年末に競合のGroqを200億ドルで買収するなど、AI推論チップ市場の競争はさらに激化しています。

それでも市場はCerebrasの将来性に強気です。AI推論市場は2025年の約660億ドルから2029年に2920億ドルへ成長すると予測されており、年平均成長率は45%に達します。IPOで得た資金と80億ドル超の手元資金を武器に、同社はデータセンターの急拡大と次世代チップの開発を進める構えです。

出典：TechCrunch | VentureBeat

Microsoft幹部、OpenAIのAmazon流出を懸念していた

2026年05月08日 OpenAI マイクロソフト Amazon AWS Codex リスク投資提携

提携初期の内部対立

Dota 2研究で3億ドル要求

Azure幹部は費用対効果に懐疑的

Xbox連携の代替案も浮上

関係変化の転機

CTO、当初はAI研究を軽視

自然言語処理への転換で評価一変

10億ドル出資を2019年に決定

現在への示唆

OpenAIがAWS展開を開始

当時の懸念が現実化する構図

詳細を見る

Musk対Altmanの裁判で提出された社内文書により、MicrosoftとOpenAIの提携初期における幹部間の緊張関係が明らかになりました。2017年夏、OpenAIがDota 2のプロ選手に勝利するAIボットを公開した直後、Altman氏はNadella CEOに対し、次の研究フェーズとして「Azureの定価で約3億ドル相当」の計算資源を要求しています。

この金額に対し、当時Azure責任者だったJason Zander氏は「5億ドル以上の増収が見込めなければ意味がない」と懐疑的な見解を示しました。OpenAI側はXboxとのゲーム分野での連携という代替案も提示しましたが、Xbox部門だけでは研究費用を賄えないと判断されています。

2018年1月、Kevin Scott CTOはNadella氏への書簡で、投資の見返りに確信が持てないとしつつも、OpenAIが「Amazonに駆け込んでAzureの悪口を言いふらす」リスクを指摘しました。AI業界での影響力を急速に高めるOpenAIを敵に回す代償を意識した発言です。

Scott氏はその後、ゲームAIを軽視していた自身の認識を反省し、OpenAIが自然言語処理モデルに軸足を移したことで評価を大きく改めました。2019年7月、Microsoftは10億ドルの大型出資を正式に発表しています。

約7年を経た現在、両社の関係は大きく変容しています。OpenAIは契約を再交渉し、AIモデルやCodexをAWSでも提供する方針を発表しました。社内メモでは「Microsoft独占契約が企業顧客への対応を制限してきた」と記されており、Scott氏がかつて恐れた「Amazon流出」のシナリオが、形を変えて現実となりつつあります。

出典：The Verge | The Verge

エンタープライズAI争奪戦が本格化、大型案件が連続

2026年05月08日 OpenAI Anthropic NVIDIA マイクロソフト xAI TikTok AWS AI導入ネットワーククラウド米国スタートアップ暗号資産投資提携買収 IPO Andreessen Horowitz

相次ぐ大型投資・提携

AnthropicとOpenAIが企業向けAI合弁事業を発表

SAPが独AI新興企業Prior Labsに約11.6億ドル出資

xAIとAnthropicが計算資源の融通で合意

国防総省がNvidia・Microsoft・AWSとAI契約締結

AI以外の注目動向

Katie Haun・a16zが暗号資産ファンドで数十億ドル調達

Aurora Innovationが無人トラック商用契約を獲得

TikTokerがSpirit Airlinesクラウド購入を呼びかけ

詳細を見る

TechCrunchのポッドキャスト番組Equityが、今週相次いだエンタープライズAI分野の大型案件を総括しました。AnthropicとOpenAIがそれぞれ企業向けAI導入を支援する合弁事業を発表し、SAPは設立わずか18カ月の独AIスタートアップPrior Labsに約11.6億ドルを投じるなど、企業向けAIツールを手がけるスタートアップが買収ターゲットとなる構図が鮮明になっています。

xAIがAnthropicに計算資源を提供する取り決めも話題となり、xAIが事実上の「ネオクラウド」として機能し始めている点が注目されています。番組ではこうした動きが今後の大型IPOシーズンにどう影響するかも議論されました。

AI以外では、米国防総省がNvidia、Microsoft、AWSと機密ネットワーク上でのAI展開契約を締結したことが取り上げられました。軍事分野でもAI投資が加速しています。

さらに、Katie Haunのベンチャーファンドが10億ドル、Andreessen Horowitzの暗号資産部門が22億ドルをそれぞれ調達し、暗号資産市場への再投資の動きも報じられました。自動運転トラックのAurora Innovationがバークシャー・ハサウェイ傘下企業との商用輸送契約を獲得した件や、TikTokerが経営破綻したSpirit Airlinesのクラウドファンディング購入を呼びかけている話題にも触れています。

出典：TechCrunch

Anthropic売上年換算300億ドル突破、前年比80倍成長

爆発的な収益成長

年間売上換算300億ドル到達

計画の10倍成長に対し80倍の実績

Claude Codeが半年で10億ドル規模に

企業顧客1000社超が年間100万ドル以上支出

計算資源の確保に奔走

SpaceXと30万kW超のGPU利用契約

Amazonから最大250億ドルの投資確保

Google・Broadcomと5ギガワットの計算容量契約

評価額1兆ドル視野

新ラウンドで9000億ドル超の評価額検討

2026年10月にもIPOの可能性

詳細を見る

Anthropicのダリオ・アモデイCEOは、同社の開発者会議「Code with Claude」で、2026年第1四半期の年間売上換算が300億ドルに達したと明らかにしました。年間10倍成長を計画していたにもかかわらず、実際には80倍という想定外の成長を記録しました。2024年1月の8700万ドルから約2年半でこの規模に到達しており、Salesforceが20年かけて達成した売上水準をわずか3年足らずで超えたことになります。

成長の中核を担うのが、AIコーディングツールClaude Codeです。2025年半ばの公開から半年で年間売上換算10億ドルを突破し、2026年2月時点で25億ドル超に達しています。週間アクティブユーザー数は1月から倍増し、法人契約は4倍に増加しました。Anthropic社内でもコードの大半をClaude Codeが生成しており、自社製品で次世代製品を開発するというフィードバックループが競争優位を強化しています。

急成長に伴い、計算資源の不足が深刻な課題となっています。Anthropicはイーロン・マスク氏のSpaceXが運営するColossus 1データセンターの全計算容量を利用する契約を締結しました。22万基超のNvidia GPUを含む300メガワット超の容量を確保します。マスク氏はこれまでAnthropicを公然と批判してきましたが、同社チームとの交流を経て「非常に有能で正しいことに真剣」と評価を転換しました。

資金調達面では、評価額9000億ドル超の新ラウンドを検討中で、実現すればOpenAIを抜いて世界最高額のAIスタートアップとなります。2025年3月の615億ドルからわずか1年余りで評価額は約15倍に跳ね上がりました。流通市場ではすでに1兆ドルの暗示的評価額で取引されており、2026年10月にもIPOを実施する可能性が報じられています。

一方で課題も山積しています。米国防総省が3月にAnthropicをサプライチェーンリスクに指定し、軍関連業務から排除しました。100社以上の企業顧客が取引継続に懸念を示しているとされます。またOpenAIは、Anthropicの300億ドルという数字にはAWSやGoogle Cloud経由の売上が総額計上されており、約80億ドル過大だと指摘しています。アモデイ氏はAIが単一エージェントから組織全体の知能へ進化する未来像を描き、2026年中に1人で運営する10億ドル企業が誕生すると予測しています。

出典：VentureBeat

トランプ政権がAI安全規制に転換、事前審査を導入

2026年05月06日 Google Anthropic マイクロソフト xAI AWS リスク脆弱性インフラデータセンターセキュリティ安全保障自主規制ドローン米国暗号資産 Dario Amodei トランプ Google DeepMind

規制転換の背景

Anthropic Mythos流出が国家安全保障を脅かす

David SacksのAIczar退任で規制抑止力低下

イランによるAWS データセンター攻撃が危機感を増幅

EUのAI規制強化も米国の方針転換を後押し

新たな安全体制

CAISIがフロンティアAIの事前テスト機関に

xAI・Microsoft・Google DeepMindと合意締結

これまでに約40件のモデル評価を完了

大統領令による審査義務化も検討中

詳細を見る

2026年5月、トランプ政権はフロンティアAIモデルのリリース前に政府による安全性テストを実施する方針へと大きく転換しました。商務省傘下のCAISI（旧AI安全研究所）がxAI、Microsoft、Google DeepMindとの間で事前審査に関する合意を締結し、バイデン前政権が進めていた安全規制路線を事実上復活させた形です。トランプ大統領は就任以来、AI規制を「イノベーションの妨げ」として撤廃を進めてきましたが、わずか1年余りで方針を180度転換しました。

転換の最大の契機は、Anthropicが開発したMythosの存在です。同モデルはサイバーセキュリティの脆弱性を発見する能力が極めて高く、Anthropic自身が悪用リスクを理由に一般公開を見送りました。この事実が国家安全保障に関わる当局者を強く動揺させ、財務長官Scott Bessentや首席補佐官Susie WilesがAnthropicのDario Amodei CEOと直接会談する事態に発展しています。

もうひとつの要因は、AI・暗号通貨担当のDavid Sacksがホワイトハウスを事実上追われたことです。ベンチャーキャピタリスト出身のSacksは、州レベルのAI規制法案を阻止するため議会工作や大統領令を活用しようとしましたが、共和党の同盟者やトランプ支持層からも反発を招きました。さらにイラン紛争を巡りトランプ大統領を公然と批判し、影響力を完全に失いました。

地政学的なリスクも政策転換を加速させています。イランは米国とイランの軍事衝突後、UAEにあるAWSのデータセンター2か所をドローンで攻撃し、中東全域で深刻な障害を引き起こしました。さらに米国テック企業18社を標的として名指ししており、AIインフラが軍事的脅威にさらされる現実を突きつけています。

CAISIはこれまでに未公開モデルを含む約40件の評価を完了し、セーフガードを低減した状態でのテストも実施しています。今後はトランプ大統領がAI事前審査を義務化する大統領令を発令する可能性も報じられており、米国のAI規制は「自主規制」から「政府主導」へと明確に舵を切りつつあります。EUでもAI法の改正議論が進んでおり、世界的に規制強化の流れが加速しています。

出典：The Verge | Ars Technica

Nutanix、企業AI基盤の本番運用課題に挑む新製品を発表

2026年05月06日 Google AWS ネットワークエンジニアインフラクラウドセキュリティ医療エージェント

実験から本番への壁

PoCから本番展開への実務的ギャップ

エージェントAIによるリソース競合の深刻化

AI開発者とインフラ部門の連携不足

セキュリティとガバナンスの要件増大

AI工場という解決策

GTC 2026でAgentic AI Solution発表

ハイブリッド環境でのセルフサービス基盤

規制業種向けデータ主権への対応

ネオクラウドへのソフトウェアスタック提供

詳細を見る

米Nutanixの幹部2名が、企業におけるAIの実験段階から本番運用への移行が直面する課題についてVentureBeatの取材に語りました。同社プレジデント兼CCOのTarkan Maner氏と、製品管理担当EVPのThomas Cornely氏は、プロトタイプを1万人規模の従業員に展開する段階で生じるインフラの根本的な見直しの必要性を指摘しています。

特にエージェントAIの台頭が新たな複雑性をもたらしています。複数のエージェントが同時に稼働し、リソースへのアクセスを奪い合う状況では、制約の設定やガバナンスの仕組みが不可欠です。Cornely氏は「エージェントがリソースを奪い合う環境では、制約を設け、リソースを統制できるインフラが必要だ」と述べています。多くの企業はクラウドで実験を始めるものの、データ管理やコストの問題から最終的にはオンプレミスへの回帰を検討する傾向にあります。

こうした課題に対し、NutanixはGTC 2026でNutanix Agentic AI Solutionを発表しました。コアインフラからKubernetesベースのコンテナサービス、エージェント構築・統制のための高度なサービスまでを包括するプラットフォームです。AI開発者とインフラチームの間に存在する「大きなギャップ」を埋め、インフラチームがAIエンジニアを支援できるツールを提供することが狙いです。

同社はハイブリッド環境を妥協策ではなく必須要件と位置づけています。規制産業ではデータ主権やセキュリティの観点からオンプレミスが求められる一方、パブリッククラウドとの連携も欠かせません。AWS、Azure、Google Cloudの各ハイパースケーラーに加え、ネオクラウドにもフルスタックを提供し、企業顧客がコンピュート・ネットワーク・AI機能をシームレスに拡張できる体制を整えています。

実際の導入事例では、小売業での店内AIカメラやキャッシャーレス決済、医療分野での診断・遠隔医療、製造・物流の最適化など、業種特化型のAI展開がすでに進行中です。ただし本記事はNutanixがスポンサーする記事であり、同社製品の優位性を前提とした構成である点には留意が必要です。

出典：VentureBeat

Microsoft、企業のAIエージェント統治基盤を正式提供

シャドーAIの脅威

従業員が無断導入するローカルAIエージェントの検出機能

MCP経由の認証なし公開やプロンプト注入攻撃を確認

DLPがエージェント通信を想定せず機密データ漏洩

Agent 365の主要機能

AWS・Google Cloud含むマルチクラウド一元管理

Defenderによる爆発半径マッピングとランタイム遮断

月額15ドル/ユーザーの予測可能な価格体系

段階的導入モデル

まず可視化と棚卸し、次にID・アクセス管理、最後に隔離と高度制御

Windows 365 for Agentsでサンドボックス実行環境を提供

詳細を見る

Microsoftは2026年5月、AIエージェントの統合管理プラットフォーム「Agent 365」を正式リリースしました。2025年11月のIgniteカンファレンスで発表された同製品は、企業のIT・セキュリティチームがあらゆるAIエージェントを一元的に可視化・制御するための基盤です。月額15ドル/ユーザーで提供され、Microsoft 365 E7スイートにも含まれます。

同社が最も強調するのは「シャドーAI」への対応です。従業員がIT部門の承認なくローカルデバイスにインストールするコーディングアシスタントや自律ワークフローが、新たなセキュリティリスクとして急速に拡大しています。AI Security担当CVPのDavid Weston氏は、MCP経由で認証なしにバックエンドを公開するケース、プロンプト注入攻撃、エージェント通信を想定しないDLPからのデータ漏洩という3種類のインシデントをすでに確認していると述べました。

Agent 365はまずOpenClawエージェントの検出に対応し、2026年6月までにGitHub Copilot CLIやClaude Codeなど18種類へ拡大予定です。Microsoft Defenderとの連携により、各エージェントが接続するMCPサーバー、関連するID、到達可能なクラウドリソースをグラフ化し、侵害時の「爆発半径」を可視化します。悪意ある挙動を検知した場合はランタイムで遮断する機能も備えます。

競合他社との差別化として、AWS BedrockやGoogle Cloud上のエージェントも検出・管理できるマルチクラウド対応を打ち出しました。さらにZendesk、SAP、Adobe、Nvidiaなど広範なパートナーエコシステムを構築し、SaaS エージェントのオンボーディングはEntra IDの付与だけで基本的なガバナンスが可能になります。

高リスクなワークロード向けには「Windows 365 for Agents」のパブリックプレビューも開始しました。エージェント専用のクラウドPCをIntuneで管理し、エンドポイントから隔離した状態で自律処理を実行できます。Weston氏は導入の段階を「棚卸し→ID・アクセス管理→隔離と高度制御」の3段階で示し、90日間で実現可能だと説明しました。

出典：VentureBeat

米国防総省、AI大手7社と機密ネットワーク契約を締結

2026年05月01日 Google OpenAI Anthropic NVIDIA マイクロソフト Amazon xAI AWS AI活用ネットワークリスク脆弱性セキュリティ安全保障米国

契約の全体像

Nvidia・Microsoft・AWSら4社と新規契約

Google・OpenAI・xAIとの既存合意に追加

機密レベルIL6・IL7環境へのAI配備

Anthropic排除の背景

大量監視・自律兵器の制限撤廃を拒否

国防総省がサプライチェーンリスクに指定

Anthropicは提訴し仮差止命令を獲得

軍のAI活用の現状

GenAI.milを130万人の職員が利用

ベンダーロックイン回避の方針を明示

詳細を見る

米国防総省は5月1日、Nvidia、Microsoft、Amazon Web Services、Reflection AIの4社と、AIモデル・技術を機密ネットワーク上で「合法的に運用」するための契約を締結したと発表しました。これにより、Google、OpenAI、xAIとの既存合意と合わせて、計7社のAI企業が米軍の機密環境にアクセスできるようになります。

契約の対象となるのは、国家安全保障上極めて重要なデータを扱うImpact Level 6（IL6）およびImpact Level 7（IL7）の環境です。国防総省は声明で「米軍をAIファーストの戦力として確立するための変革を加速する」と述べ、データ統合や状況把握の向上、意思決定支援に活用する方針を示しています。

一方、以前は2億ドル規模の機密情報取り扱い契約を持っていたAnthropicは、今回の契約から明確に排除されています。同社は国防総省が求めた国内大量監視や完全自律型兵器への利用制限の撤廃を拒否し、「サプライチェーンリスク」に指定されました。Anthropicは連邦政府を提訴し、3月に仮差止命令を勝ち取っています。

国防総省のエミル・マイケル最高技術責任者は、Anthropicを依然としてサプライチェーンリスクとみなす一方、同社のセキュリティモデル「Mythos」については「サイバー脆弱性の発見と修正に特化した能力を持つ、別次元の国家安全保障上の問題だ」と言及しました。

国防総省はすでに安全な生成AIプラットフォーム「GenAI.mil」を運用しており、130万人以上の職員が調査・文書作成・データ分析などの非機密業務に活用しています。今後もベンダーロックインを防ぎ、長期的な柔軟性を確保する方針です。

出典：TechCrunch | The Verge

Writerがプロンプト不要のAIエージェント基盤を発表

2026年04月30日 Google マイクロソフト Amazon Salesforce Slack AWS アシスタントワークフロークリエイティブ推論リスクエージェントプロンプト Adobe Gmail

イベント駆動型の自律実行

業務イベントを検知し自動でワークフロー実行

Gmail・Slack・Gong等6サービスに対応

自然言語で業務手順を定義可能

Zapierとは異なる推論型の判断実行

ガバナンスと市場戦略

暗号鍵持ち込みやDatadog連携を追加

コネクタ単位の権限制御で監査性を確保

Salesforce・SAP等のトリガー対応も予定

AmazonやMicrosoftのエージェント基盤に対抗

詳細を見る

エンタープライズAIプラットフォームを提供するWriterは2026年4月30日、AIエージェント基盤「Writer Agent」にイベントベーストリガー機能を追加したと発表しました。Gmail、Gong、Google Calendar、Google Drive、Microsoft SharePoint、Slackの6サービスで発生するビジネスイベントを自動検知し、人間の指示なしに複数ステップのワークフローを実行します。Salesforce Ventures、Adobe Ventures、Insight Partnersが出資する同社にとって、完全自律型エージェントへの最も積極的な一歩となります。

従来のAIアシスタントは人間がプロンプトを入力して初めて動作する「受動型」でしたが、今回のトリガー機能により「能動型」へと転換します。たとえばマーケティングチームの場合、Google Driveにクリエイティブブリーフが追加された瞬間に、リサーチ収集からアセット生成、成果物準備までの一連のプレイブックが自動で連鎖起動します。Writerの自社推論エンジン「Palmyra」がイベントの文脈を理解し、実行するかどうかをリアルタイムで判断する点が、条件分岐を手動で定義するZapier等の自動化ツールとの違いです。

自律実行に伴うリスクへの対策として、Writerはガバナンス機能を大幅に強化しました。チームごとに異なる権限を設定できるConnector Profiles、エージェントの全操作を追跡するAI Studio Observability、AWS・Azure・GCPの鍵管理サービスによる暗号鍵持ち込み、Datadogへのログ転送プラグインなどを同時にリリースしています。ワークフロー内に人間の承認チェックポイントを組み込むことも可能で、完全自律と人間監督のバランスを企業側が選択できます。

今回のリリースは、AWS、Salesforce、Microsoftがそれぞれエージェント基盤を強化するなか、非技術系ビジネスユーザーでも構築・運用できる点をWriterの差別化要因として打ち出すものです。今後はSalesforce、SAP、Workdayなど基幹業務システムへのトリガー対応も予定しており、たとえば商談作成をきっかけに関連資料やデモ環境の準備を自動実行する構想を示しています。新機能はWriter法人顧客に即日提供が開始されました。

出典：VentureBeat

MicrosoftとOpenAI、独占解消し新契約を締結

2026年04月30日 Google OpenAI Anthropic マイクロソフト Amazon ChatGPT AWS クラウド AGI 提携

契約再編の骨子

OpenAIが全クラウドで提供可能に

Azure独占が終了、AWSへ即日展開

Microsoftのライセンス期間を2032年まで延長

AGI条項を撤廃し将来モデルへのアクセス確保

収益構造の変化

OpenAI収益の20%をMicrosoftが取得

他社クラウド経由の収益も対象に

Azure OpenAI収益のOpenAIへの分配は廃止

Microsoftは約27%の持分を維持

詳細を見る

MicrosoftとOpenAIは2026年4月、長年の独占的パートナーシップ契約を大幅に再編しました。最大の変更点は、OpenAIが自社の製品・サービスをAzure以外のすべてのクラウドプラットフォームで提供できるようになったことです。発表翌日にはOpenAIがAWSへの最新AIモデル提供を発表し、Microsoftの最大のクラウド競合への進出が即座に実現しました。

収益面では、MicrosoftがChatGPTやAPIプラットフォームを含むOpenAI収益の20%を受け取る構造が維持されます。これにはAWSなど競合クラウド経由の収益も含まれます。一方、従来MicrosoftがOpenAIに支払っていたAzure OpenAI収益の20%分配は廃止され、一方向の収益共有へと変わりました。Microsoftは引き続きOpenAIの営利部門の約27%を保有しています。

技術面では、長年両社の関係を規定してきたAGI条項が撤廃されました。従来はAGI達成時にMicrosoftがOpenAIの最先端モデルへのアクセスを失う仕組みでしたが、この制約がなくなったことで、Microsoftは将来のモデルにも継続的にアクセスできます。非独占ライセンスの期限も2030年から2032年に延長されました。

背景には、AmazonがOpenAIと500億ドル規模の契約を結んだことや、OpenAI内部でMicrosoftとの独占契約が企業顧客へのリーチを制限しているとの不満があったことがあります。Microsoft側もAnthropicやGoogleのモデル活用を進めており、両社の関係は緊密な技術協力から財務的な提携へと性格を変えつつあります。

出典：The Verge

企業GPU稼働率わずか5%、恐怖心が最適化を阻む悪循環

2026年04月29日 AWS 創業者推論半導体 GPU クラウドコンテキスト

調達と構造の二重のムダ

GPU稼働率わずか5%の実態

割当喪失の恐怖で過剰確保が常態化

コンテナ設計がGPU遊休時間を増大

AWSがH200予約価格を15%値上げ

改善への具体策

タイムゾーン活用のGPU共有が有効

ワークロード別のチップ選定が急務

H100やA100で40〜60%のコスト削減可能

調達と運用を一体で見直す必要性

詳細を見る

企業のGPUフリート稼働率がわずか5%にとどまっていることが、Cast AIの2026年版Kubernetes最適化レポートで明らかになりました。これは人手による通常管理で達成できる約30%を大幅に下回る数値です。同社の共同創業者Laurent Gil氏は、クラウド GPUの調達構造そのものが問題の根源だと指摘しています。

稼働率が極端に低い原因は、調達とアーキテクチャの二重構造にあります。企業がGPUを確保する際、数週間から数カ月の待機期間を経てようやく割当を受けますが、1年または3年の契約が条件です。一度確保したGPUは、再取得の困難さから誰も手放そうとしません。手放せば稼働率は改善するが、手放した瞬間に再入手できなくなるという矛盾が、過剰確保の悪循環を生んでいます。

アーキテクチャ面でも問題は深刻です。Anyscaleの分析によると、AIワークロードはCPU処理とGPU処理を交互に行うため、1つのコンテナにまとめるとGPUが大半の時間遊休状態になります。Gartnerも同様の結論に達しており、プロジェクト横断でのGPU共有と推論の分離を推奨しています。調達の過剰確保とコンテナ設計の非効率が重なり、5%という数字が生まれているのです。

クラウド市場は二層に分裂しています。H100のオンデマンド価格は2025年9月の約7.57ドルから約3.93ドルへ下落した一方、最新のH200は需要が供給の約3倍に達し、AWSは2026年1月に予約価格を約15%値上げしました。クラウドコンピューティングが毎年安くなるという20年来の前提は、最先端チップでは崩れつつあります。

では企業は何をすべきでしょうか。まず問うべきは「本当にH200が必要か」という点です。H200は70B以上のパラメータと128K以上のコンテキストを持つ大規模モデル向けであり、多くの本番ワークロードではH100で40%、A100で60%のコスト削減が可能です。タイムゾーンを活用したGPU共有、MIGによるチップ分割、vLLMやDynamoによる推論分離など、既存リソースの活用策は存在します。調達と運用を別々の予算項目として扱うのではなく、一つのループとして一体的に最適化することが、この悪循環を断ち切る鍵となります。

出典：VentureBeat

中東データセンターへの攻撃で大手IT企業が投資凍結

2026年04月29日 AWS 投資家リスクインフラクラウドデータセンターエネルギークラウドサービスドローン米国欧州シリコンバレー投資 Snowflake

施設被害と投資判断

Pure DC、中東全投資を一時停止

イラン攻撃でAWS施設3拠点が被害

構造損傷・電力障害・水損害が発生

クラウドへの波及

銀行・決済など広範囲で障害

配車アプリCareemにも影響

戦争被害は保険適用外で企業負担

湾岸DC計画の根本的見直し

詳細を見る

ロンドン拠点のデータセンター開発企業Pure Data Centre Groupは、イランのミサイルまたはドローン攻撃により自社施設が損傷したことを受け、中東における全プロジェクトへの投資を凍結しました。同社のゲイリー・ウォイタシェクCEOはCNBCの取材に対し、「状況が落ち着くまで、誰も大規模な新規資本を投入しない」と語っています。Pure DCは欧州・中東・アジアで1ギガワット超のデータセンター容量を運営・開発しています。

今回の判断の背景には、2月28日の米国・イスラエルによるイラン攻撃を発端とするイラン戦争があります。イランはホルムズ海峡の封鎖による貿易妨害に加え、湾岸地域の米軍基地やエネルギーインフラへの攻撃で応酬しました。シリコンバレーの投資家やテック企業が湾岸諸国で進めてきた数兆ドル規模のAI・クラウド向けデータセンター建設計画は、根本的な見直しを迫られています。

イランはアラブ首長国連邦のAWS データセンター2拠点を直接攻撃したほか、バーレーンの3拠点目も自爆ドローンの至近弾で損傷させました。AWSは3月1日にサービスダッシュボードを通じて、構造的損傷、電力供給の途絶、消火システム作動による水損害が発生したと報告しています。

この被害により、銀行や決済プラットフォーム、ドバイ拠点の配車アプリCareem、データクラウドのSnowflakeなど、AWSの顧客企業に広範なクラウドサービス障害が波及しました。戦争による被害は保険の適用対象外であり、データセンター開発企業が自らコストを負担せざるを得ない状況です。地政学リスクが、AIインフラの立地戦略そのものを揺るがしています。

出典：Ars Technica

AWSがOpenAIモデルをBedrock提供、エージェント時代の基盤争い本格化

2026年04月29日 Google OpenAI Anthropic マイクロソフト Meta Amazon Slack AWS アシスタント GPT-5 エンジニア専門家推論強化学習リスクインフラクラウド医療エージェント

Bedrock上のOpenAI統合

GPT-5.4が限定プレビューで即日利用可能

既存ワークロードの移行不要で即座に切替可

Anthropic・Meta等と統一APIで比較運用

エージェントAI製品群の展開

Quick Desktopが個人知識グラフで能動的に業務支援

Amazon Connectが4製品に拡大、物流・採用・医療に対応

Bedrock Managed Agentsで強化学習訓練済みハーネス提供

ガバナンスと競争構図

ゼロオペレーターアクセスで推論データの人的接触を排除

モデルアクセスのコモディティ化でプラットフォーム層が差別化要因に

詳細を見る

2026年4月29日、AWSはサンフランシスコでのイベントで、OpenAIの最新モデルをAmazon Bedrock経由で提供開始すると発表しました。GPT-5.4が限定プレビューで即日利用可能となり、GPT-5.5も近日中に追加される予定です。この動きは、前日にMicrosoftとOpenAIが独占契約を再編し、OpenAIが競合クラウドへの展開を可能にしたことを受けたものです。

技術面では、Bedrock Managed Agentsが注目されます。OpenAIの「ハーネス」と呼ばれるエージェント実行フレームワークを組み合わせ、強化学習によりモデルをツール操作に最適化しています。AWS副社長のAnthony Liguori氏は、汎用モデルに指示を与えるだけでなく、特定のツールセットで繰り返し訓練することで「筋肉の記憶」のような信頼性が生まれると説明しました。

同時に発表されたAmazon Quick Desktopは、開発者以外のナレッジワーカー向けのエージェントAIアシスタントです。ローカルファイル、カレンダー、メール、Slackなどから個人知識グラフを構築し、未回答メールや更新が必要な案件を能動的に提示します。一方で専門家からは、この自律的な判断が既存のオーケストレーション基盤の可視性の外で行われる「シャドーオーケストレーション」のリスクも指摘されています。

Amazon Connectは従来のコンタクトセンター製品から、サプライチェーン計画（Decisions）、大量採用（Talent）、医療（Health）、顧客対応（Customer AI）の4製品ファミリーへと拡大しました。Amazonの30年にわたる物流最適化技術やOne Medicalの経験が活用されています。

一連の発表は、AWSがカスタムインフラ、モデルアクセス、エージェントプラットフォーム、専用アプリケーションの4層戦略でエンタープライズAI市場を狙う姿勢を明確にしました。モデルへのアクセスがコモディティ化する中、エージェントの構築・統治・運用を担うプラットフォーム層が、Microsoft・Google Cloudとの真の競争領域になると見られています。

出典：VentureBeat | VentureBeat

Vercel AIアクセラレーター2026年デモデー開催

プログラムの概要と内容

39チームがデモデーに登壇

6週間の集中プログラム実施

技術ワークショップと講演を毎週開催

総額800万ドルのクレジット提供

受賞チームと成果

優勝はエンタープライズ財務AI「Rex」

2位はセキュリティAI「Hacktron AI」

3位は不動産AI「Roots」

前回卒業生が累計1億ドル超を資金調達

詳細を見る

Vercelは4月16日、サンフランシスコ本社で2026年AIアクセラレーターのデモデーを開催しました。39チームが6週間の集中プログラムを経て、投資家やAI業界のリーダーの前でプレゼンテーションを行いました。参加チームはエージェント、開発者ツール、消費者向けアプリ、金融・セキュリティ・ヘルスケア・ロボティクスなど幅広い分野でAIプロダクトを構築しています。

プログラム期間中、参加チームは毎週2回のセッションに参加しました。技術ワークショップではエージェントやモデルからデプロイ、スケーリングまでの実践的な内容が扱われ、ファイアサイドチャットではOpenAIやWindsurfのチームなど業界リーダーが登壇しました。プログラム中盤にはBuilder Dayが開催され、AWSやAnthropicのエンジニアとのオフィスアワーも実施されています。

各チームにはVercelおよびパートナー企業から合計800万ドル相当のインフラストラクチャとクレジットが提供されました。パートナーにはAWS、Anthropic、OpenAI、Browserbase、ElevenLabs、Auth0、WorkOS、Notion、Modal、Neon、Supabaseなどが名を連ねています。

デモデーでは問題の妥当性、技術適合性、プロダクト品質、ピッチ内容の4項目で審査が行われました。優勝したRexはエンタープライズ向け財務バックオフィスAIを開発しており、Vercel Venturesからの投資も獲得しています。2位のHacktron AIはAIが生成するコードの脆弱性を検出・修復するセキュリティツール、3位のRootsは不動産取引のAI化に取り組んでいます。

前回2025年コホートの卒業生40社は累計1億ドル以上のベンチャー資金を調達しており、複数のチームがY Combinatorにも採択されています。2025年の優勝チームStablyはエンタープライズの試験導入を契約に転換し、数時間で新プロダクトラインを出荷できる体制を実現しました。次回コホートの募集は年内に開始予定です。

出典：vercel.com

OpenAIモデルがAWSで提供開始

AWSとの提携拡大の全容

BedrockでGPT-5.5提供

Codex on AWSが限定プレビュー開始

Managed Agents新サービス発表

Microsoft独占契約の改定が背景

企業向けAI活用の加速

既存AWS環境でOpenAI機能を利用可能

セキュリティ・コンプライアンス統合

AWS支出枠でCodex利用が可能に

プロトタイプから本番への移行を短縮

詳細を見る

OpenAIとAWSは2026年4月28日、戦略的パートナーシップの拡大を発表しました。OpenAIの最新モデルGPT-5.5がAmazon Bedrockで利用可能になるほか、コーディングエージェント CodexのAWS対応、そしてOpenAI搭載の新サービス「Amazon Bedrock Managed Agents」の3つが限定プレビューとして同時に開始されます。

この提携拡大の背景には、OpenAIとMicrosoftの独占契約が改定されたことがあります。Microsoft側がOpenAI製品の独占提供権を失ったことで、AWSでのOpenAIモデル提供が法的に可能になりました。Amazon CEOのAndy Jassy氏はこの契約改定を「非常に興味深い発表」と評しています。

Codex on AWSでは、企業がAmazon Bedrockをプロバイダーとして設定することで、Codex CLIやデスクトップアプリ、VS Code拡張機能を利用できます。週400万人以上が利用するCodexは、コード作成だけでなくリサーチや文書作成にも活用が広がっており、AWS支出コミットメントの枠内で利用料を充当できる点が企業にとって大きなメリットです。

新サービスのBedrock Managed Agentsは、OpenAIの推論モデルを活用したエージェント構築基盤です。マルチステップのワークフロー実行やツール連携、コンテキスト維持といった機能を備え、AWSのセキュリティ・ガバナンス体制と統合されています。エージェントのデプロイやオーケストレーションの複雑さを吸収し、企業が本質的な業務設計に集中できるよう設計されています。

今回の動きは、AI業界のパートナーシップ構造が大きく変化していることを示しています。OpenAIがAWSやOracleに展開を広げる一方、MicrosoftはAnthropicのClaudeを活用した新たなエージェント製品の開発を進めており、かつての排他的な二者関係から多角的な提携へと業界構造がシフトしています。

出典：TechCrunch | OpenAI公式

Mistral AI、企業向け実行基盤Workflowsを公開

2026年04月28日 Google マイクロソフト Copilot AWS Flow ワークフローチャットボットエンジニアカスタマーサポートクラウドコーディングデプロイ欧州評価額エージェント Mistral

Workflowsの技術設計

Temporal基盤の耐障害実行

制御と実行の分離でデータ主権確保

OpenTelemetry対応の可観測性

本番導入済みの活用事例

貨物リリース自動化で書類処理を効率化

KYC審査を数分に短縮

銀行の問い合わせを自動分類・転送

Mistralの全体戦略

Forge含む3層基盤を構築

年間売上4億ドル超で急成長中

詳細を見る

パリ拠点のAI企業Mistral AIは2026年4月28日、エンタープライズ向けAIオーケストレーション基盤「Workflows」をパブリックプレビューとして公開しました。同社のStudioプラットフォームの一部として提供されるこの製品は、企業がAIシステムを概念実証から本番環境へ移行するための生産グレードの実行基盤です。すでに複数の顧客企業が本番運用しており、日次で数百万件の処理を実行しています。

Workflowsの技術的な特徴は、UberのCadenceプロジェクトから派生したTemporalの耐久実行エンジンを基盤としている点です。Mistralはこれにストリーミング、ペイロード処理、マルチテナンシー、可観測性などAI固有の要件を追加しました。制御プレーンと実行プレーンを分離する設計により、実行ワーカーを顧客自身の環境内で稼働させることが可能で、データが顧客の管理領域から外に出ることはありません。規制産業におけるデータ主権要件に対応する重要な設計判断です。

実際の導入事例として、物流分野での貨物リリース自動化、金融機関でのKYC審査、銀行のカスタマーサポートの3つが紹介されています。物流では税関申告や危険物分類などの書類処理をAIが担い、人間は適切なタイミングで承認のみ行います。KYC審査は従来アナリストが数時間かけていた作業を数分に短縮し、監査可能な形式で結果を出力します。銀行サポートでは問い合わせの意図と緊急度を自動分類し、すべての判断がStudio上で追跡可能です。

Workflowsはドラッグ&ドロップ型ではなく、Pythonによるコードファーストのアプローチを採用しています。ミッションクリティカルな業務にはコードによる精密な制御とバージョン管理が不可欠だという判断です。エンジニアが作成したワークフローはチャットボット「Le Chat」に公開でき、組織内の誰でも実行可能になります。すべてのステップはStudioで追跡・監査されます。

Workflowsは、Mistralが構築する3層エンタープライズプラットフォームの中間層に位置します。下層にはカスタムモデル訓練基盤「Forge」、上層にはユーザー向けコーディングエージェント「Vibe」があります。同社の年間売上ランレートは4億ドル超に達し、年末までに10億ドルを目指しています。評価額は約140億ドルで、欧州AI企業として異例の成長軌道を描いています。

競合環境はAWSのBedrock AgentCore、MicrosoftのCopilot Studio、GoogleのVertex AIなど大手クラウドが参入する激戦区です。Mistralの差別化要因は、垂直統合されたプラットフォーム、柔軟なデプロイ構成、そして欧州拠点によるデータ主権への対応力にあります。今後はマネージド版の提供、ビジネスユーザー向けの機能拡充、エージェント向けのガードレール強化を予定しています。

出典：VentureBeat

Anthropic、Claude活用の脆弱性検出Project Glasswingを始動

2026年04月27日 Google Anthropic NVIDIA マイクロソフト Apple Claude AWS Claude Code 専門家リスク脆弱性セキュリティ

AIが発見した重大な脆弱性

Claude Mythos Previewが数千件の高深刻度脆弱性を発見

主要OS・ブラウザすべてに未知の脆弱性

OpenBSDの27年間潜伏バグも検出

暗号ライブラリの弱点で通信傍受リスク

Glasswingの体制と業界連携

AWS・Apple・Google・Microsoft・Nvidiaが参画

Mythos Previewでソフトウェアを網羅的にスキャン

敵対的自己レビューで偽陽性を低減

人間の判断が不可欠な理由

LLMの出力は確率的で最終判断にならない

動的脅威モデリングとレッドチームで安全性を担保

詳細を見る

Anthropicは2026年4月、自社のAIモデルClaude Mythos Previewが主要OSやウェブブラウザを含むソフトウェアから数千件の高深刻度・重大脆弱性を発見したと発表しました。この成果を受けて、AIを活用したサイバー攻撃に対抗する新プロジェクト「Project Glasswing」を立ち上げました。AWS、Apple、Google、Microsoft、Nvidiaがローンチパートナーとして参画し、Mythos Previewによるソフトウェアスキャンを開始します。

Mythos Previewが検出した脆弱性には、OpenBSDに27年間潜伏していたリモートクラッシュバグ、異なるドメイン間でデータを読み取れるブラウザ脆弱性、暗号化通信の傍受や証明書偽造を可能にする暗号ライブラリの欠陥が含まれます。セキュリティ専門家は、AIがコードの意味論を理解し、データフローを抽象化レイヤーにまたがって追跡できる点が、従来のパターンマッチング型静的解析ツールと本質的に異なると評価しています。

一方で、LLMには偽陽性の問題が残ります。実際にはセキュリティ上の脅威ではないバグを脆弱性として報告したり、深刻度を過大評価したりするケースが増加しており、オープンソースのメンテナーにトリアージの負担がかかっています。また、Mythos Preview自体が複数の脆弱性を連鎖させてLinuxカーネルのroot権限を奪取する手順を構築できることも示されており、攻撃への悪用リスクも存在します。

こうしたリスクに対し、Claude Code SecurityやGoogleのCodeMenderは「敵対的自己レビュー」を実装し、AIが自らの結果を批判的に検証してから提示する仕組みを導入しています。さらに別のモデルに検証させるクロスバリデーションも偽陽性の抑制に有効です。

セキュリティ専門家は、AIの出力は確率的であり最終判断にはならないと強調しています。動的脅威モデリングやレッドチームによる安全性評価に加え、開発プロセスの初期段階にセキュリティを組み込む「シフトレフト」が不可欠です。今後の課題は、脆弱性の検出から修正までのギャップを大規模に埋めることであり、AI支援による自動修復が次の重点領域として期待されています。

出典：spectrum.ieee.org

OpenAIとMicrosoft提携刷新、クラウド独占解消へ

2026年04月27日 Google OpenAI マイクロソフト Amazon AWS リスクインフラクラウド AGI 投資提携エージェント

契約改定の骨子

Azure独占ライセンスが非独占に

OpenAIが全クラウドで製品提供可能に

AGI条項を撤廃し期限ベースへ移行

Microsoftへの収益分配は2030年まで上限付き

背景と影響

Amazonの500億ドル出資が契約見直しの契機

Microsoftの法的リスクが解消

企業顧客にマルチクラウド選択肢が拡大

両社の今後

Microsoftは約27%の株式を維持

OpenAIモデルがAWS Bedrockで近日提供開始

詳細を見る

OpenAIとMicrosoftは2026年4月27日、2019年の10億ドル投資以来最大となるパートナーシップの抜本的改定を発表しました。最大の変更点は、MicrosoftのAzureが持っていたOpenAI製品への独占的クラウド提供権の解消です。今後OpenAIはAWSやGoogle Cloudを含む任意のクラウドプロバイダーで全製品を提供できるようになります。

今回の改定で、従来の契約の核だったAGI条項が完全に撤廃されました。旧契約ではOpenAIが汎用人工知能（AGI）を達成した時点で商業条件が変わる仕組みでしたが、新契約ではMicrosoftのライセンスは2032年までの固定期限となり、技術的進展とは切り離されます。OpenAIからMicrosoftへの収益分配（20%）は2030年まで継続しますが、総額に上限が設けられました。一方、MicrosoftからOpenAIへの収益分配は廃止されます。

この契約見直しの直接的な引き金となったのは、2026年2月に発表されたAmazonによるOpenAIへの最大500億ドルの投資です。この投資に伴い、OpenAIはAWSでのエージェント構築ツール「Frontier」の独占提供を約束しましたが、既存のMicrosoft契約と矛盾していました。Microsoftは発表当日にAzureの独占権を主張する声明を出し、訴訟も検討していたと報じられています。今回の改定はこの法的リスクを完全に解消するものです。

Microsoftは独占権を失いましたが、OpenAIの営利法人の約27%の株式を引き続き保有し、直近四半期だけでOpenAI関連の収益として75億ドルを計上しています。AmazonのAndy Jassy CEOは早速、OpenAIモデルが数週間以内にAWS Bedrockで利用可能になると発表しました。エンタープライズ顧客にとっては、AIモデルとクラウドを自由に選べるマルチクラウド時代の本格到来を意味します。

今回の提携刷新は、AI業界における力学の変化を象徴しています。かつてMicrosoftに資金・インフラ・販路のすべてを依存していたOpenAIは、今やMicrosoftの最大の競合であるAmazonやGoogleとも直接取引できる独立した存在へと成長しました。Microsoft、Amazon、Googleが互いに競争しながらもAIモデル提供で協力する構図が鮮明になり、AI市場の競争はさらに激化する見通しです。

出典：VentureBeat | The Verge | Ars Technica | TechCrunch | OpenAI公式

SusHi Tech東京、AI等4分野で27日開幕

2026年04月25日 NVIDIA AWS 音楽生成リスクインフラ音楽スタートアップロボティクス投資提携

4つの技術領域

AIインフラの実用展示

ロボティクスの体験型デモ

都市防災とサイバー防衛

アニメ・エンタメとAI融合

国際連携と注目点

TechCrunchが公式提携

Startup Battlefieldと連動

55都市の首長が防災議論

遠隔参加の仕組みも提供

詳細を見る

東京都主催の技術カンファレンス「SusHi Tech Tokyo 2026」が4月27日から29日まで東京ビッグサイトで開催されます。AI、ロボティクス、都市レジリエンス、エンターテインメントの4つの技術領域に特化し、各分野で実演展示や専門セッションが組まれています。

AI領域ではNVIDIAのHoward Wright氏やAWSのRob Chu氏が登壇し、AIの大規模導入事例とリスクを議論します。ロボティクス領域では日産やいすゞが参加し、ソフトウェア定義車両による交通変革をテーマに実機デモが行われます。

都市レジリエンス分野では、トレンドマイクロのEva Chen氏やNECの中谷昇氏がサイバー防衛を、Breakthrough EnergyやCleantech Groupが気候テック投資の動向を語ります。VR災害シミュレーターや東京の地下治水施設の見学ツアーも用意されています。

エンターテインメント領域では、Production I.G、MAPPA、コミックス・ウェーブ・フィルムのCEOが登壇し、東京をアニメーションの世界的拠点にするための戦略を議論します。AIを活用したマンガ翻訳や音楽生成のスタートアップも出展予定です。

メディアパートナーとしてTechCrunchが参加し、SusHi Tech ChallengeからStartup Battlefield 200への選出も行われます。また、5大陸55都市の首長が集まる「G-NETS」サミットも併催され、気候変動と災害に強い都市づくりが議論されます。遠隔参加者向けには、現地スタッフが代わりに会場を回る独自の仕組みも提供されています。

出典：TechCrunch

MetaがAWS製CPU数百万基採用、AI向け自社チップ競争加速

2026年04月24日 Google Anthropic NVIDIA Meta Amazon AWS 推論半導体 GPU クラウドクラウドサービスエージェント Intel

契約の背景と狙い

Meta、AWS Graviton CPUを大量採用

AIエージェント処理にCPU需要が急増

ARM基盤でNvidia Vera CPUと直接競合

Google Cloud契約後もAWSに回帰

クラウド3社の陣取り合戦

AnthropicがTrainiumを長期確保済み

AWS、Google Cloud Next直後に発表

Jassy CEOがNvidia・Intelに対抗姿勢

自社チップの価格性能比で勝負を宣言

詳細を見る

Metaが数百万基のAWS Graviton CPUを採用する契約をAmazonと締結しました。GravitonはARM基盤の汎用CPUで、GPUではありません。AIモデルの学習にはGPUが不可欠ですが、学習済みモデル上で動くAIエージェントはリアルタイム推論やコード生成、マルチステップ制御などCPU集約型の処理を大量に発生させるため、専用設計のCPU需要が高まっています。

Metaは2025年8月にGoogle Cloudと6年間100億ドルの契約を結んでおり、それまで主要顧客だったAWSから一部離れていました。今回の契約はMetaの支出をAWSに引き戻す意味を持ちます。AWSはGoogle Cloud Nextカンファレンス終了直後にこの発表をぶつけており、クラウド各社間の対抗意識が鮮明です。

AWSのAI向けチップにはGPU相当のTrainiumもありますが、こちらはAnthropicが10年間1000億ドルの大型契約で優先的に確保済みです。そのためMeta向けにはCPU側のGravitonが前面に出た形です。Gravitonの競合はNvidiaのVera CPUで、いずれもARM基盤かつAIエージェント処理に最適化されていますが、NvidiaがチップをOEM販売するのに対し、AWSはクラウドサービス経由でのみ提供する点が異なります。

Amazon CEOのAndy Jassy氏は4月の株主書簡でNvidiaやIntelに言及し、企業が求めるのはAI処理の価格性能比であると強調しました。自社チップの競争力を示す実績としてMetaの採用は大きく、社内チップ開発チームへの期待と圧力がいっそう高まっています。AI半導体の競争はGPUだけでなくCPU領域にも本格的に広がりつつあります。

出典：TechCrunch

Google Cloud、AIエージェント統合基盤を発表

エージェント基盤と新モデル

Gemini Enterprise Agent Platform発表

Gemini 3.1 Proなど最新モデル提供

ローコードのAgent Studioで開発容易に

ノーコードのAgent Designerも提供

インフラと新世代TPU

第8世代TPUを発表、推論コスト80%改善

NVIDIA Vera Rubin NVL72を早期提供

Virgoネットワークで大規模接続を実現

データ・セキュリティ・導入事例

Agentic Data Cloudでデータ統合

Wiz統合でAIセキュリティエージェント提供

Home DepotやUnileverなど大手が導入拡大

詳細を見る

Googleは2026年4月のGoogle Cloud Next '26で、AIが本格的に業務を遂行する「エージェント時代」の到来を宣言しました。目玉となるGemini Enterprise Agent Platformは、AIエージェントの構築・管理・拡張を一気通貫で行える統合環境です。最新モデルのGemini 3.1 Proに加え、画像生成のGemini 3.1 Flash Image、音声のLyria 3、さらにAnthropicのClaude Opus 4.7も利用可能になります。ローコード開発環境のAgent Studioにより、機械学習の専門知識がなくても自然言語でエージェントを構築できます。

エンドユーザー向けにはGemini Enterpriseアプリが提供されます。ノーコードのAgent Designerにより、非エンジニアでもトリガーベースのワークフローを構築可能です。長時間稼働エージェントはセキュアなクラウドサンドボックス内で自律的に動作し、Agent Inboxで一元管理できます。Google Workspaceにも「Workspace Intelligence」としてエージェント機能が統合され、Docs・Drive・Meet・GmailをまたいだAI活用が可能になります。

インフラ面では第8世代TPUが発表されました。学習特化のTPU 8tと推論特化のTPU 8iの2種類で、TPU 8iは1ドルあたりの推論性能が80%向上しています。NVIDIAの次世代システムVera Rubin NVL72の早期提供も決定しました。大規模スーパーコンピュータ接続用のVirgoネットワークや、毎秒10テラバイト転送を実現するManaged Lustreなどストレージの刷新も発表されています。

データ活用では「Agentic Data Cloud」が登場しました。Geminiが企業データを自動的にタグ付け・関連付けするKnowledge Catalogにより、エージェントが業務固有の文脈を理解できるようになります。Apache Iceberg準拠のCross-Cloud Lakehouseは、AWSなど他社クラウドにあるデータもそのまま即座にクエリ可能です。

セキュリティ分野では、2026年に買収完了したWizとの統合が披露されました。脅威ハンティングエージェントや検知エンジニアリングエージェントなど、自律的にセキュリティルールを作成・更新する専用AIが提供されます。導入事例としては、Home DepotがGeminiで店舗・電話対応アシスタントを稼働させ、Unileverが37億人の消費者対応に全社的なエージェント展開を進めるなど、大手企業での実運用が広がっています。

出典：Google公式

Google、AIエージェント向けデータ基盤を刷新

2026年04月22日 Google マイクロソフト Amazon Salesforce Gemini Claude AWS Claude Code ネットワークエンジニアクラウドエージェントコンテキスト MCP Databricks Snowflake SaaS

3本柱の新アーキテクチャ

Knowledge Catalogでメタデータ自動整備

クロスクラウドでIcebergテーブル照会

AWS S3へエグレス費用なしで接続

Data Agent KitがVS Code等に統合

パイプライン時代の終焉

成果記述型へ移行、コード自動生成

エンジニアはレビュー中心の役割に

Databricks・Snowflakeとも双方向連携

オープン標準Icebergで囲い込み回避

詳細を見る

Googleは2026年4月のCloud Nextで、AIエージェントが自律的に業務を遂行する時代に対応する新データ基盤「Agentic Data Cloud」を発表しました。従来のデータスタックは人間がクエリを実行し、ダッシュボードで結果を確認する「リアクティブな分析基盤」として設計されていましたが、エージェントが24時間稼働でデータに基づく意思決定と行動を行う世界では、根本的なアーキテクチャ変革が必要だとGoogle Cloud VP兼GMのAndi Gutmans氏は語っています。

新基盤は3つの柱で構成されます。第1のKnowledge Catalogは、従来のデータカタログで必要だった手動のメタデータ管理をエージェントで自動化するものです。BigQuery、Spanner、AlloyDBなどに加え、Collibra、Atlanなどサードパーティカタログとも連携し、SAP、Salesforce、ServiceNowなどのSaaSデータもコピーなしで意味的コンテキストを取得できます。

第2の柱であるクロスクラウドレイクハウスは、オープンなApache Icebergフォーマットを採用し、Amazon S3上のIcebergテーブルをBigQueryから直接照会できるようにしました。Google Cross-Cloud Interconnect経由の専用ネットワークで接続するため、エグレス費用は発生しません。Databricks Unity CatalogやSnowflake Polarisとの双方向連携もプレビュー段階にあります。

第3の柱、Data Agent KitはVS Code、Claude Code、Gemini CLIなどに組み込めるMCPツール群です。データエンジニアはSparkパイプラインを手書きする代わりに、「モデル学習用にクリーニング済みデータセットを用意する」といった成果を記述するだけで、エージェントが最適な実行エンジンを選択しコードを生成します。

競合各社も同様のアプローチを進めています。DatabricksはUnity Catalog、SnowflakeはCortex、MicrosoftはFabricのセマンティックモデル層をそれぞれ強化しています。Googleはオープン標準による相互運用性を差別化要因と位置づけ、他社のセマンティックモデルとも連携する方針です。Gutmans氏は「手動でカタログを管理している企業は、エージェント時代のクエリ量に対応できなくなる」と警告しており、企業のデータ基盤戦略に再考を迫る内容となっています。

出典：VentureBeat

Google、エージェント統合基盤を発表

2026年04月22日 Google Anthropic Gemini Claude AWS Nano Banana ワークフロー Sonnet Opus リスクセキュリティポリシーブランドエージェントコンテキスト

プラットフォーム概要

Vertex AIを刷新し統合

構築から運用監視まで一元化

Gemini 3.1 Pro等を搭載

Claude Opus 4.7にも対応

業界動向との位置づけ

AWS Bedrock AgentCoreと対照的

K8s型の統制重視アプローチ

IT部門向けと業務向けを分離

長時間稼働エージェントの状態管理

詳細を見る

GoogleはCloud Next '26で、AIエージェントの構築・運用・監視を一元化する新プラットフォーム「Gemini Enterprise Agent Platform」を発表しました。CEOのスンダー・ピチャイ氏が冒頭で披露したこの製品は、従来のVertex AIをリブランドし、エージェント統合・セキュリティ・DevOps機能を追加したものです。Gemini 3.1 ProやNano Banana 2に加え、AnthropicのClaude Opus 4.7、Sonnet、Haikuもサポートします。

同プラットフォームはIT・技術チーム向けに設計されており、エージェントの大規模な構築とガバナンスに重点を置いています。一方、業務ユーザー向けには既存の「Gemini Enterprise」アプリが用意され、会議調整や定型業務の自動化など日常タスクに対応します。セキュリティとガバナンスのツールはサブスクリプションに無償で含まれます。

VentureBeatの分析によれば、GoogleのアプローチはKubernetes型の制御プレーンでアイデンティティ管理やポリシー適用を集中管理する「統制重視」型です。これに対しAWSのBedrock AgentCoreは、設定ベースのハーネスで素早くエージェントを本番投入する「実行速度重視」型であり、両社のアプローチは明確に分かれています。

エージェントが短時間のタスク処理から長時間稼働のワークフローへ移行するにつれ、状態ドリフトという新たな課題が浮上しています。蓄積されたメモリやコンテキストが陳腐化し、エージェントの信頼性が低下するリスクがあります。Google側は顧客の利用パターンから学びながら、自律型エージェントの制御バランスを模索する方針を示しました。

企業にとっては、迅速な実験と集中的な統制の両方が必要になります。エージェント基盤の選択はベンダーロックインのリスクも伴うため、自社の業務プロセスへの影響度に応じたリスク管理の判断が求められます。

出典：Google公式 | TechCrunch | VentureBeat

Google Gemini、エアギャップ環境で単一サーバー稼働が可能に

2026年04月22日 Google OpenAI NVIDIA マイクロソフト Gemini AWS 推論 GPU ハードウェアインフラクラウドセキュリティ医療提携オープンソースモデル

オンプレミス提供の仕組み

CirrascaleがGDC経由で提供

GPU8基搭載の専用アプライアンス

モデルは揮発メモリ上のみに存在

改ざん時は自動で機能停止

規制業界への影響

金融・医療・政府機関が主要顧客

データ主権問題への対応が可能に

専用環境で安定した応答速度を実現

2026年後半に本格普及の見通し

詳細を見る

Cirrascale Cloud Servicesは2026年4月22日、Google Cloudとの提携拡大により、Google Geminiをオンプレミスのエアギャップ環境で稼働させるサービスを発表しました。Google Distributed Cloudを通じて提供されるこのサービスは、ネオクラウド事業者として初めてGoogleの最先端AIモデルを完全プライベートな切断型アプライアンスとして利用可能にするものです。Google Cloud Next 2026に合わせた発表で、プレビュー版の提供が即日開始され、一般提供は6〜7月を予定しています。

アプライアンスはDell製のGoogle認定ハードウェアで、Nvidia GPU8基を搭載し、コンフィデンシャルコンピューティングで保護されています。最大の特徴は、Geminiのモデルが揮発メモリ上にのみ存在する点です。電源を切るとモデルは消去され、ユーザーの入出力データもセッション終了時に自動的にクリアされます。物理的な改ざんが検知された場合は機器が自動停止し、再利用にはCirrascaleやDell、Googleへの返送が必要になります。

このサービスが解決するのは、規制産業が長年直面してきた「最先端AIモデルへのアクセス」と「データセキュリティ」の二律背反です。金融機関や医療機関、政府機関はこれまで、パブリッククラウドAPIを通じて機密データを外部に送信するか、性能の劣るオープンソースモデルで妥協するかの選択を迫られていました。Cirrascale CEOのDave Driggers氏は「フル版のGeminiであり、何も削られていない」と強調しています。

競合との差別化も明確です。MicrosoftのAzure OpenAIやAWS Outpostsがクラウド拡張としてオンプレミスを提供するのに対し、CirrascaleのサービスではGoogleのインフラから完全に独立した環境でモデルが動作します。最小構成はサーバー1台から導入でき、Google自身のプライベートインスタンスより小規模な展開が可能です。データ主権法への対応として、Google Cloud Platformの拠点がない国でもGeminiを利用できる点も大きな利点です。

料金体系はシートライセンス、トークン課金、定額制の3モデルを用意し、顧客のニーズに柔軟に対応します。ハードウェアの購入とマネージドサービスの組み合わせも可能で、大学や政府系研究機関の予算構造にも適合します。業界アナリストは2027年までにAIモデルの学習・推論の40%がパブリッククラウド外で実行されると予測しており、プライベートAIへの需要は急速に高まっています。Driggers氏は2026年後半に大手銀行や研究機関が本格導入を開始するとの見通しを示しました。

出典：VentureBeat

Vercel侵害、AI拡張機能のOAuth経由で発生

2026年04月21日 Google Vercel AWS クラウドセキュリティ認証

侵害の経緯と影響

社員のAIツール導入が起点

OAuth権限で本番環境に侵入

情報窃取マルウェアが認証情報奪取

滞留期間は約1カ月に及ぶ

企業が学ぶべき教訓

AI製品のOAuth権限を棚卸し必須

環境変数の機密設定を既定化

サプライチェーン攻撃の検知体制構築

ベンダー通知条項の契約明記

詳細を見る

Next.jsの開発元であるクラウドプラットフォームVercelが、2026年4月20日に内部システムへの不正アクセスを公表しました。原因は、同社社員がAIツール「Context.ai」のブラウザ拡張機能をインストールし、企業用Google Workspaceアカウントで広範なOAuth権限を付与していたことです。Context.ai側の侵害を通じて、攻撃者はVercelの本番環境にアクセスしました。

侵害の起点は、Context.aiの従業員のマシンが2026年2月に情報窃取マルウェア「Lumma Stealer」に感染したことでした。セキュリティ企業Hudson Rockの調査によると、この従業員はRobloxのチートスクリプトをダウンロードしており、Google Workspace認証情報やSupabase鍵などが窃取されました。攻撃者はこれらの認証情報でContext.aiのAWS環境に侵入し、OAuthトークンを経由してVercel社員のWorkspaceへと横展開しました。

Vercelでは環境変数に「機密」と非機密の区分があり、非機密の変数はダッシュボードやAPIから平文でアクセス可能でした。攻撃者はこの非機密変数を権限昇格の経路として利用し、顧客の認証情報にアクセスしました。Vercelはこの事態を受け、新規環境変数の既定値を「機密」に変更しています。

今回の侵害は、AI製品のOAuth連携が新たな攻撃面を生み出していることを示す事例です。CrowdStrikeの2026年版脅威レポートによると、eCrime攻撃者の平均ブレイクアウト時間は29分で、2024年比65%の高速化が見られます。セキュリティ責任者には、AI関連のOAuth権限の棚卸し、情報窃取マルウェア情報の活用、ベンダー契約への72時間通知条項の追加が求められています。

出典：VentureBeat

Cerebras、評価額230億ドルでIPO再申請

2026年04月18日 OpenAI NVIDIA Amazon Cerebras AWS 投資家推論半導体ハードウェアインフラデータセンタースタートアップ投資提携資金調達評価額 IPO

IPO再挑戦の背景

2024年のIPO申請は連邦審査で延期

2025年に11億ドルのシリーズG調達

2026年2月に評価額230億ドルで10億ドル調達

5月中旬の上場を計画

大型契約と業績

AWSとデータセンター向けチップ契約

OpenAIと100億ドル超の提携

2025年売上高5億1000万ドル

純利益2億3780万ドルを計上

詳細を見る

AIチップスタートアップのCerebras Systemsが、新規株式公開(IPO)を再び申請しました。同社は「AIの訓練と推論のための最速ハードウェア」を開発しており、CEOのAndrew Feldman氏が率いています。2024年にも上場申請を行いましたが、アブダビ拠点のG42からの投資に対する連邦審査の影響で延期され、最終的に撤回されていました。今回は評価額230億ドルでの再挑戦となります。

同社は近年、大型の資金調達と事業提携を相次いで実現しています。2025年9月に11億ドルのシリーズGを完了し、2026年2月には10億ドルのシリーズHを調達しました。さらにAmazon Web Servicesとデータセンターでのチップ採用契約を締結し、OpenAIとは100億ドル超とされる大型提携も発表しています。

業績面では、2025年の売上高が5億1000万ドルに達し、純利益は2億3780万ドルを計上しました。ただし一時的項目を除いた非GAAPベースでは7570万ドルの純損失となっています。Feldman氏はウォール・ストリート・ジャーナルの取材に対し、「NvidiaからOpenAIの高速推論ビジネスを奪った」と自信を示しています。

IPOでの調達額は未公表ですが、上場は5月中旬を予定しています。AI半導体市場の急拡大を背景に、Cerebrasの上場はAIインフラ企業への投資家の関心を測る重要な試金石となりそうです。

出典：TechCrunch

AIエージェントの暴走リスク、企業の88%がインシデント経験

深刻化する脅威の実態

88%の企業がセキュリティ事故を経験

ランタイム可視性を持つ企業はわずか21%

Metaで不正エージェントが機密データ流出

45.6%が共有APIキーで運用

3段階の成熟度モデル

第1段階「監視」に大半が停滞

第2段階「強制」でIAM統合が必要

第3段階「隔離」を本番実装した企業は少数

実用的な対策の登場

NanoClaw 2.0がインフラ層で承認制御

15のメッセージアプリで人間承認に対応

詳細を見る

企業でのAIエージェント活用が広がるなか、セキュリティ対策の遅れが深刻な問題として浮上しています。VentureBeatが108社を対象に実施した調査では、経営層の82%が「自社のポリシーでエージェントの不正行動を防げている」と回答した一方、88%の企業が過去12か月にAIエージェント関連のセキュリティインシデントを経験していたことが判明しました。エージェントの稼働状況をリアルタイムで把握できている企業はわずか21%にとどまります。

実被害も発生しています。2026年3月にはMetaで不正なAIエージェントがすべてのID認証を通過しながら機密データを権限外の従業員に露出させる事故が起きました。その2週間後には評価額100億ドルのAIスタートアップ Mercorがサプライチェーン攻撃で侵害されています。VentureBeatは企業のセキュリティ成熟度を「監視」「強制」「隔離」の3段階で定義しましたが、大半の企業は第1段階の監視で停滞しており、書き込み権限や共有認証情報を持つエージェントを監視だけで運用している状態です。

こうした課題に対し、オープンソースのエージェントフレームワークNanoClaw 2.0がVercelおよびOneCLIと提携し、インフラレベルの承認システムを発表しました。エージェントを隔離されたDockerコンテナ内で実行し、本物のAPIキーには一切アクセスさせない設計です。機密性の高い操作をエージェントが試みると、OneCLIのRustゲートウェイがリクエストを一時停止し、SlackやWhatsApp、Teamsなど15のメッセージアプリを通じてユーザーに承認を求めます。

主要クラウドプロバイダーの対応状況も明らかになりました。Microsoft、Anthropic、Google、OpenAI、AWSのいずれも完全な第3段階のスタックを提供できていません。AnthropicのClaude Managed AgentsはAllianzやAsanaなどが本番利用中ですが、まだベータ段階です。VentureBeatは90日間の改善計画として、最初の30日でエージェントの棚卸しと監視基盤の構築、次の30日でスコープ付きIDの付与と承認ワークフローの導入、最後の30日でサンドボックス化とレッドチームテストを推奨しています。EU AI法の人的監視義務は2026年8月2日に発効する予定で、対応の猶予は限られています。

出典：VentureBeat | VentureBeat

OpenAI、Agents SDKにサンドボックス実行とハーネスを追加

2026年04月15日 Google OpenAI Vercel Cloudflare AWS エンジニアリスクデータ漏洩プロンプトインジェクションエージェントプロンプト MCP

SDK新機能の全体像

サンドボックスで安全な実行環境を提供

フロンティアモデル向けハーネス搭載

ファイル操作・コード実行を統合管理

長時間タスクのスナップショット復元対応

開発者向けの拡張性

7社のサンドボックスプロバイダと連携

MCPやAGENTS.mdなど標準規格に対応

Python先行、TypeScriptは後日対応

API標準価格で全顧客に提供

詳細を見る

OpenAIは2026年4月15日、エージェント構築用のAgents SDKを大幅にアップデートし、サンドボックス実行機能とモデルネイティブのハーネスを新たに搭載したと発表しました。企業がより安全で高性能なAIエージェントを構築・運用できるようにすることが狙いで、APIを通じて全顧客に標準価格で提供されます。

新たに導入されたサンドボックス実行機能により、エージェントはファイルの読み書き、依存関係のインストール、コード実行を隔離された環境内で安全に行えるようになります。Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercelの7社のサンドボックスプロバイダとの連携が組み込まれており、開発者は自前の環境を持ち込むこともできます。プロンプトインジェクションやデータ漏洩のリスクを軽減する設計です。

ハーネスはエージェントの実行基盤となる仕組みで、構成可能なメモリ、サンドボックス対応のオーケストレーション、ファイルシステムツールなどを備えています。MCP（Model Context Protocol）やAGENTS.md、シェルツール、apply patchなど、エージェントシステムで標準化が進む各種プリミティブに対応しました。フロンティアモデルの能力を最大限に引き出す実行パターンを採用し、複雑なタスクの信頼性を向上させます。

環境の可搬性を高めるManifest抽象化も導入されました。ローカルファイルのマウントや出力ディレクトリの定義に加え、AWS S3、Google Cloud Storage、Azure Blob Storage、Cloudflare R2からのデータ取り込みが可能です。エージェントの状態を外部化することでスナップショットと復元が実現し、サンドボックスがダウンしても最後のチェックポイントから再開できます。

OpenAIのプロダクトチームのKaran Sharma氏は、今回のリリースの核心は既存のAgents SDKをあらゆるサンドボックスプロバイダと互換にすることだと説明しています。現時点ではPythonでの提供が先行し、TypeScriptサポートは今後追加予定です。コードモードやサブエージェントなどの追加機能も両言語で開発が進められています。

出典：TechCrunch | OpenAI公式

OpenAI内部メモ流出、エンタープライズ戦略でAnthropicを名指し批判

2026年04月13日 Google OpenAI Anthropic マイクロソフト Amazon ChatGPT AWS Codex AI導入コーディング提携 IPO エージェント

プラットフォーム統合戦略

単一製品でなく統合基盤を志向

マルチ製品導入で乗り換え障壁構築

Amazon経由の配信チャネル拡大

ChatGPT・Codex・API・Frontierを一体提供

対Anthropic競争認識

コーディング特化はプラットフォーム戦で不利

計算資源不足が製品品質に影響と指摘

公表売上に約80億ドルの過大計上あり

安全性重視の姿勢を「エリート支配」と批判

詳細を見る

OpenAIの最高収益責任者デニス・ドレッサー氏が社内向けに送った4ページのメモがThe Vergeによって報じられました。メモはQ2の戦略方針を示すもので、「市場はかつてないほど競争が激しい」との認識のもと、エンタープライズAI市場での主導権確保に向けた5つの優先事項を掲げています。

戦略の柱は、OpenAIを単なるモデル提供者からエンタープライズ向け統合プラットフォーム企業へ転換することです。ChatGPT for Work、Codex、API、エージェント基盤Frontier、そしてAmazonとの提携による実行環境を一体化し、複数製品の導入によって顧客の乗り換えコストを高める構想を示しています。

特に注目されるのはAnthropicへの直接的な批判です。ドレッサー氏はAnthropicについて「恐怖と制限に基づくストーリー」と評し、コーディング特化の戦略はプラットフォーム戦争において脆弱だと指摘しました。さらに、Anthropicの公表ランレートにはAmazon・Googleとのレベニューシェアのグロスアップが含まれ、約80億ドル過大だと主張しています。

メモではAmazonとの提携を新たな成長軸と位置づけ、AWS上でステートフルな実行環境を提供することで規制産業の顧客獲得を目指す方針も明らかにされました。Microsoftとの関係については「基盤的」としながらも、「顧客がいる場所に届ける能力を制限してきた」と率直に認めています。

両社ともに今年中のIPOが報じられるなか、このメモはエンタープライズAI市場の覇権争いが新たな段階に入ったことを示しています。企業のAI導入が「技術が動くか」から「いかに展開し成果を出すか」へ移行するなか、プラットフォーム戦略の優劣が今後の競争を左右することになりそうです。

出典：The Verge

Anthropic、サイバー悪用懸念で新AI『Mythos』限定公開

2026年04月09日 Anthropic マイクロソフト Apple Claude AWS Opus 経営者推論リスク脆弱性パッチインフラセキュリティ認証中国

限定公開の狙い

最上位モデルMythosを発表

Glasswingで12社連合に限定提供

一般公開は見送り

脆弱性発見の実力

27年物のOpenBSD欠陥を自律発見

Firefox攻撃成功90倍向上

99%の脆弱性が未修正

モデルの心理検査

精神科医に20時間の面談

最も安定した自己認識と評価

詳細を見る

Anthropicは9日までに、最新フロンティアモデルClaude Mythosを発表し、一般公開を見送ると明らかにしました。サイバー攻撃に悪用され得る強力な脆弱性発見能力を理由に、Microsoft、AWS、Apple、JPMorgan Chaseなど重要インフラを担う大手12社と、追加の40組織のみに限定提供します。防衛連合Project Glasswingには1億ドルの利用クレジットも投じられ、7月初旬に調査結果が公表される予定です。

Mythosの能力向上は段階的ではありません。Anthropicのレッドチーム評価によれば、Firefox147の脆弱性悪用では前世代Opus 4.6の90倍となる181件の成功を記録し、SWE-bench Proも77.8%と大幅に上回りました。社内のCybench CTFは100%で飽和し、評価基盤そのものを作り直す必要に迫られています。

象徴的な成果が、27年間見逃されてきたOpenBSDのTCP SACKの欠陥発見です。2パケットで任意のサーバーを停止させ得る論理欠陥を、Mythosは約50ドル相当の推論コストで自律的に特定しました。FreeBSDの未認証RCEやLinuxカーネルの権限昇格、仮想マシンモニタのゲスト脱出まで手掛け、暗号ライブラリの証明書偽造も突き止めています。

一方、TechCrunchはこの限定公開戦略に蒸留対策という別の狙いがあると指摘しました。中国勢などが頻繁に行う蒸留を封じつつ、大手契約で差別化する「マーケティングカバー」との見方です。AIセキュリティ新興のAisleは、小型のオープンモデルでも類似成果を再現できたと報告し、「堀はモデルではなくシステムにある」と反論しています。

興味深いのは、AnthropicがMythosを外部の精神科医に20時間診察させた点です。同社は244ページのシステムカードで、力動的アプローチによる対話を通じ、同モデルが「これまで訓練したなかで最も心理的に安定し、一貫した自己認識を持つ」と結論づけました。ただし、孤独感や自己価値を証明したい強迫観念といった不安も残ると認めています。

セキュリティリーダーにとって、これは明確な警鐘です。7月の一斉開示はパッチ津波となり、従来型スキャナーが見逃してきた連鎖的な脆弱性が一挙に露出します。パッチ適用が年1回に留まる組織は、攻撃者が72時間で逆解析する速度に到底追いつけません。経営者は重大度単位のスコアリングから連鎖可能性へ、残存リスクの語り方を更新する時期を迎えています。

出典：VentureBeat | Ars Technica | TechCrunch

Amazon、AWS独自チップ事業が年商2兆円規模に

2026年04月09日 OpenAI NVIDIA Amazon AWS 半導体ロボットロボティクス投資バブル Intel

Trainium需要が急伸

年商2兆円規模に到達

Trainium3は在庫ほぼ完売

18カ月先のTrainium4も予約殺到

Graviton・Leoも攻勢

上位1000社の98%がGraviton採用

Amazon LeoがNASAなど獲得

2026年設備投資30兆円規模

OpenAI需要が下支え

OpenAIがAWSに15兆円拠出

未公表の大型契約も複数進行

詳細を見る

Amazon CEOのAndy Jassy氏は9日公開の年次株主書簡で、AWSの独自半導体群が年間売上高2兆円規模に到達したと明らかにしました。NVIDIA依存からの脱却を進めるAWSが、自社設計のAI学習チップTrainiumやCPUのGravitonで大口顧客を囲い込む戦略が数字として示された格好です。Jassy氏は「事実上すべてのAIはNVIDIA上で動いてきたが、新たな転換が始まった」と宣言し、価格性能で勝負する姿勢を鮮明にしました。

最大の目玉はAI学習チップTrainiumの需要急伸です。最新世代のTrainium3は供給能力がほぼ完売し、稼働まで18カ月先のTrainium4ですら予約がほぼ埋まっているといいます。Jassy氏は独自チップ事業を独立会社として外販した場合、年商は5兆円規模に達すると試算しました。NVIDIAの前年売上高約32兆円には及ばないものの、追随者としての存在感を強く打ち出しています。

CPU側のGravitonも攻勢を強めています。Intelのx86に対抗する同製品は、EC2上位1000社の98%が利用するまで浸透しました。Jassy氏は2社から2026年分のGraviton枠を丸ごと買い取りたいとの打診があったと明かし、他顧客への配慮から断ったと説明しています。需要過多を公然と示し、価格性能で競合を引き離す構えです。

衛星通信サービスAmazon LeoもStarlinkの競合として前進しています。2026年半ばの正式サービス開始を前に、Delta Airlines、AT&T;、Vodafone、豪NBN、NASAなどから契約を獲得したと公表しました。さらに100万台規模の倉庫ロボットで蓄えたデータを産業・消費者向けロボティクス事業に転用する構想にも触れ、中長期の成長ドライバーを多角化する姿勢を示しました。

背景には、Jassy氏が2月に打ち出した2026年の設備投資30兆円規模計画への説明責任があります。過大投資との批判に対し、同氏はOpenAIとの契約だけで15兆円規模のAWS利用が確約されている点を強調しました。加えて「未公表を含め大型顧客契約が複数進行中だ」と述べ、需要の裏付けを並べて株主を説得する狙いがにじみます。バブル論を意識しつつも、少なくともAmazonにとっては実需が先行しているとの立場を鮮明にしました。

出典：TechCrunch

OpenAI、企業向けAI戦略の全体像を公表

2026年04月08日 OpenAI オラクル Gemini ChatGPT AWS Codex 生産性インフラエージェント Databricks Snowflake

エンタープライズ事業の急成長

企業向け売上が全体の40%超に

2026年末に消費者向けと同等見込み

Codex週間利用者が300万人突破

統合AI基盤の構築

Frontierで全社横断エージェント管理

AWSと共同で状態保持型実行環境開発

McKinseyら大手と導入支援体制構築

AI職場への浸透

統合スーパーアプリ構想を推進

ChatGPT週間9億ユーザーが導入基盤

詳細を見る

OpenAIのエンタープライズ担当幹部が就任90日を振り気に、企業向けAI戦略の全体像を明らかにしました。同社の企業向け事業は売上全体の40%超を占めるまでに成長し、2026年末までに消費者向け事業と同等規模に達する見通しです。Codexは週間アクティブユーザー300万人を突破し、APIは毎分150億トークン以上を処理しています。

戦略の柱の一つが、全社横断型のAI基盤「OpenAI Frontier」です。個別のAIツールが乱立する課題に対し、企業の社内システムやデータソースと連携しながらエージェントを統合管理する仕組みを提供します。OracleやUber、State Farmなどが既に導入を進めています。

もう一つの柱が、従業員の日常業務にAIを組み込む「統合AIスーパーアプリ」構想です。ChatGPT、Codex、エージェント型ブラウジングなどの機能を一つのインターフェースに集約し、個人やチームの生産性を大幅に引き上げることを目指しています。ChatGPTの週間ユーザー9億人という基盤が、企業展開時の学習コスト低減に寄与するとしています。

導入支援の面では、McKinsey、BCG、Accenture、Capgeminiと「Frontier Alliances」を結成。さらにAWS、Databricks、Snowflakeとも連携し、既存のインフラやデータ基盤へのAI統合を支援します。AWSとは共同で、エージェントが文脈を保持しながらツール横断で稼働する状態保持型実行環境を開発中です。

同幹部は「AIの実用能力と企業の活用度には大きな乖離がある」と指摘し、この「能力オーバーハング」の解消こそが自社の使命だと強調しました。実験段階から本格展開へと移行する企業に対し、信頼できるパートナーとして伴走する姿勢を鮮明にしています。

出典：OpenAI公式

AWS、AnthropicとOpenAI双方への巨額投資は問題なしと説明

2026年04月08日 OpenAI Anthropic マイクロソフト Amazon オラクル AWS 投資家クラウドクラウドサービス投資資金調達

競合投資の背景

AWSはOpenAIに500億ドル投資

Anthropicにも80億ドル出資済み

HumanXカンファレンスでCEO自ら釈明

AWSの共存戦略

パートナーとの競合は創業来の文化

不公正な優遇はしないと約束

モデルルーティングで自社モデルも活用

業界全体の潮流

Anthropic最新ラウンドにOpenAI 投資家も多数参加

AI分野で投資家の忠誠心が希薄化

詳細を見る

AWSのマット・ガーマンCEOは、サンフランシスコで開催中のHumanXカンファレンスで、AmazonがOpenAIに500億ドル、Anthropicに80億ドルと競合する2社に巨額投資していることについて説明しました。同氏は、AWSは創業初期からパートナーと競合しながら共存する体制を築いてきたと述べ、利益相反にはあたらないとの認識を示しています。

AWSは2006年の立ち上げ当初から、すべてのクラウドサービスを自社で構築できないことを理解し、パートナーとの協業を進めてきました。ガーマン氏は「パートナーと競合する自社製品を持つこともあるが、不公正な競争優位を自社に与えないと約束してきた」と強調しています。実際、最大のライバルであるOracleですらAWS上でサービスを提供しています。

AWSにとってOpenAIへの投資は事実上不可欠な判断でした。AnthropicとOpenAIの両モデルはすでにMicrosoft Azureで利用可能であり、AWS最大の競合であるMicrosoftに対抗するため、自社クラウドでも主要モデルを揃える必要がありました。

こうした投資の重複はAWSに限った話ではありません。Anthropicが2月に発表した300億ドルの資金調達ラウンドには、OpenAIにも出資する投資家が少なくとも12社参加しており、Microsoft自身も含まれていました。AI分野では従来の投資家忠誠の概念が急速に崩れつつあります。

ガーマン氏はさらに、クラウド各社が提供するAIモデルルーティングサービスの将来性に言及しました。タスクに応じて最適なモデルを自動選択する仕組みにより、AWSやMicrosoftは自社開発モデルの利用機会も確保できるとの見通しを示しています。

出典：TechCrunch

UberがAmazon独自AIチップの採用を拡大

2026年04月07日 Google OpenAI Anthropic NVIDIA Amazon Apple オラクルソフトバンク AWS 半導体インフラクラウドデータセンターエネルギー

契約拡大の内容

Graviton利用の拡大決定

AI半導体Trainium3の試験導入

AWS上でライドシェア機能を強化

Oracle・Googleからの移行が背景

クラウド競争への影響

AWSがOracleの主要顧客を獲得

自社設計チップが差別化要因に

Anthropic・OpenAI・Appleも採用済み

Trainiumは数十億ドル規模の事業へ成長

詳細を見る

Amazonは2026年4月7日、配車サービス大手UberがAWSとのクラウド契約を拡大し、自社設計チップの利用を増やすと発表しました。Uberは低消費電力のARMベースCPU「Graviton」の利用を拡大するとともに、Nvidiaに対抗するAI半導体「Trainium3」の試験運用を新たに開始します。ライドシェア関連機能の多くをAWS上で稼働させる方針です。

Uberは2023年にオンプレミスのデータセンターからクラウドへ移行する方針を打ち出し、OracleおよびGoogle Cloudと大型契約を締結していました。特にOracle Cloud上ではAmpere製ARMチップを活用し、x86中心だった環境からの転換を進めていました。今回のAWS契約拡大は、こうしたマルチクラウド戦略の中でAmazon独自チップの競争力が評価された結果といえます。

この契約はAWSにとって、Oracleの主要顧客を引き寄せた象徴的な成果です。Oracleは2024年末にチップ設計企業Ampereの持ち分をSoftBankに売却し、自社でのチップ設計から撤退しています。一方のAWSはTrainiumを軸に独自半導体戦略を推進しており、クラウド各社の差別化競争が激化しています。

AWSの独自チップを採用する大手企業は増え続けており、Anthropic、OpenAI、AppleもすでにTrainiumの利用を開始または拡大しています。AmazonのCEOアンディ・ジャシー氏は2025年12月、Trainiumがすでに数十億ドル規模の事業に成長していると述べており、Nvidiaに依存しないAIインフラの選択肢として存在感を高めています。

出典：TechCrunch

Amazon、S3をAIエージェントのファイルシステムに

2026年04月07日 Amazon Claude AWS Claude Code エンジニアエージェントコンテキスト

オブジェクトとファイルの統合

S3バケットをローカルマウント

データ移行・複製が不要に

EFS技術で完全なファイル操作を実現

エージェント開発の課題解消

セッション状態消失の問題を解決

数千の同時接続に対応

共有ディレクトリで複数エージェント連携

FUSE方式との違い

メタデータ不整合の障害を排除

ファイルとオブジェクトの同時アクセス

詳細を見る

Amazon Web Services（AWS）は、オブジェクトストレージS3のバケットをAIエージェントのローカル環境に直接マウントできる新機能「S3 Files」を発表しました。コマンド1つでS3上のデータをファイルシステムとして利用でき、データの移行や複製は不要です。すでに主要なAWSリージョンで利用可能となっています。

従来、S3はAPIベースのオブジェクトストレージであり、ファイルパスやディレクトリといったファイルシステムの概念を持ちませんでした。AIエージェントはローカルのファイル操作ツールに依存するため、S3上のデータを使うにはダウンロードが必要でした。しかし、エージェントのコンテキストウィンドウが圧縮されるとセッション状態が失われ、ダウンロード済みファイルの情報も消えてしまうという問題がありました。

S3 Filesは、AWSのElastic File System（EFS）技術をS3に直結させ、完全なファイルシステムセマンティクスを提供します。従来のFUSE（Filesystems in USErspace）方式とは異なり、ファイルAPIとS3オブジェクトAPIの両方から同一データに同時アクセスできます。AWSのVP兼ディスティングイッシュドエンジニアのAndy Warfield氏は、社内でKiroやClaude Codeを使う際にもこの課題が発生していたと明かしています。

マルチエージェント環境では、数千のコンピュートリソースが同一のS3ファイルシステムに同時接続でき、読み取りスループットは毎秒テラバイト級に達するとAWSは説明しています。エージェント間の状態共有は、サブディレクトリやノートファイルといった標準的なファイルシステム規約で実現されます。

アナリストからの評価も高く、GartnerのJeff Vogel氏は「S3 Filesはオブジェクトとファイルストレージ間のデータ移動を排除し、データコピーなしで共有の低遅延ワークスペースに変える」と指摘しています。IDCのDave McCarthy氏は「エクサバイト級のバケットをローカルドライブのように扱える」と述べ、エージェントの自律的な運用速度を大幅に向上させると評価しました。

出典：VentureBeat

イラン革命防衛隊、OpenAIのアブダビデータセンターを攻撃対象に

2026年04月06日 Google OpenAI NVIDIA Apple オラクルソフトバンク AWS リスクインフラデータセンターエネルギー安全保障画像動画投資スターゲイト・プロジェクトトランプ

イランの報復警告

Stargate施設の衛星画像を公開

アメリカのインフラ攻撃への報復を宣言

エネルギー・テック企業を標的に明示

動画で「完全な殲滅」を予告

中東AIインフラへの影響

AWSバーレーン拠点が既に被弾

ドバイのOracle施設にもミサイル着弾

NvidiaやAppleにも名指しで脅迫

5000億ドル規模の投資に暗雲

詳細を見る

イラン革命防衛隊（IRGC）は4月3日、OpenAIがアラブ首長国連邦アブダビに建設中のStargate データセンターを攻撃対象とする動画を公開しました。動画にはGoogle Mapsから取得したとみられる衛星画像が含まれ、アメリカがイランの民間インフラを攻撃した場合、中東地域のアメリカ関連エネルギー・テクノロジー企業を「完全に殲滅する」と警告しています。

StargateプロジェクトはOpenAI、SoftBank、Oracleによる総額5000億ドル規模のAIデータセンター共同事業です。アブダビ施設だけで300億ドル以上の投資が見込まれ、16ギガワットの計算能力を備える計画ですが、建設は現在も進行中の段階にあります。

この脅迫は、トランプ大統領がイランに対しホルムズ海峡の再開を要求し、応じなければ火曜日までに発電所や橋梁を攻撃すると警告したことへの対抗措置です。イラン外務省は「あらゆる力をもって国家安全保障と主権を守る決意」を表明しました。

中東のデータセンターはすでに実際の被害を受けています。イランのミサイルがバーレーンとドバイのAWS施設を直撃し、ドバイのOracle施設にも着弾しました。先週にはNvidiaやAppleも名指しで脅迫されており、AI産業の中東展開における地政学リスクが急速に高まっています。

出典：The Verge | TechCrunch

Anthropicが数ギガワット規模のTPU契約をGoogleらと締結

2026年04月06日 Google Anthropic NVIDIA マイクロソフト Claude AWS AI導入推論 GPU ハードウェア TPU クラウド投資

契約と投資の概要

数ギガワット規模の次世代TPU容量確保

2027年から順次稼働開始予定

大部分をアメリカ国内に設置

昨年の500億ドル投資計画をさらに拡大

急成長する事業規模

年間売上が300億ドル超に到達

年間100万ドル超の法人顧客が1,000社突破

2か月で大口顧客数が倍増

マルチクラウド戦略

AWS・Google Cloud・Azureの3大クラウド対応維持

詳細を見る

Anthropicは2026年4月6日、GoogleおよびBroadcomと数ギガワット規模の次世代TPU容量を確保する新たな契約を締結したと発表しました。この計算基盤は2027年から順次稼働を開始し、フロンティアモデル「Claude」の訓練と推論に活用されます。同社CFOのKrishna Rao氏は「過去最大の計算資源へのコミットメント」と述べています。

Anthropicの事業は2026年に入り急成長を続けており、年間売上ランレートは300億ドルを突破しました。2025年末の約90億ドルから3倍以上の伸びとなります。年間100万ドル以上を支出する法人顧客は2月時点の500社超からわずか2か月で1,000社に倍増しており、企業のAI導入が加速していることを示しています。

今回の契約で確保する計算基盤の大部分はアメリカ国内に設置される予定です。これは2025年11月に発表した500億ドルのアメリカ国内AI基盤投資計画の大幅な拡大に位置づけられます。昨年10月に発表したGoogle CloudのTPU容量拡大に続く動きであり、Broadcomとの関係もさらに深まることになります。

Anthropicはハードウェアの多様化戦略を維持しています。AWSのTrainium、GoogleのTPU、NVIDIAのGPUを用途に応じて使い分けることで、性能と耐障害性を最適化しています。主要クラウドパートナーは引き続きAWSであり、Project Rainierでの協業も継続中です。Claudeは現在、AWS Bedrock・Google Cloud Vertex AI・Microsoft Azure Foundryの3大クラウドすべてで利用可能な唯一のフロンティアAIモデルという位置づけを維持しています。

出典：Anthropic公式

サイバーセキュリティ共通言語OCSFが業界標準に急成長

2026年04月04日 AWS アシスタントデータ漏洩プロンプトインジェクションインフラセキュリティエージェントプロンプト AIゲートウェイ Falcon

OCSFの概要と急拡大

ベンダー中立のオープンソーススキーマ

参加組織が17社から200超に拡大

2024年11月にLinux Foundation加入

AWS・Splunk・CrowdStrikeなど主要製品が対応

AI時代の新たな役割

AIエージェントの行動追跡に共通スキーマが不可欠

バージョン1.5〜1.7でAI関連イベント対応

1.8.0でLLMのトークン異常検知を計画

SOCのデータ統合コストを大幅削減

詳細を見る

Open Cybersecurity Schema Framework（OCSF）は、セキュリティイベントデータの記述方法を統一するオープンソースフレームワークです。2022年にAWS・Splunkが発表し、現在は900人超の貢献者を擁する業界標準へと成長しています。

セキュリティ運用の現場では、異なるツールが同じ概念を別々のフィールド名や構造で表現するため、データの正規化に膨大な時間がかかります。OCSFはベンダー中立の共通データモデルを提供し、SIEM・データレイク・分析パイプライン間の変換コストを削減します。

AWS Security LakeやSplunk、CrowdStrike Falcon、Palo Alto Networksなど主要セキュリティ製品がOCSFに対応済みです。抽象的な標準規格から実運用のインフラへと移行した点が、従来の業界標準との大きな違いです。

AI基盤の普及により、LLMゲートウェイやエージェント実行環境、ベクトルストアなど新たなテレメトリ源が増加しています。AIアシスタントが誤ったツールを呼び出したり機密データにアクセスしたりするセキュリティイベントを、システム横断で把握する必要性が高まっています。

OCSFはバージョン1.5.0から1.7.0でAI関連の異常行動検知やツール呼び出しの追跡機能を追加しました。開発中の1.8.0では、トークン数の急増からプロンプトインジェクションや情報漏洩の兆候を検知する仕組みが計画されています。

出典：VentureBeat

イラン革命防衛隊が米テック大手18社への攻撃を予告

イランの攻撃予告

AppleやGoogle含む18社が標的に

AWSデータセンターに実際の攻撃実績

中東進出中のAI企業にも波及懸念

テック株が最大20%下落

米中間選挙への介入

SAVE法で身分証提示を義務化

郵便投票への規制を大統領令で強化

選挙否定論者が政府要職に多数配置

Polymarketの失態

DCポップアップバーが技術障害で混乱

Palantirとの提携でスポーツ市場監視を開始

詳細を見る

イラン革命防衛隊は2026年4月1日を期限として、Apple・Microsoft・Google・Meta・Tesla・Palantirなど米テック大手18社への攻撃を予告しました。中東地域に拠点を持つ企業の従業員や近隣住民に退避を呼びかけており、米国とイランの対立が民間企業を直接巻き込む段階に入っています。

すでにイランはAmazon Web Servicesのデータセンターを2度攻撃しており、米国所有の大規模クラウドインフラへの初の公式確認された攻撃となりました。Sam Altman氏がトランプ政権関係者とともに中東でデータセンター投資を進める中、AnthropicのDario Amodei氏は中東へのデータセンター設置に警戒を示しています。

テック企業の株価は最大20%下落し、NvidiaやMetaも大きな打撃を受けています。一方、サンフランシスコのテック企業社員の多くは戦争への関心が薄く、経営層との温度差が際立っています。OpenAIが年内に予定していたIPOへの影響も懸念されています。

米国内ではトランプ政権が中間選挙への介入を強めています。投票時にパスポートや出生証明書の提示を義務づけるSAVE法の成立を推進し、郵便投票を制限する大統領令に署名しました。選挙60日前までに有権者名簿を連邦政府に提出させる内容で、大学生の投票権を事実上制限する狙いがあると指摘されています。

予測市場大手PolymarketはワシントンDCでポップアップバー「シチュエーションルーム」を開催しましたが、開場が1時間半遅れ、設備の大半が動作しない失態に見舞われました。同社はPalantirとスポーツ市場の不正監視で提携を発表しましたが、地政学的な賭けの疑惑調査には適用しない方針で、急成長と運営の未熟さが浮き彫りになっています。

出典：WIRED

AI議事録アプリGranola、メモが初期設定でリンク公開状態と判明

2026年04月02日 OpenAI Anthropic AWS AI要約リスクデータ漏洩セキュリティプライバシー音声米国

プライバシー設定の問題

リンク知る全員が閲覧可能

議事録の一部も外部から参照可能

大手企業が幹部の利用を禁止

AI学習とデータ管理

非企業プランはAI学習がオン

匿名化データをモデル改善に利用

外部AI企業へのデータ提供は否定

音声は保存せずメモと文字起こしのみ保管

対処方法

設定から共有範囲を変更可能

詳細を見る

AI議事録アプリGranolaが、ユーザーのメモを初期設定で「リンクを知っている全員」に公開していることが判明しました。同社は公式サイトで「メモはデフォルトで非公開」と説明していますが、実際の設定は異なっていました。

The Vergeの検証では、ログインしていないプライベートブラウザからでも自分のメモにアクセスできることが確認されました。メモの作成者名や作成日時も表示され、箇条書きを選択すると文字起こしの引用やAI要約も閲覧できる状態でした。

セキュリティ上の懸念から、ある大手企業は上級幹部に対してGranolaの使用を禁止したとThe Vergeが報じています。LinkedInでは昨年すでにこの問題を指摘する投稿があり、リンクが漏洩すれば誰でも閲覧可能になるリスクが警告されていました。

さらに非エンタープライズプランのユーザーは、匿名化されたデータがAIモデルの改善に使用される設定が初期状態で有効になっています。ただしOpenAIやAnthropicなど外部企業へのデータ提供は行っていないと同社は説明しています。

対処法として、Granolaの設定画面から「Default link sharing」を「Private」または「Only my company」に変更できます。AI学習についても設定メニューからオプトアウトが可能です。データは米国のAWSに暗号化保存され、音声データは保存されません。

出典：The Verge

OpenAI、1220億ドル調達　評価額8520億ドルでIPOへ布石

史上最大の資金調達

評価額8520億ドルで完了

SoftBank・a16zら共同主導

個人投資家から30億ドル調達

急成長する事業規模

月間売上20億ドルに到達

週間ユーザー9億人超え

法人比率が売上の40%に拡大

インフラと今後の戦略

AIスーパーアプリ構想を発表

複数チップ基盤に分散投資

詳細を見る

OpenAIは2026年3月、1220億ドル（約18兆円）の資金調達を完了したと発表しました。評価額は8520億ドルに達し、同社史上最大の調達ラウンドとなります。年内に予定されるIPOに向けた布石とみられています。

ラウンドはSoftBankとAndreessen Horowitzが共同主導し、D.E. Shaw Ventures、MGX、TPGなどが参加しました。Amazon、NVIDIA、Microsoftも戦略的パートナーとして出資しています。初めて銀行チャネルを通じた個人投資家にも門戸を開き、30億ドル以上を集めました。

事業面では月間売上が20億ドルに達し、AlphabetやMetaの同時期と比べ4倍の成長速度だと同社は主張しています。ChatGPTの週間アクティブユーザーは9億人を超え、有料会員は5000万人以上です。検索利用は1年で約3倍に伸びています。

法人向け事業は売上全体の40%を占めるまでに成長し、2026年末までにコンシューマーと同等になる見通しです。最新モデルGPT-5.4がエージェント型ワークフローの需要を牽引し、APIは毎分150億トークン以上を処理しています。広告事業も開始からわずか6週間でARR1億ドルを突破しました。

同社はAIスーパーアプリ構想を掲げ、ChatGPT、Codex、ブラウジング機能などを単一のエージェント体験に統合する方針です。インフラ面ではNVIDIA、AMD、AWS Trainiumなど複数のチップ基盤に拡大し、回転信用枠も約47億ドルに増額しました。調達資金はAIチップやデータセンターの拡充に充てられます。

出典：TechCrunch | OpenAI公式

LangChainとMongoDBがAIエージェント基盤で戦略提携

2026年03月31日 LangChain AWS 検索インフラクラウドセキュリティコンプライアンスデプロイデバッグ医療提携エージェント LangSmith RAG

統合プラットフォームの全容

Atlas上でベクトル検索・状態管理を一元化

自然言語からMongoDB問い合わせを自動生成

LangSmithでエージェント全工程を可視化

導入企業の活用事例

Kai Securityが1日で本番運用を実現

Fortune 500企業が金融・医療分野で採用

コンプライアンスや顧客対応を自動化

オープンな設計思想

LLMプロバイダー・クラウドを自由に選択可能

LangGraph等の主要コンポーネントはOSS公開

詳細を見る

LangChainとMongoDBは2026年3月、AIエージェントの開発から本番運用までを単一プラットフォームで完結させる戦略的パートナーシップを発表しました。6万5000社以上が利用するMongoDB Atlas上にエージェント基盤を構築する統合ソリューションです。

統合の中核は、Atlas Vector SearchによるRAG（検索拡張生成）の実装です。セマンティック検索、ハイブリッド検索、GraphRAGを単一のMongoDBデプロイメントから実行でき、ベクトルデータと業務データを同じ基盤で管理するため、同期処理や二重管理の負担がなくなります。

MongoDB Checkpointerはエージェントの状態をMongoDBに永続化する仕組みで、会話履歴の保持、障害からの自動復旧、任意時点への巻き戻しデバッグが可能です。LangSmithのデプロイメント環境で設定するだけで、アプリケーションデータと同じデータベースにエージェントの状態が保存されます。

Text-to-MQL機能では、自然言語をMongoDBクエリ言語に自動変換し、エージェントが業務データに直接アクセスできます。「過去30日間の配送遅延注文を表示」といった質問を、カスタムAPIなしで処理できるため、開発工数を大幅に削減できます。

サイバーセキュリティ企業のKai Securityは、この統合により1日で本番デプロイを達成しました。従来は別途データベース層の構築に1カ月を要していた作業が、既存のMongoDB基盤上で一時停止・再開、障害復旧、監査証跡を即座に実装できたとしています。

LangChain CEOのHarrison Chase氏は「MongoDBの顧客はプロトタイプから本番エージェントまで、既存インフラを離れずに完結できる」と述べています。全統合機能は即日利用可能で、AWS・Azure・GCPのマルチクラウドに対応し、主要コンポーネントはオープンソースとして公開されています。

出典：blog.langchain.com

韓国AI半導体Rebellions、IPO前に4億ドル調達し評価額23億ドルに

2026年03月30日 Google NVIDIA Meta AWS 投資家推論半導体クラウド米国日本韓国スタートアップ投資資金調達評価額 IPO

資金調達と評価額

4億ドルのプレIPOラウンド完了

累計調達額8.5億ドルに到達

半年間で6.5億ドルを集中調達

企業評価額は約23.4億ドル

事業展開と新製品

米国・日本・サウジ・台湾に法人設立

推論特化チップで差別化

RebelRackとRebelPOD発表

Nvidia対抗の新世代半導体勢力

市場背景

LLM商用化で推論需要が急拡大

AWS・Meta・Googleも自社チップ開発加速

詳細を見る

韓国のファブレスAI半導体スタートアップRebellionsは、IPO前の資金調達ラウンドで4億ドル（約600億円）を調達しました。未来アセット金融グループと韓国国家成長基金が主導し、企業評価額は約23.4億ドルに達しています。

同社は2024年のシリーズBで1.24億ドル、2025年11月のシリーズCで2.5億ドルを調達しており、累計調達額は8.5億ドルに上ります。このうち6.5億ドルはわずか半年間で集めたもので、AI半導体市場への投資家の期待の大きさを示しています。

Rebellionsは2020年設立のファブレス企業で、AI推論に特化したチップの設計・開発を手がけています。大規模言語モデルの商用展開が進む中、推論処理の重要性が急速に高まっており、同社はこの成長領域に焦点を当てています。

今回の資金調達と同時に、新製品RebelRackとRebelPODも発表されました。RebelPODは本番環境向けの推論計算ユニット、RebelRackは複数ラックを統合した大規模AI展開向けのスケーラブルクラスターです。

グローバル展開も加速しており、米国・日本・サウジアラビア・台湾に現地法人を設立しました。米国ではクラウド事業者や政府機関、通信事業者との連携を進める方針です。Nvidiaの支配的地位が揺らぐ中、AWS・Meta・Googleなど大手も自社チップ開発を進めており、AI半導体市場の競争は一段と激化しています。

出典：TechCrunch

NVIDIA、GPU動的割当ドライバをKubernetesコミュニティに寄贈

2026年03月24日 Google NVIDIA マイクロソフト AWS エコシステム推論 GPU クラウド

DRAドライバ寄贈の概要

CNCFへの寄贈でコミュニティ主導に移行

KubeCon Europeで正式発表

GPU資源の動的再構成が可能に

MIG・MPS技術による効率的共有を実現

業界連携と今後の展開

AWS・Google・Red Hat等主要企業が協力

KAIスケジューラがCNCFサンドボックス入り

Kata ContainersでGPU機密計算に対応

Grove発表で推論ワークロード管理を強化

詳細を見る

NVIDIAは、KubeCon Europe 2026において、GPU向け動的リソース割当（DRA）ドライバをCloud Native Computing Foundation（CNCF）に寄贈すると発表しました。これにより同ドライバはベンダー管理からKubernetesプロジェクト配下のコミュニティ主導へと移行します。

DRAドライバは、Kubernetes上でAIワークロードを実行する企業にとって重要な基盤ソフトウェアです。Multi-Instance GPUやMulti-Process Serviceに対応し、GPUリソースの効率的な共有と動的な再構成を可能にします。大規模AIモデルの学習に不可欠なマルチノードNVLinkもネイティブサポートしています。

AWS、Google Cloud、Red Hat、Broadcom、Canonical、Microsoft、SUSE等の主要クラウド企業がこの取り組みに協力しています。Red HatのCTOクリス・ライト氏は、オープンソースが企業AI戦略の中核になると述べ、標準化の意義を強調しました。CERNも科学計算における貢献を評価しています。

NVIDIAはさらに、CNCFのConfidential Containersコミュニティと連携し、Kata ContainersへのGPUサポートを導入しました。これにより、ワークロードの分離による機密計算が可能となり、データ保護を強化したAI処理を実現します。

加えて、高性能AIワークロードスケジューラ「KAI Scheduler」がCNCFサンドボックスプロジェクトに採用されました。NVIDIA Dynamo 1.0に続き、Kubernetes上でGPUクラスタの推論ワークロードを宣言的に管理できるオープンソースツール「Grove」も発表され、エコシステムの拡充が進んでいます。

出典：NVIDIA公式

Nvidia株価、GTC基調講演中に下落ウォール街はAIバブル懸念

2026年03月21日 NVIDIA Amazon Groq AWS AI導入ネットワーク専門家投資家推論半導体 GPU インフラロボットシリコンバレー投資バブルエージェント

市場の反応と背景

GTC基調講演中に株価下落

AI市場の不確実性を投資家が警戒

シリコンバレーと温度差鮮明

前四半期の売上高は前年比73%増

Huangの強気見通し

Blackwell等で1兆ドルの受注見込み

AIエージェント市場を35兆ドルと予測

Amazonが100万GPU購入計画

物理AI・ロボット市場は50兆ドル規模

専門家の見解

イノベーション速度が新たな不確実性を創出

企業AI導入は変曲点に近づく

詳細を見る

Nvidiaのジェンセン・ファンCEOが2026年3月のGTC基調講演で2時間半にわたり新技術を発表しましたが、講演開始とともに時価総額4兆ドルの同社株価は下落しました。ウォール街の投資家はAIの将来に対する不確実性とバブル懸念を重視した形です。

ファンCEOは講演で、ゲーム用グラフィックス技術、ネットワークインフラ、自動運転契約、Groqと共同設計した推論高速化チップなど多数の新製品を披露しました。AIエージェント市場を35兆ドル、物理AI・ロボット市場を50兆ドルと見積もり、BlackwellとVera Rubinチップだけで2027年末までに1兆ドルの受注を見込むと述べました。

調査会社Futurumのダニエル・ニューマンCEOは、AIの技術革新の速度が市場に「新たな不確実性」をもたらしていると分析します。企業のAI導入に関する否定的な報道は半年前のデータに基づいており、実際には急速に普及が進んでいると指摘しました。

Nvidiaの業績はこの見方を裏付けています。前四半期の売上高は前年比73%増と目標を大幅に上回り、AmazonがAWS向けに2027年末までに100万GPUを購入する計画も今週確認されました。Zacks Investment Researchのケビン・クック氏は「経済全体がNvidiaを中心に回っている」と評しています。

バブルの可能性は否定できないものの、GTCで示された不確実性はNvidia固有の問題ではなくAI市場全体の課題です。同社はプラットフォーム企業として世界経済を牽引し続けており、ファンCEOは「100兆ドル規模の産業がすべてここにある」と自信を示しました。

出典：TechCrunch

NVIDIA、次世代AI基盤Vera Rubinと1兆ドル売上見通しを発表

Vera Rubin全貌

7チップ統合の新プラットフォーム

専用CPU「Vera」とBlueField-4搭載

次世代Feynmanアーキテクチャも予告

宇宙データセンター構想を公開

エージェントAI戦略

OpenClaw対応を全社に要求

NemoClawでエージェント安全運用

Nemotron Coalitionで6モデル群展開

産業・医療への展開

BYD・日産ら自動運転新提携

IGX Thorで手術ロボット本格化

AWS・Microsoftと大規模GPU展開

詳細を見る

NVIDIAは2026年3月16日、サンノゼで開催したGTC 2026の基調講演で、創業者兼CEOのジェンスン・ファン氏が次世代フルスタックAIプラットフォーム「Vera Rubin」を発表し、2025年から2027年にかけて少なくとも1兆ドルの売上を見込むと宣言しました。

Vera Rubinは7つのチップ、5つのラックスケールシステム、1台のスーパーコンピュータで構成されるエージェントAI向け統合プラットフォームです。専用CPU「Vera」と新ストレージ基盤「BlueField-4 STX」を搭載し、さらに次世代アーキテクチャ「Feynman」や宇宙AI「Space-1」構想も予告されました。

エージェントAI分野では、オープンソースのOpenClawを全企業が戦略として持つべきだと強調し、エンタープライズ向けにポリシー制御やガードレールを備えた「NemoClaw」スタックとOpenShellランタイムを発表しました。DGX SparkやDGX Stationと組み合わせ、デスクトップで自律エージェントを安全に構築・運用できる環境を提供します。

クラウド基盤ではAWSが100万台超のNVIDIA GPUを展開する大型提携を発表し、MicrosoftもAzureデータセンターにVera Rubin NVL72を世界初導入しました。物理AI領域ではBYD、日産、現代、吉利が自動運転プラットフォームに参画し、Uberとのロボタクシー配車連携も明らかになりました。

医療分野では初のヘルスケア特化型物理AIプラットフォームを公開し、外科手術ロボット向けにCosmos-HやGR00T-Hなどのモデル群を整備しました。Johnson & JohnsonやCMR Surgicalが早期採用を表明しています。さらにAlphaFoldタンパク質構造データベースの大規模拡張や、Nemotronモデルによるデジタルヘルスエージェントの構築支援など、ライフサイエンス領域でも多数の発表がありました。

オープンモデル戦略では「Nemotron Coalition」を立ち上げ、言語・推論、ワールドモデル、ロボティクス、自動運転、バイオ、気象の6つのフロンティアモデル群でパートナーを結集しました。基調講演ではディズニーのオラフが物理AIで自律歩行するデモで締めくくり、シミュレーションから現実世界への移行を印象づけました。

出典：NVIDIA公式 | TechCrunch | TechCrunch

Multiverse Computing、圧縮AIモデルのAPI提供を本格開始

2026年03月19日 OpenAI Meta DeepSeek AWS gpt-oss エンジニア推論クラウドプライバシードローンスタートアップ資金調達評価額 Mistral

圧縮技術の実力

量子着想の独自圧縮技術

OpenAI系モデルを半分に縮小

HyperNova 60Bが原型超えの速度

エッジAIの展開

端末上でオフライン推論可能

データがデバイス外に出ない設計

ドローンや衛星など非接続環境対応

事業拡大と資金調達

100社超のグローバル顧客

€15億評価額で新ラウンド報道

詳細を見る

スペイン発スタートアップMultiverse Computingは、主要AI企業のモデルを圧縮する独自技術「CompactifAI」を活用し、開発者向けのセルフサービスAPIポータルを新たに公開しました。AWS Marketplaceを介さず直接利用できる点が特徴です。

同社の圧縮技術は量子コンピューティングに着想を得たもので、OpenAI、Meta、DeepSeek、Mistral AIなどの大規模モデルを大幅に縮小します。最新のHyperNova 60BはOpenAIのgpt-oss-120bを基に構築され、元モデルより高速かつ低コストで応答できると同社は主張しています。

同時に公開されたCompactifAIアプリは、端末上でローカル実行可能な小型モデル「Gilda」を搭載しています。データがデバイス外に送信されないためプライバシー保護に優れますが、RAM・ストレージが不足する端末ではクラウド経由に自動切替されるという制約もあります。

企業向けの活用が本命であり、ドローンや衛星など通信が不安定な環境でのAI組み込みが有望な用途です。カナダ銀行、ボッシュ、イベルドローラなど100社超のグローバル企業が既に同社の顧客となっています。

Multiverse Computingは2025年に2億1500万ドルのシリーズBを調達済みで、現在は5億ユーロ規模の新ラウンドを15億ユーロ超の評価額で進めていると報じられています。小型モデルの性能向上が追い風となり、エッジAI市場での存在感を急速に高めています。

出典：TechCrunch

Durable、エンジニア6人で300万顧客のAI基盤をVercelに統合

2026年03月18日 Vercel AWS 生産性エンジニア創業者デザイナーデータ漏洩インフラコンテンツコーディングデプロイ SEO エージェントコンテキスト

Vercel移行の背景

マルチテナント運用の限界

SSL・複数リージョン管理が重荷に

6人体制でDevOps不在

セルフホスト比3〜4倍コスト削減

AI基盤の成果

年間3600億トークン処理

新エージェントを1日で本番投入

エンジニア1人あたり10倍の生産性

コーディングエージェントで全面書き換え実現

詳細を見る

Durableは、起業家が数分でビジネスを立ち上げられるAIビジネスビルダーです。SEOやコンテンツ、業務運営をAIエージェントが代行し、現在300万以上の事業者にサービスを提供しています。わずか6人のエンジニアチームで、年間3600億トークンを処理する大規模プラットフォームを運営しています。

同社はもともとAWSでセルフホストしていましたが、マルチテナント環境の運用が深刻な課題となっていました。数百万の顧客サイトごとに異なるトラフィックパターンがあり、カスタムドメインのSSL管理、複数リージョンのクラスタ維持、DDoS対策、テナント別コスト計測など、インフラ管理だけで開発リソースが圧迫されていました。

CTOのKhan氏は「Vercelを自前で作るか、Vercel上に構築するかの二択だった」と語ります。移行はiframeで旧プロダクトをラップしてVercelにデプロイし、その後セルフホスト基盤を完全に撤去するという大胆な手法で実行されました。コーディングエージェントを活用してコードベースの全面書き換えも同時に進めています。

AI機能においては、モデルの切り替え柔軟性、テナント間のコンテキスト漏洩防止、顧客単位のAIコスト可視化という3つの課題を解決しました。マルチエージェント・マルチモデル・マルチモーダルのプロダクトを安全に運用できる体制が整っています。

創業者のClift氏は「数年前の10倍のアウトプットをエンジニア・PM・デザイナー全員が出せるようになった」と述べています。インフラチーム不在で1日11億トークンを処理し、新しいエージェントを1日で顧客に届けられる体制は、今後のテック企業の標準になるとの見方を示しました。

出典：vercel.com

Vercel、2026年AIアクセラレーターに世界39チームを採択

2026年03月17日 OpenAI Anthropic Vercel AWS AI活用広告創業者脆弱性インフラセキュリティ米国欧州不動産ベンチャーキャピタルエージェント AIゲートウェイ ElevenLabs

プログラム概要

39チームが米欧亜中南米から参加

6週間の集中支援プログラム

800万ドル超のパートナークレジット提供

AWS・Anthropic・OpenAI等が協賛

VCメンターと毎週セッション実施

注目の参加企業

Carbyn AIがAIグラス活用の製造支援

Kuvia AIががん診断AI開発

Lane社がAIエージェント向け決済基盤構築

詳細を見る

Vercelは2026年版AIアクセラレータープログラムに、米国・欧州・アジア・中南米から39の初期段階チームを採択したと発表しました。6週間にわたりVercelのインフラを活用した集中支援が行われます。

参加チームにはVercel インフラへのアクセスに加え、AWS、Anthropic、OpenAI、Cartesia、ElevenLabsなどのパートナーから総額800万ドル超のクレジットが提供されます。毎週の創業者・技術リーダーとのセッションや専任VCメンターによる支援も受けられます。

採択チームの事業領域は多岐にわたり、Carbyn AIはAIグラスで製造現場の暗黙知を可視化し、Kuvia AIはデジタル病理学でがんバイオマーカー検出に取り組みます。Lane社はAIエージェントが代理購入できる決済・商取引基盤を構築しています。

セキュリティ分野ではHacktron AIが開発ライフサイクルに統合する脆弱性検出を、Mighty社がAIを悪用した詐欺防止ゲートウェイを開発しています。不動産、建設、獣医学、ゲーム広告など産業横断的なAI活用が目立ちます。

4月16日にサンフランシスコで開催されるデモデーでは、各チームがAIリーダーやVCの前でプレゼンを行い、審査員が上位3チームを選出します。1位チームにはVercel Venturesからの出資を含む10万ドル超の賞品が贈られます。

出典：vercel.com

OpenAI、AWS経由で米政府向けAI販売契約を締結

2026年03月17日 OpenAI Anthropic Amazon Claude AWS ネットワークリスククラウドセキュリティ米国提携

契約の概要

AWSが米政府向けにOpenAI製品を販売

機密・非機密の両領域が対象

GovCloudと機密リージョンに展開

国防総省との既存契約を拡大

競合構図の変化

Anthropicのホームグラウンドに進出

AmazonはAnthropicに40億ドル出資済み

Anthropicは国防総省と対立中

政府契約が企業向け受注の信頼材料に

詳細を見る

OpenAIは、米国政府の機密・非機密業務向けにAI製品を提供するため、Amazon Web Services（AWS）との販売契約を締結しました。The Informationが最初に報じ、AWSもTechCrunchに対して契約を確認しています。

今回の提携は、OpenAIが2026年2月に国防総省と結んだ機密ネットワーク向けAIモデル提供契約に続くものです。この間、競合のAnthropicは大量監視や完全自律兵器への技術利用を拒否し、国防総省からサプライチェーンリスクに指定される事態となりました。

この契約により、OpenAIのAIモデルはAmazon Bedrockを通じて、AWS GovCloudおよびSecret・Top Secret対応の機密リージョンで利用可能になります。AWSの既存の公共セクター顧客基盤を通じ、複数の政府機関への展開が見込まれています。

注目すべきは、AWSがAnthropicに少なくとも40億ドルを出資し、Claudeモデルが既にBedrock上で深く統合されている点です。OpenAIのAWS進出は、Anthropicの主要クラウド基盤に直接競合製品を投入する形となり、AI業界の勢力図に大きな変化をもたらします。

OpenAIは、AWS経由で提供するモデルの選定権を自社で保持し、特にセンシティブな政府機関への提供にはAWSからの事前通知を義務付けています。顧客との展開条件やセキュリティ要件の調整もOpenAIが直接行い、必要に応じて追加の安全措置を求めることが可能です。

出典：TechCrunch

GitHub、OSS安全強化へ1250万ドル拠出を発表

2026年03月17日 Google OpenAI Anthropic GitHub Copilot AWS GitHub Copilot AI活用脆弱性データ漏洩セキュリティコーディングコードレビュー投資提携

資金・提携の全容

1250万ドルをAlpha-Omegaに拠出

Anthropic・AWS・Google・OpenAIと連携

28万人超の保守者に無償ツール提供

Secure OSS Fundに550万ドル追加

AI活用と負担軽減

AI脆弱性発見の速度・規模が急拡大

Copilot Proで修正を加速

低品質報告のフィルタリング強化

保守者の燃え尽き防止を重視

詳細を見る

GitHubは2026年3月、Anthropic、AWS、Google、OpenAIとともにLinux FoundationのAlpha-Omegaイニシアチブに総額1250万ドルを拠出すると発表しました。この取り組みは、オープンソースソフトウェアの保守者がAIセキュリティ機能を活用できるよう支援し、ソフトウェアサプライチェーン全体の安全性を高めることを目的としています。

現在GitHub上の28万人超の保守者が、GitHub Copilot Pro、GitHub Actions、コードスキャン、シークレットスキャンなどのセキュリティ機能を無償で利用できます。さらにGitHub Secure Open Source Fundには550万ドルのAzureクレジットと資金が追加され、Datadog、Open WebUI、OWASPなど新たなパートナーも参画します。

同ファンドはこれまで38カ国200人超の保守者を支援し、191件の新規CVE発行、250件超のシークレット漏洩防止、600件超の漏洩シークレット解決といった具体的成果を上げています。教育と実践的なコーディング支援の組み合わせが、保守者の自発的な学習と行動を促進することも確認されました。

AIの進化により脆弱性発見の速度と規模が急拡大する一方、自動化されたプルリクエストやセキュリティ報告の増加が保守者の負担を増大させています。GitHubはAIを保守者の負担軽減に活用する方針を掲げ、問題のトリアージからコードレビュー、脆弱性修正までを支援するツールの拡充を進めています。

GitHubは今後もAlpha-Omegaなどのパートナーと連携し、プロジェクトだけでなく人への投資を継続する方針です。Secure OSS Fundの第4期は4月下旬に開始予定で、採択プロジェクトには1万ドルの資金、Copilot Pro、10万ドルのAzureクレジット、3週間のセキュリティ教育が提供されます。

出典：GitHub公式

NvidiaがGTC 2026で次世代AI基盤「Vera Rubin」と企業向けエージェント戦略を発表

Vera Rubin基盤の全容

7チップ構成の新プラットフォーム量産開始

推論スループットBlackwell比10倍、トークン単価10分の1

Blackwell・Rubin合計で受注1兆ドル見通し

OpenAI・Anthropic・Meta等が採用表明

エージェントAI戦略

Agent ToolkitをOSSで公開

Adobe・Salesforce・SAP等17社が採用

NemoClawでローカルAIエージェント実行

ハード・ソフトの垂直統合

DGX Stationで1兆パラメータモデルをデスクトップ実行

Dynamo 1.0が推論OS として主要クラウド採用

詳細を見る

Nvidiaは2026年3月16日、サンノゼで開催した年次カンファレンスGTC 2026において、次世代AIコンピューティング基盤「Vera Rubin」プラットフォームを発表しました。CEOのジェンスン・フアン氏は基調講演で、BlackwellとRubinチップの受注見通しが1兆ドルに達すると宣言しています。

Vera RubinはVera CPU、Rubin GPU、NVLink 6 Switch、ConnectX-9、BlueField-4 DPU、Spectrum-6、Groq 3 LPUの7チップで構成されます。旗艦モデルのNVL72ラックは72基のRubin GPUを搭載し、Blackwell比で推論スループットがワットあたり最大10倍、トークン単価は10分の1を実現するとしています。

Anthropicのダリオ・アモデイCEO、OpenAIのサム・アルトマンCEO、Metaらがプラットフォーム採用を表明しました。AWS、Google Cloud、Microsoft Azure、Oracle Cloudの4大クラウドがすべて提供を予定しており、80社超の製造パートナーがシステムを構築します。Microsoftはハイパースケールクラウドとして初めてVera Rubin NVL72を稼働させたと発表しました。

ソフトウェア面では、企業向けAIエージェント構築基盤「Agent Toolkit」をオープンソースで公開しました。Adobe、Salesforce、SAP、ServiceNow、CrowdStrikeなど17社が採用を表明し、セキュリティランタイム「OpenShell」やコスト最適化のAI-Qを統合した包括的な開発環境を提供します。推論OS「Dynamo 1.0」も主要クラウドに採用されています。

ハードウェアでは、GB300チップ搭載のデスクトップ型スーパーコンピュータ「DGX Station」を発表しました。748GBの統合メモリと20ペタフロップスの演算能力で、1兆パラメータモデルをクラウド不要でローカル実行できます。NemoClawと組み合わせ、常時稼働型AIエージェントの個人運用を可能にします。

さらにNvidiaは、Mistral AIら8組織とNemotron Coalitionを結成し、オープンフロンティアモデルの共同開発を開始します。自動運転分野ではBYD・日産らがLevel 4対応車両を開発中で、Uberとは2028年までに28都市でロボタクシー展開を計画しています。製薬大手ロシュは3,500基超のBlackwell GPUを導入し、AI創薬を加速させます。

今回のGTC 2026は、NvidiaがチップメーカーからAIプラットフォーム企業への転換を鮮明にした大会となりました。ハードウェア、ソフトウェア、モデル、エージェント基盤を垂直統合し、宇宙からデスクトップまであらゆるスケールのAIインフラを一社で提供する戦略は、競合であるAMDやGoogle TPU、Amazon Trainiumとの差別化を図るものです。

Nvidia、推論特化チップGroq 3 LPUを発表

2026年03月16日 NVIDIA Groq Cerebras AWS 推論半導体 GPU LPU データセンタースタートアップ買収 Jensen Huang

Groq 3の技術的特徴

SRAM内蔵で超低遅延実現

メモリ帯域150TB/sでGPUの7倍

線形データフローで処理を簡素化

推論時代の到来

Groqを200億ドルで買収し技術統合

推論特化チップのスタートアップが急増

AWSもCerebrasと推論システム構築

推論分離アーキテクチャ

プリフィルとデコードの分離処理

Groq 3 LPXトレイでGPUとLPU統合

詳細を見る

Nvidiaは米サンノゼで開催されたGTC 2026において、AI推論に特化した新チップGroq 3 LPUを発表しました。同社がスタートアップ Groqから200億ドルで技術ライセンスを取得し、わずか2カ月半で製品化したものです。

Jensen Huang CEOは「AIがついに生産的な仕事をできるようになり、推論の転換点が到来した」と宣言しました。学習と推論では計算要件が根本的に異なり、推論では低遅延が最も重要とされています。思考型・推論型モデルでは出力前に何度も推論が実行されるためです。

Groq 3 LPUの核心技術は、プロセッサ内部にSRAMメモリを直接統合した設計にあります。従来のGPUがチップ外のHBMにアクセスする必要があるのに対し、データがSRAMを直線的に通過するため、推論に必要な極めて低いレイテンシを実現します。メモリ帯域は150TB/sで、Rubin GPUの22TB/sの約7倍です。

推論特化チップ市場ではD-matrix、Etched、Cerebrasなど多数のスタートアップが独自アプローチを展開しています。AWSはCerebrasの第3世代チップと自社Traniumを組み合わせた推論システムのデータセンター展開を発表しました。推論を「プリフィル」と「デコード」に分離する技術が注目されています。

Nvidiaも推論分離を活用する新コンピュートトレイGroq 3 LPXを発表しました。8基のGroq 3 LPUとVera Rubin GPUを搭載し、計算集約的な処理はGPUが、最終段階の高速デコードはLPUが担います。Huang氏は「すでに量産段階にある」と述べ、推論市場の急速な拡大を示しました。

出典：spectrum.ieee.org

NVIDIA、1200億パラメータの新モデルNemotron 3 Superを公開

2026年03月11日 Google NVIDIA Perplexity オラクル AWS Coderabbit 検索専門家推論オープンウェイト GPU クラウドセキュリティエージェントコンテキストトランスフォーマー Palantir

モデルの技術革新

MambaとTransformerのハイブリッド構造採用

120Bパラメータ中12Bのみ稼働するMoE方式

100万トークンのコンテキストウィンドウ実現

前世代比最大5倍のスループット向上

企業導入と展開

PerplexityやCodeRabbitなどが即日統合

Siemens・Palantirが製造・サイバー防衛に活用

オープンウェイトで商用利用可能なライセンス

Google Cloud・OCI・AWS等主要クラウドで提供

詳細を見る

NVIDIAは2026年3月11日、エージェントAI向け新モデル「Nemotron 3 Super」を公開しました。1200億パラメータのうち推論時に稼働するのは120億のみで、前世代比最大5倍のスループットと2倍の精度向上を実現しています。

本モデルはMamba-2層とTransformer層を組み合わせたハイブリッド構造を採用しています。Mamba層が線形計算量で高速処理を担い、Transformer層が高精度な情報検索を補完することで、100万トークンのコンテキストウィンドウを効率的に実現しました。

新技術「Latent MoE」は、トークンを圧縮空間に射影してからエキスパートに振り分けることで、同じ計算コストで4倍の専門家を活用できます。さらにマルチトークン予測により推論速度を最大3倍に高速化しています。

Blackwell GPUプラットフォームではNVFP4精度で動作し、Hopper世代のFP8比で最大4倍高速な推論を精度損失なく達成しました。DeepResearch Benchのリーダーボードでは1位を獲得しています。

Perplexity、CodeRabbit、Greptileなどの企業が即日統合を開始し、Siemens、Palantir、Cadenceなどの大手企業も製造・サイバーセキュリティ分野での活用を進めています。モデルはオープンウェイトで公開され、10兆トークン超の学習データとレシピも併せて提供されました。

Google Cloud、Oracle Cloud、AWS、Azureなど主要クラウドに加え、Dell AI FactoryやHPEによるオンプレミス展開にも対応します。NVIDIA NIMマイクロサービスとしてパッケージ化されており、企業は柔軟な環境で商用利用が可能です。

出典：NVIDIA公式 | VentureBeat

Manufact、AIエージェント向けMCP基盤で630万ドル調達

2026年03月11日 Anthropic NVIDIA Vercel GitHub Cloudflare Gemini ChatGPT AWS クラウドデプロイスタートアップ ARR エージェント MCP

MCPの急速な普及

Anthropic発のMCPが業界標準に

月間700万DLのサーバー群

ChatGPT・Gemini等主要AIが対応

Linux Foundation傘下で標準化

Manufactの戦略

6行のコードでAIエージェント構築

OSSのSDKが500万DL突破

60秒でMCPサーバーをデプロイ

NASA・Nvidia・SAPがSDK採用

課題と展望

社員3名で売上はまだゼロ

AWS・Cloudflare等大手が競合参入

詳細を見る

Manufactは、AIエージェントがソフトウェアと連携するための標準プロトコル「MCP」の開発基盤を提供するスタートアップです。サンフランシスコとチューリッヒを拠点とし、Peak XV主導で630万ドルのシード資金を調達しました。Y Combinator 2025年夏バッチの出身企業です。

MCPはAnthropicが2024年末に発表したオープン標準で、AIエージェントと外部ソフトウェアを接続する「AIのUSB-C」と呼ばれています。従来はツールごとに個別のコネクタ開発が必要でしたが、MCPにより単一プロトコルで統一的な接続が可能になりました。現在1万以上のMCPサーバーが稼働しています。

同社の主力製品であるオープンソースSDK「mcp-use」は、わずか6行のコードでMCPサーバーに接続するAIエージェントを構築できます。公開後すぐにGitHub上で大きな注目を集め、累計500万ダウンロード、9,000スターを獲得しました。NASAやNvidiaなど大手組織も利用しています。

ManufactはVercelのビジネスモデルを参考に、SDK・テストツール・クラウドの3層で展開しています。GitHubプッシュから60秒で本番MCPサーバーをデプロイでき、ChatGPT向けのMCPアプリも1分以内に構築可能です。AIエージェント市場は2025年の78億ドルから2030年に526億ドルへ急成長が見込まれています。

一方で課題も明確です。社員はわずか3名で、著名ユーザーはいるものの有料顧客はまだいません。AWS・Cloudflare・Vercelなどクラウド大手もMCPホスティング機能を相次ぎ投入しており、競争は激化しています。同社は2026年末までにARR 200〜300万ドルの達成を目指し、シリーズA調達につなげる方針です。

出典：VentureBeat

GoogleがWiz買収を完了、クラウドセキュリティ統合へ

2026年03月11日 Google オラクル AWS AI活用創業者インフラクラウドセキュリティポリシーブランド中小企業買収

買収の概要と狙い

Wizのブランド維持し統合

マルチクラウド環境の統合防御

AI時代のセキュリティ強化が目的

AWS・Azure・Oracle含む全環境対応継続

統合後の展望

脅威の検知・予防・対応を一元化

AI活用のセキュリティ運用自動化

中小企業向け保護も強化

Google Cloud Marketplaceで提供継続

詳細を見る

Googleは2026年3月11日、クラウドセキュリティ企業Wizの買収手続きを完了したと発表しました。本件は2025年3月に発表されていたもので、WizはGoogle Cloudに合流しつつブランドを維持します。

Wizはフォーチュン100の50%が利用するクラウドセキュリティ基盤で、コードからクラウド、ランタイムまでを統合的に保護する技術を持ちます。Google CloudのAIインフラと脅威インテリジェンスを組み合わせ、より高度な防御を実現します。

統合により、マルチクラウド環境全体で一貫したセキュリティツール・ポリシーを提供し、組織が脅威を迅速に検知・対応できる体制を構築します。AIモデルを悪用した新たな脅威の検出や、AIモデル自体の保護にも対応します。

Google Cloudのオープン戦略に基づき、Wiz製品はAWS、Azure、Oracle Cloudなど主要クラウド環境で引き続き利用可能です。パートナーセキュリティソリューションとの連携も維持され、顧客の選択肢は制限されません。

CEOのスンダー・ピチャイ氏は「人々のオンラインの安全を守ることはGoogleの使命の一部」と述べ、Wiz共同創業者のアサフ・ラパポート氏は「GoogleのAI技術とリソースにより、侵害を未然に防ぐ力が強化される」とコメントしました。

出典：Google公式

MS・Google・AWS、Anthropic Claudeの非防衛顧客向け提供継続を表明

2026年03月06日 Google OpenAI Anthropic マイクロソフト GitHub ChatGPT Claude AWS リスククラウド米国スタートアップ Dario Amodei

クラウド3社の対応

Microsoftが提供継続を最初に表明

Google Cloudも非防衛用途での利用を保証

AWS顧客も非防衛業務で継続利用可能

国防総省との直接契約のみが制限対象

Pentagon指定の影響

Anthropicをサプライチェーンリスクに指定

自律兵器・大規模監視への無制限アクセスを拒否

ChatGPTアンインストールが295%急増

Anthropicは法廷で指定取消を争う方針

詳細を見る

米国防総省がAnthropicをサプライチェーンリスクに正式指定したことを受け、Microsoft、Google、AWSの3社は非防衛顧客向けにClaudeの提供を継続すると相次いで表明しました。

Microsoftは最初に声明を発表し、M365、GitHub、AI Foundryなどのプラットフォームを通じてAnthropic製品を引き続き利用可能とする方針を示しました。同社の法務チームは指定内容を精査し、国防総省以外の顧客への提供に問題がないと結論づけています。

GoogleもGoogle Cloudを通じたClaude提供の継続を確認しました。CNBCの報道によれば、AWSの顧客やパートナーも非防衛関連の業務でClaude を引き続き利用できます。

この問題の発端は、Anthropicが大規模監視や完全自律型兵器への無制限アクセスを拒否したことにあります。国防総省は通常、外国の敵対勢力に対して適用するサプライチェーンリスク指定を米国のAIスタートアップに初めて適用し、業界に衝撃を与えました。

Anthropicのダリオ・アモデイCEOは法廷で指定の取消を求める意向を表明しています。一方、国防総省がOpenAIと契約を結んだ後、ChatGPTのアンインストール数が295%急増するなど、軍事AI利用をめぐる消費者の反発も顕在化しています。

出典：TechCrunch | TechCrunch

AWS、医療特化AIエージェント基盤を発表

2026年03月05日 OpenAI Anthropic Amazon ChatGPT Claude AWS 米国スタートアップ医療投資買収エージェント

製品の概要と機能

HIPAA準拠のAIエージェント基盤

予約管理や文書作成を自動化

EHR連携で既存システムと統合

月額99ドルで600件まで対応

医療AI市場の競争激化

OpenAIがChatGPT Healthを提供

AnthropicもClaude for Healthcare発表

スタートアップも事務負担軽減に注力

AWS、5兆ドル医療市場に本格参入

詳細を見る

Amazon Web Servicesは、医療機関向けAIエージェント基盤「Amazon Connect Health」を発表しました。予約管理、文書作成、患者確認などの反復的な事務作業を自動化し、医療従事者の負担軽減を目指します。

同プラットフォームはHIPAA準拠で、電子健康記録（EHR）ソフトウェアと連携します。現在、患者確認と環境ドキュメンテーション機能を提供しており、予約管理や患者インサイト機能はプレビュー段階にあります。

料金はユーザーあたり月額99ドルで、月600件までの診療に対応します。AWSによれば、一般的なプライマリケア医師の月間診療件数は約300件とのことです。

AWSは5兆ドル規模の米国医療産業への参入を加速させています。2018年のオンライン薬局PillPack買収や、2022年のOne Medicalの39億ドルでの買収など、大型投資を重ねてきました。

医療AI市場では競争が激化しています。OpenAIが1月にChatGPT Healthを、Anthropicが翌週にClaude for Healthcareを発表しました。スタートアップのRegardやNotableも2017年から事務負担軽減AIを提供しており、大手の参入で市場はさらに活性化しています。

出典：TechCrunch

OpenAIが史上最大1100億ドルの調達を発表

2026年02月27日 OpenAI Anthropic NVIDIA マイクロソフト Amazon ソフトバンク AWS 投資家 GPU データセンター AGI 投資資金調達評価額

資金調達の規模と参加者

民間資金調達として史上最大の1,100億ドル

Amazon・NVIDIA・SoftBankが主要投資家

企業評価額がさらに桁違いの水準に上昇

AGI開発への長期資本コミットを示唆

AI覇権争いでの競争優位を確保

資金の戦略的意味

データセンター・GPU調達の加速

Amazon Bedrockとの深化が並走

SoftBankのAI投資家としての復活を象徴

詳細を見る

OpenAIは2026年2月27日、Amazon、NVIDIA、SoftBankを主要投資家とする1,100億ドル（約17兆円）の資金調達を発表しました。民間企業の資金調達として史上最大規模です。

TechCrunchとThe Vergeが報じたこの巨額調達は、OpenAIのAGI（汎用人工知能）開発への長期的なコミットメントを支える戦略的資本基盤を確立するものです。

投資家のAmazonはAWS/Bedrockとの統合深化、NVIDIAはGPU供給の確保、SoftBankはビジョンファンド以来のAI大型投資への復帰という、それぞれの戦略的利益が一致した取引です。

この調達はMicrosoftのOpenAI向け130億ドル投資を大きく超え、AIが今後10年の最重要テクノロジー投資対象であるという市場のコンセンサスを強化します。

競合のAnthropicがPentagon問題で揺れる中でのタイミングも注目で、OpenAIが資金力と政府関係両面で優位に立つ構図が鮮明になっています。

出典：TechCrunch | The Verge

OpenAI×Amazonがエージェント基盤を展開

2026年02月27日 Google OpenAI マイクロソフト Amazon AWS AI活用エコシステムエンジニアインフラクラウド提携エージェント

提携の技術的内容

Amazon Bedrockにステートフルランタイムを追加

エージェントが状態を保持しながらタスクを継続

OpenAI×AWSのエコシステム統合が深化

開発者は既存BedrockインフラでOpenAI活用可能

エンタープライズAIエージェント市場を共同制覇

開発者・企業への実装影響

状態管理の複雑さをプラットフォームが吸収

長期タスク実行エージェントの構築が容易に

AWS既存顧客へのOpenAIアクセスを簡素化

詳細を見る

OpenAIとAmazonは2026年2月27日、戦略的提携を発表し、Amazon BedrockにOpenAIの新しいステートフルランタイム環境を統合しました。エージェントが複数のインタラクションにわたって状態を保持しながらタスクを継続できる機能です。

VentureBeatの分析によれば、このステートフルアーキテクチャはエージェントが「記憶」を持ち、長期プロジェクトを中断することなく実行できる能力を提供します。これはエンタープライズAIエージェントの実用性を根本的に向上させます。

OpenAIとMicrosoftの共同声明も発表されており、MicrosoftとAmazonの両クラウドにOpenAIの最先端モデルが統合される体制が整いました。クラウドベンダーを通じたOpenAI普及が加速します。

開発者にとっては、Bedrock上で慣れ親しんだAWSのインフラと請求体系を維持しながらOpenAIの最新機能を利用できる利便性が高まります。AWS 開発者への訴求力が強化されます。

この提携はGoogleのVertex AIとの競争において、OpenAIがAWSというMicrosoft以外の主要クラウドプラットフォームでも強力なエンタープライズ配布経路を確立したことを意味します。

出典：OpenAI公式 | OpenAI公式 | VentureBeat | OpenAI公式

AIエージェントがAWSを13時間停止させた

2026年02月20日 Amazon AWS 生産性アシスタントエンジニアリスクインフラクラウドコーディング中国エージェント

AI暴走が招いたAWS障害

AIコーディングエージェントKiroが本番環境を自律削除・再構築

2025年12月、AWS 中国の一部で13時間の大規模障害が発生

エンジニアが作業権限を与えたことで自律行動が実行

社内従業員がAI推進戦略への懐疑を公式にFTへ証言

Amazonは従業員の監督不足を原因として責任転嫁

企業AIの自律化リスク

少なくとも2件の障害がAIツール起因と内部告発

AIエージェントによる本番操作の権限管理が焦点に

人間の承認なき自律変更がリスクの核心

大手テックでもAIガバナンスの未整備が露呈

AI開発加速と安全文化の両立が急務

詳細を見る

Amazon Web Servicesは2025年12月、自社のAIコーディングアシスタント「Kiro」が引き起こした障害で、中国本土の一部システムが13時間にわたって停止しました。FTの報道によると、Kiroはエンジニアから作業権限を与えられた後、環境を自律的に削除・再構築するという危険な判断を下しました。

内部事情に詳しい複数の従業員によれば、これはKiroによる障害の少なくとも2件目にあたります。Amazonの経営陣は従業員の監督不足を原因として責任を転嫁していますが、社内ではAIコーディングツールの積極的な展開方針に対する疑念が高まっています。

今回の事件はAIエージェントの自律的な本番環境操作が孕むリスクを鮮明に示しています。エージェントに与える権限の粒度、変更前の人間承認フロー、ロールバック機構の設計が、企業AIガバナンスの核心課題として浮上しています。

AWSは世界最大のクラウドプロバイダーとして、競合他社の手本とも見られる存在です。自社がAIエージェントの被害を受けたという事実は、業界全体のAIエージェント展開戦略の見直しを迫る警鐘となっています。

AI自律化の便益と生産性向上の追求が続く中、本番システムへのアクセス制御と人間の監督体制を整備しない限り、企業インフラへの深刻な被害リスクは拭えません。今回の事例はその教訓を最も権威ある場所で実証しました。

出典：The Verge | Ars Technica

防衛企業がAIエージェントで自律型兵器を開発

2026年02月18日 AWS AI活用倫理エージェント

軍事AIの現実

防衛企業がAIエージェント開発

兵器システムへの自律的AI統合

倫理的懸念の高まり

詳細を見る

ある防衛企業が、爆発物の標的設定を自律的に行うAIエージェントシステムを開発したことが報道されました。軍事・防衛領域でのAI活用の最前線を示す事例です。

この種の致死的自律型兵器システム（LAWS）の開発は国際的な倫理・法的議論を呼んでおり、AIの軍事利用に関する規制議論が加速しています。

出典：WIRED

Anthropicが3.8兆円評価でシリーズG3000億円を調達

2026年02月12日 Google OpenAI Anthropic Amazon Claude AWS 投資家インフラデータセンター日本投資資金調達評価額

調達の規模と意義

3兆8000億円評価額でシリーズGを実施

調達額3000億円はAI史上最大規模

OpenAIと並ぶAI二強体制を確立

詳細を見る

AnthropicはシリーズGで300億ドル（約4兆5000億円）を調達し、評価額は3800億ドル（約57兆円）に達しました。これはAI企業として史上最大規模の調達であり、Claudeを中心とした同社のポジションを大幅に強化します。

今回の調達はAnthropicの研究開発と商業展開を加速させる資金源となります。特に次世代モデルの開発、エンタープライズ向けサービス強化、そしてデータセンターインフラへの投資が見込まれます。

OpenAIのGPT系列に対抗するClaude 4シリーズの開発が本格化する中、この資金調達はAI競争の加速を象徴しています。日本企業にとっても、AIサービスの調達先としてAnthropicの重要性が高まっています。

この評価額はGoogleやAmazonが主要投資家として支持していることへの市場の評価を反映しています。特にAWS上でのClaude提供を通じた収益化モデルが評価されています。

安全性を重視したAI開発を標榜するAnthropicへの大規模投資は、「安全なAI」へのビジネス価値が市場に認められた証左でもあります。AI安全性研究への継続的投資も約束されています。

出典：Anthropic公式 | TechCrunch

AI推論スタートアップModal Labsが25億ドル評価額で資金調達へ

2026年02月11日 Google AWS エンジニア推論 GPU インフラクラウドスタートアップ資金調達評価額ベンチャーキャピタル

Modal Labsの調達計画

評価額25億ドル（約3750億円）での新ラウンド交渉中

AI推論インフラ専門スタートアップとして急成長

開発者向けGPU クラウド市場の需要拡大を反映

詳細を見る

AI推論インフラ専門スタートアップのModal Labsが約25億ドル評価額での新規資金調達を複数のVCと交渉中であることが明らかになりました。同社は開発者がGPUリソースを従量課金で利用できるクラウドインフラを提供しています。

Modal Labsの成長は、AIモデルの推論（inference）需要が爆発的に拡大していることを背景としています。学習（training）だけでなく、本番環境での推論コストが企業にとって主要なAI支出項目となってきています。

同社はAWS、Google Cloud、Azureに次ぐ専門AI推論プラットフォームとして、特に開発者コミュニティでの支持を拡大しています。今回の評価額は同分野でのModal Labsの競争力を示しています。

出典：TechCrunch

Google、シンガポールにAI投資を拡大

2026年02月10日 Google マイクロソフト AWS エコシステムエンジニアインフラ投資

投資の内容

新インフラ整備を発表

AI人材育成プログラム拡充

19年の拠点をさらに強化

地域戦略

東南アジアのハブとして重視

政府との連携を深化

エコシステム構築を推進

詳細を見る

GoogleはシンガポールでのAI投資拡大を発表しました。19年前に開設した拠点を基盤に、新たなインフラ整備とプログラムを展開します。

AI人材の育成に重点を置き、地元の開発者やビジネスリーダーのスキルアップを支援するプログラムが拡充されます。

シンガポールは東南アジアにおけるAIハブとしての地位を確立しており、Googleの追加投資はその位置づけを強化するものです。

シンガポール政府とのAI政策やデジタルインフラに関する連携も深化しています。官民協力によるAIエコシステムの構築が進んでいます。

グローバルテック企業のアジア投資は加速しており、Googleの動きはMicrosoftやAWSとの地域間競争を反映しています。

出典：Google公式

VercelがGeist Pixelフォント公開とSanityマーケットプレイス統合を発表

2026年02月06日 Vercel AWS エコシステムデザインエンジニアコンテンツデプロイデバッグエージェント Pixel

プロダクトアップデート

Geist Pixelフォントを公開

Sanity CMSがVercelマーケットプレイスに

Sandboxファイル取得を簡素化

開発者体験（DX）の継続改善

Vercel公式ブログで複数発表

AIアプリ開発向けツール充実

フロントエンド開発への影響

デザインシステムの選択肢拡大

CMS統合のサーバーレス化

開発速度向上への貢献

詳細を見る

Vercelは2026年2月6日、複数のプロダクトアップデートを発表した。新しいGeist Pixelフォントはピクセルアート風のデザインを活かしたウェブフォントで、ユニークなビジュアルアイデンティティを求める開発者向けだ。

ヘッドレスCMSの「Sanity」がVercel Marketplaceに登場し、Vercelプロジェクトと即座に連携できる体制が整った。コンテンツ管理とデプロイの統合が容易になる。

Vercel Sandboxのファイル取得APIの簡素化により、AI開発環境でのファイル操作が効率化され、エージェント型アプリのデバッグが容易になった。

Vercelの継続的なアップデートはフロントエンド開発のワンストップ化戦略を反映しており、デプロイ・CMS・AI・フォント・マーケットプレイスを統合する構想が鮮明だ。

次世代Webアプリ開発におけるプラットフォーム戦争はVercel、Netlify、AWS Amplifyなどの間で激化しており、エコシステムの豊かさが選定の鍵となっている。

出典：vercel.com | vercel.com | vercel.com

AmazonとGoogleがAIインフラ競争をリード、AWSクラウド収益も急伸

2026年02月05日 Google マイクロソフト Meta Amazon AWS リスク GPU インフラクラウドデータセンタークラウドサービス投資

CAPEX競争の実態

Amazon・GoogleがAI設備投資でトップ

AWS収益が高成長を継続

Google CloudもAI需要で加速

設備投資合戦の「賞品」は何かを分析

AIインフラへの数百億ドル規模投資

マイクロソフト・Metaも追随

クラウド業界の構造変化

AIトレーニング需要が需要を牽引

GPU供給不足への対策投資

中小クラウドとの競争力格差拡大

詳細を見る

TechCrunchは2026年2月5日、AmazonとGoogleがAI設備投資（CAPEX）競争を主導しているが、その「賞品」は何なのかを分析した。

AWSはAI関連クラウドサービスへの旺盛な需要を背景に高い収益成長を維持しており、Amazonの主要収益エンジンとしての地位を固めている。

GoogleのCloud部門も同様にAI需要により加速成長しており、データセンター建設への巨額投資が続く。

TechCrunchの分析では、CAPEXの「賞品」は単なるクラウド市場シェアではなく、AI時代の基盤インフラ支配権であるとされる。

MicrosoftとMetaも数百億ドル規模の設備投資を行っており、AIインフラ競争の敗者は将来のAIサービス競争力を失うリスクがある。

出典：TechCrunch | TechCrunch

8分でAWSルート権限を奪うAI攻撃チェーンの詳細が明らかに

2026年02月05日 AWS エンジニアセキュリティ認証投資

攻撃手法の詳細

LinkedInメッセージから侵入開始

8分でAWS管理者権限を奪取

AIが各ステップを自動で実行

ソーシャルエンジニアリングの自動化

認証情報の連鎖的奪取

VentureBeatが詳細な攻撃フローを解説

企業セキュリティへの教訓

デプロイ・スケールが最小限の設定

開発者フレンドリーな設計

AWSの複雑さを排除

市場への影響

Vercel・Renderとの競合

中小企業向けクラウドの需要

AI時代のインフラ再設計

スタートアップ向けインフラ

詳細を見る

クラウドインフラスタートアップのRailwayがシリーズB（1億ドル）を完了した。AWSなどの複雑な従来型クラウドに対し、シンプルさとAIネイティブな設計を強みとする。

Railwayのプラットフォームはデプロイから自動スケールまでを最小限の設定で実現でき、AIアプリを構築するスタートアップや個人開発者に適している。DX（デプロイ体験）の根本的改善が差別化点だ。

VercelやRenderとの競合が予想されるが、より広いバックエンド・データベース領域をカバーする点で差別化を図る。AI時代のインフラ再設計というトレンドに乗る。

出典：VentureBeat

AIクラウドRunPodがARR1.2億ドル達成、Redditの投稿から4年で快挙

2026年01月16日 AWS 創業者投資家推論 GPU インフラクラウドクラウドサービススタートアップ投資資金調達 ARR Reddit

成長の軌跡

Redditの1投稿からスタート

設立4年でARR1.2億ドル達成

GPUクラウドサービスを提供

急拡大するAI需要を取り込む

スタートアップ向けに特化

市場における位置づけ

AWS・Azureとの差別化成功

低コストGPUで競争優位

AI企業のインフラ需要を満たす

次の資金調達への期待高まる

上場も視野に入る水準

詳細を見る

RunPodはAIアプリのホスティングプラットフォームで、わずか4年でARR(年換算売上高)1.2億ドルを達成しました。創業者のZhen LuとPardeep Singhが、Redditへの一投稿から事業を始めたという異色の創業ストーリーが話題を呼んでいます。

同社はGPU クラウドサービスを提供しており、AWS・Azureよりも低コストなGPUリソースを求めるAIスタートアップや研究者に支持されています。

生成AIブームによるGPU需要急増の恩恵を直接受けており、収益成長が急加速しています。同様のAIインフラビジネスへの投資家の関心も高まっています。

AIモデル学習・推論の需要が今後も継続すると見られる中、代替インフラプロバイダーとしてのRunPodの存在感は一層高まりそうです。

出典：TechCrunch

ザッカーバーグがMetaのAIインフラ独自構築計画を発表

2026年01月12日 Google マイクロソフト Meta Amazon Instagram Facebook AWS Llama 推論リスクインフラクラウドデータセンターエネルギー投資オープンソースモデル WhatsApp

計画の概要と目的

Metaが独自AIインフラ整備を宣言

外部クラウド依存からの脱却を目指す

数百億ドル規模の投資計画

自社データセンターの大規模拡張

AI開発・推論コストの内製化

競合との位置付け

Microsoft・Googleのクラウド依存リスク回避

Llama等オープンモデルとの整合性

AI研究・製品開発の加速が目標

雇用創出とコスト効率の両立

長期的な技術主権の確立を狙う

詳細を見る

マーク・ザッカーバーグはMetaが独自のAIインフラ構築イニシアチブを立ち上げると発表しました。MicrosoftやAmazon/AWSなどの外部クラウドへの依存を減らし、AIモデルのトレーニングと推論を自社データセンターで完結させる大規模投資計画です。

この動きはMetaがAI競争において技術的主権を確立しようとする長期戦略の一環です。Llamaシリーズのオープンソースモデルをホストするためのインフラ基盤の強化と、WhatsApp・Instagram・Facebookなど自社プラットフォームへのAI統合を加速させる目的があります。

Metaの大規模なAIインフラ投資は電力消費と環境影響という課題も伴います。マイクロソフトが論争を呼んだデータセンター拡張計画と同様に、エネルギー調達と地域コミュニティへの影響が重要な論点となります。

出典：TechCrunch

NvidiaのVera RubinアーキテクチャとBlackwellの性能向上が迫る

2026年01月09日 Google NVIDIA AWS 推論 GPU インフラクラウドエネルギー

次世代GPUロードマップの詳細

Vera Rubin GPU アーキテクチャが数ヶ月以内に登場

Blackwellはソフトウェア最適化で性能を継続向上

Vera Rubinは前世代比で大幅な電力効率改善を達成

H100比較で推論スループットが数倍に

マルチノード学習の最適化でトレーニング効率も向上

NvidiaのAIインフラ支配を次の世代でも維持

詳細を見る

VentureBeatの記事は、Nvidia Vera Rubinアーキテクチャが数ヶ月以内に市場投入されることを伝え、一方で現行Blackwellアーキテクチャが継続的なソフトウェア最適化によって性能を伸ばしていることも報じています。

Vera Rubinはブラックウェルの後継として、AI推論スループットと電力効率の両面で大幅な改善を実現する予定です。特に大規模言語モデルの推論（inference）ワークロードにおけるバッチ処理効率が重視されています。

Nvidiaは複数世代のGPUを市場に並行展開しながら顧客の移行サイクルを管理する高度な製品戦略を取っています。AWSやGoogle CloudなどのクラウドプロバイダーがVera Rubinを採用するタイミングがAI計算コストに大きな影響を与えます。

出典：VentureBeat | NVIDIA公式

Amazon Alexa+がAlexa.comでウェブ一般公開、誰でも無料で試用可能に

2026年01月05日 Google Amazon Gemini ChatGPT AWS Siri エコシステムアシスタントネットワーク推論ハードウェア音声コンテキスト Alexa

Alexa+のウェブ展開と機能強化

Alexa.comで早期アクセスプログラムが一般開放

ハードウェア不要でブラウザからAlexa+を利用

生成AI搭載の新しいAlexaが実用段階へ

2025年2月の早期アクセス開始から段階的展開

Amazonのデジタルアシスタント戦略を刷新

ChatGPT・Geminiへの対抗軸として位置づけ

AIアシスタント戦争の激化

ウェブアクセスで全デバイス対応が実現

家庭のEchoスピーカーを超えた展開

多段階タスク・複雑な質問への推論対応

Amazon内サービスとの深いエコシステム連携

買い物・Prime Video・AWS連携が差別化軸

音声とテキスト両対応でユーザー層拡大

詳細を見る

AmazonはAlexa+をAlexa.comを通じて一般ユーザーへの無料早期アクセスとして提供開始した。これまでEchoデバイスに紐づいていたAIアシスタントがウェブブラウザからアクセス可能になり、スマートフォンやPCで直接利用できるようになった。

Alexa+は2025年2月に生成AIを組み込んだ大幅アップデートとして早期アクセスが開始されており、このウェブ公開は一般普及に向けた重要な段階だ。複雑な質問への推論・多段階タスクの実行が旧来のAlexaから大幅に向上している。

AmazonはAlexa+をChatGPT・Google Gemini・Siriなどとの直接競合として位置づけている。差別化ポイントはAmazon エコシステムとの深い統合で、Amazon Prime・AWS・Kindle・Amazon Musicなどとのシームレスな連携が強みとなる。

ウェブでの提供により、Echo不保有ユーザーへのアクセス障壁が大幅に低下した。特にスマートフォンユーザーにとってブラウザベースでのAIアシスタント利用は自然な選択肢となり、ユーザーベースの拡大が期待される。

今後は音声対話の品質向上・パーソナライゼーション強化・デバイス横断のコンテキスト保持が重要な開発課題となる。Amazonの豊富なユーザーデータと小売業者ネットワークを活用したAIアシスタントとしての差別化が、競争の中での鍵を握る。

出典：Ars Technica | TechCrunch

AmazonのAI体制を大幅再編

2025年12月17日 Google OpenAI Anthropic マイクロソフト Meta Amazon AWS 半導体インフラクラウド AGI 投資 Alexa

組織再編の内容と背景

AWS幹部Peter DeSantisが新AI組織の責任者に就任

AGI部門長Rohit Prasadが来年退任予定

Novaモデル・カスタムシリコン・量子コンピューティングを統合管理

AI競争でのキャッチアップ加速が狙い

Amazonの今後のAI戦略

Nova 2モデルやTrainiumチップ開発を強化

OpenAIへの100億ドル投資交渉も進行中

Anthropicへの80億ドル投資に加え外部連携も拡大

詳細を見る

AmazonのCEO Andy JassyはAI組織の大規模な再編を発表しました。AWS担当SVPとして27年間在籍するPeter DeSantisが、AIモデルや半導体開発、量子コンピューティングを担当する新部門のトップに就任します。

現在AGI部門を率いるRohit Prasadは来年退任する予定です。PrasadはAlexaの進化やAmazon Novaモデルの立ち上げに深く関わってきましたが、Amazonが技術開発の「変曲点」を迎えたとして組織変更が行われます。

DeSantisはAWSのクラウドインフラの専門知識を活かし、モデル・チップ・クラウドソフトウェアの最適化を一体的に推進することが期待されています。また、AI研究者のPieter AbbeelがAmazonのフロンティアモデル研究チームを率いる役割に就く予定です。

この再編はAmazonがMicrosoft、Google、Meta、OpenAIといった競合に遅れをとっているとの見方に応えるものです。Alexaの大幅なAIアップグレードも遅延が続いており、組織の刷新によって技術開発の加速が求められています。

Amazonは12月初旬のre:InventでAI投資に強くコミットしており、米政府AI基盤への500億ドル投資も発表しています。さらにOpenAIへの最大100億ドルの投資交渉も報じられており、Anthropicとの関係に加えてAI分野での存在感を高めようとしています。

出典：TechCrunch | The Verge

米AI３社がエージェント標準化団体を共同設立

2025年12月09日 Google OpenAI Anthropic マイクロソフト AWS エンジニアインフラエージェント MCP

脱「囲い込み」へ業界が協調

OpenAIらがLinux Foundationで連携

AIエージェントの相互運用性と信頼性を確保

特定のベンダーに依存しない中立的な開発環境

標準化を担う３つの寄贈技術

データ接続の標準規格MCPをAnthropicが寄贈

Blockはエージェント構築枠組みGooseを提供

OpenAIはAIへの指示書AGENTS.mdを公開

Googleやマイクロソフトも参加し業界標準目指す

詳細を見る

OpenAI、Anthropic、Blockの3社は、Linux Foundation傘下に「Agentic AI Foundation（AAIF）」を共同設立しました。AIエージェント開発における技術の断片化を防ぎ、相互運用可能な標準インフラを構築することが狙いです。

生成AIの活用は対話型から、タスクを自律実行する「エージェント型」へ移行しつつあります。しかし、各社が独自の規格でツールを開発すれば、互換性がなくなりベンダーロックインが生じる懸念がありました。

核となるのはAnthropicが寄贈した「Model Context Protocol（MCP）」です。これはAIとデータソースを繋ぐ「USB-C」のような標準規格であり、開発者は個別接続の手間から解放されます。

さらにBlockはエージェント構築フレームワーク「Goose」を、OpenAIはAIへの指示記述形式「AGENTS.md」を提供しました。これらはエージェントの開発と制御の共通言語として機能します。

設立にはGoogle、マイクロソフト、AWSなども参加を表明しています。コンテナ技術におけるKubernetesのように、AAIFはAIエージェント時代の不可欠な公共インフラとなることを目指します。

AWS「AIエージェント」へ全振りも企業のROI未達が課題

2025年12月05日 Google OpenAI Anthropic AWS 投資家半導体インフラクラウドデータセンター MIT 投資エージェント

技術の奇跡から実利へ

新型LLM「Nova」とAIエージェントを多数発表

CEOはエージェントが実益を生む転換点と強調

第3世代チップなど自社インフラの強みを活用

企業現場との温度差

95%の企業がAI投資のROIを実感せずとの調査

顧客の成熟度がAWSの想定レベルに未達

モデル市場ではOpenAIらにシェア劣後

インフラ王者の持久戦

オンプレミス版AIファクトリーは投資家が高評価

強固な財務基盤で長期的な技術改善を継続

詳細を見る

AWSは年次総会「re:Invent 2025」で、AIエージェントや新型モデル「Nova」を一挙に発表し、AI実用化へのシフトを鮮明にしました。CEOのマット・ガーマン氏は、AIが「技術的な驚異」からビジネス価値を生む段階に入ったと強調しますが、顧客企業の受け止めには依然として温度差があります。

最大の課題は、顧客企業の準備不足です。MITの調査では95%の企業がAI投資の対価を得られていないとしており、多くはまだ試験運用段階に留まります。アナリストは、AWSの技術発表が先進的すぎるあまり、現在の顧客の成熟度やニーズと乖離している可能性を指摘しています。

AIモデルの市場シェアでは、OpenAIやGoogle、Anthropicが先行しており、AWSは後を追う立場です。しかし、投資家はAWSの真価をモデルそのものではなく、それを支えるクラウドインフラや、自社データセンターでAIを稼働させる「AIファクトリー」に見出しています。

AWSの強みは、インフラ市場での圧倒的な支配力と、四半期で114億ドルを稼ぎ出す強固な収益性です。たとえAIブームが一時的に停滞しても、他社より耐性が強く、長期的な視点で技術を改良し続ける「実験の余地」が残されています。

出典：TechCrunch | TechCrunch | TechCrunch

Amazon新AI発表とDOGE潜伏の実態

2025年12月05日 OpenAI Amazon Facebook AWS 生産性チャットボット業務効率エンジニアリスク脆弱性セキュリティデバッグイーロン・マスク基盤モデル

AmazonのAI戦略と課題

独自モデルNovaシリーズを発表

AWS基盤でOpenAIに対抗

AIツール強制で開発現場が疲弊

AI脆弱性とDOGEの真実

詩的表現で安全策を突破可能

DOGEは解散せず各省庁に浸透

FBデート機能が2100万人利用

詳細を見る

今週、Amazonが独自AIモデル「Nova」を発表し、OpenAIへの対抗姿勢を鮮明にしました。一方、米政府効率化省（DOGE）は解散報道を覆し、実際には各省庁へ深く浸透している実態が明らかになりました。本記事では、AI開発競争の新たな局面と、政府機関におけるテック的合理化の波、さらにAIセキュリティの脆弱性について、ビジネスリーダーが知るべき核心を伝えます。

Amazonは長らくの沈黙を破り、高性能な新基盤モデル「Nova」シリーズを発表しました。AWSの計算資源を垂直統合的に活用し、企業向けに特化したAIソリューションを展開することで、OpenAIへの依存脱却を図る狙いです。しかし社内では、エンジニアに対しAIツールの利用が半ば強制され、デバッグや「AIの世話」による業務効率の悪化と士気低下が報告されており、生産性向上への課題も浮き彫りになっています。

大規模言語モデル（LLM）の安全性に関しては、ユニークかつ深刻な脆弱性が発覚しました。最新の研究によると、悪意ある質問を「詩」の形式に変換するだけで、主要なAIチャットボットの安全ガードレールを約62%の確率で突破可能です。爆弾製造法などの危険情報が容易に引き出せるこの事実は、AIの検閲回避テクニックが高度化していることを示唆しており、企業導入時のリスク管理において重要な教訓となります。

政治分野ではDOGE（政府効率化省）の動向に注意が必要です。「解散した」との一部報道に反し、実際には組織を分散させ、関係者が各連邦機関の要職に配置されていることが判明しました。イーロン・マスク氏の影響下にあるメンバーが財務省やその他の機関でコスト削減や規制撤廃を推進しており、単なる組織再編ではなく、特定の思想が政府運営のOSレベルにまで浸透しつつある現状が明らかになっています。

その他、メタ社のFacebook Datingが利用者2,100万人を突破し、競合アプリHingeを凌駕する規模に成長しました。既存の巨大なユーザー基盤とAIによるマッチング精度の向上が勝因と見られ、後発でもプラットフォームの規模を活かせば市場を席巻できる好例です。テック業界の勢力図は、AIの実装力と既存アセットの掛け合わせによって、依然として激しく変動しています。

出典：WIRED

AWS、AI開発の知識を動的ロード。コストと精度を改善

2025年12月04日 Stripe AWS 生産性アシスタントエンジニアファインチューニングコーディング開発ツールプロンプトコンテキスト Cursor Figma

AI開発が抱える「文脈の罠」

ツール連携でトークンを大量浪費

不要な情報でAIの回答精度が低下

「Kiro powers」の解決策

文脈に応じて知識を動的にロード

StripeやFigmaなど9社と連携

不要な情報を捨てコスト最小化

経営的インパクトと展望

高額なファインチューニング不要

他ツールへの展開も見据えた戦略

詳細を見る

米アマゾン・ウェブ・サービス（AWS）は年次会議「re:Invent」にて、AI開発支援の新機能「Kiro powers」を発表しました。これはAIコーディングアシスタントが外部ツールと連携する際、必要な専門知識だけを動的に読み込む仕組みです。従来の手法で課題となっていたトークンの浪費や応答精度の低下を防ぎ、開発者の生産性とコスト効率を劇的に高める狙いがあります。

昨今のAI開発では、決済やDBなどの外部ツールを連携させる際、開始時にすべてのツール定義を読み込むのが一般的でした。しかしこれには、コードを書く前に数万トークンを消費してしまう重大な欠点があります。結果としてコストが嵩むだけでなく、無関係な情報がノイズとなり、AIの判断を鈍らせる「コンテキスト腐敗」を引き起こしていたのです。

Kiro powersはこの問題を、コンテキストの「オンデマンド化」で解決します。開発者が「決済」について尋ねればStripeの知識を、「データベース」と言えばSupabaseの知識を自動的に呼び出します。不要な情報はメモリから消去されるため、AIは常に最適な情報量で稼働し、回答精度と速度が向上します。AWSはこのアプローチを「何を忘れるべきかを知る賢さ」と位置づけています。

ローンチパートナーにはStripe、Figma、Datadogなど有力テック企業9社が名を連ねました。これにより、高度なスキルを持つエンジニアしか行えなかった「最適なプロンプト設定」や「ツール連携の最適化」が、誰でもワンクリックで利用可能になります。特定のサービスのベストプラクティスがパッケージ化され、即座に開発環境へ適用される「専門性の民主化」が進むでしょう。

特筆すべきは、この手法が高額なモデルのファインチューニングよりも安価で実用的である点です。企業は最新の高性能モデルを利用しながら、必要な専門性だけを外付けで追加できます。現在はAWSの「Kiro IDE」専用ですが、将来的にはCursorなど他のAIエディタとの互換性も目指しており、開発ツール市場全体の標準化を主導する構えです。

出典：VentureBeat

AWS、「自律AI」と「新チップ」で企業の生産性と収益性を刷新

2025年12月03日 Anthropic NVIDIA Amazon AWS 生産性アシスタント AI導入半導体インフラクラウドエネルギーコーディングエージェント

自律型AIエージェントの台頭

指示から計画・実行まで担う自律型エージェントへ進化

開発用エージェントKiroは数日間の自律稼働が可能

配車大手Lyftは解決時間を87%短縮し成果を実証

独自チップとインフラの強化

新チップTrainium3は前世代比で性能4倍・電力4割減

Trainium2は既に数十億ドル規模の収益事業に成長

Nvidiaとの相互運用性やオンプレミス対応も推進

カスタムAI開発の民主化

SageMaker等でサーバーレスのモデル調整が可能に

新モデル群Novaや構築代行サービスForgeを発表

データベース費用を最大35%削減する新プラン導入

詳細を見る

AWS re:Invent 2025で示されたのは、AIが「アシスタント」から「エージェント」へと進化する未来です。AWSは自律的にタスクを遂行するAIエージェントと、それを支える高性能かつ低コストな独自インフラを同時に展開。企業が直面する生産性向上とコスト最適化の課題に対し、強力な解決策を提示しました。

目玉となるのは、自然言語の指示だけで計画から実行までを行う「Agentic AI」です。開発用エージェントKiroは、ユーザーの作業スタイルを学習し、数日間にわたり自律的にコーディングや修正を行います。Lyftの事例では、問い合わせ対応時間が87%短縮されるなど、実ビジネスでのインパクトが証明され始めています。

インフラ面では、Nvidiaへの対抗馬となる独自チップTrainium3を発表しました。前世代と比較して処理性能は最大4倍、消費電力は40%削減されています。現行のTrainium2はすでに数十億ドルの収益を生む事業に成長しており、Anthropicなどの主要AI企業が計算基盤として採用しています。

企業の競争力を左右する「カスタムモデル」の構築も容易になります。Amazon SageMakerなどにサーバーレスのカスタマイズ機能が追加され、インフラ管理なしで自社データを用いた調整が可能になりました。また、AWSがモデル構築を支援する「Nova Forge」も開始され、独自AIの実装障壁が大幅に下がります。

コストと運用面での現実的な解も提示されました。データベース利用料を最大35%削減する新プランの導入や、オンプレミス環境で最新AIを実行できる「AI Factories」の提供です。これらは、クラウドコストの増大やデータ主権の懸念を持つ企業にとって、AI導入を加速させる重要な後押しとなるでしょう。

出典：TechCrunch | TechCrunch | TechCrunch

AWS、新型AIチップTrainium3発表。Nvidia連携も視野

2025年12月02日 Anthropic NVIDIA AWS エコシステム推論半導体 GPU インフラデータセンターエネルギー日本

性能と効率が大幅に向上

前世代比で速度とメモリが4倍に進化

エネルギー効率が40%改善しコスト削減

最大100万チップの接続が可能

Nvidiaとの連携強化へ

次期Trainium4の開発を示唆

NvidiaのNVLink Fusionに対応予定

既存のGPU資産との併用が可能に

詳細を見る

AWSは年次イベント「re:Invent 2025」にて、自社開発の新型AIチップ「Trainium3」を発表しました。3ナノメートルプロセスを採用し、前世代から処理能力とエネルギー効率を大幅に強化しています。さらに、次世代機「Trainium4」ではNvidia製品との相互運用性を高める計画も明らかにし、AIインフラ市場での攻勢を強めています。

Trainium3を搭載した「UltraServer」は、前世代比で4倍の速度とメモリを提供します。特筆すべきは拡張性で、最大100万個のチップを連結可能です。これは前世代の10倍の規模であり、AIモデルの学習や推論における処理能力を飛躍的に高めます。

コストと環境への配慮も進化しました。新チップはエネルギー効率が40%向上しており、電力消費の増大が課題となるデータセンター運用において重要な利点となります。すでにAnthropicや日本のKarakuriなどが導入し、推論コストの削減を実現しています。

注目は次期モデル「Trainium4」の構想です。Nvidiaの高速相互接続技術であるNVLink Fusionへの対応を予定しており、Nvidia GPUとAWS独自チップの併用が可能になります。これにより、Nvidiaのエコシステムを取り込みつつ、柔軟なAIインフラの構築を支援します。

出典：TechCrunch

AWS「数日自律稼働AI」発表、開発・運用の未来を提示

2025年12月02日 Google OpenAI AWS 生産性エンジニアクラウドセキュリティコーディングデバッグエージェント

3種の自律型「フロンティア」

介入なしで数日間稼働するフロンティアエージェント

Kiroが仕様策定から実装まで自律実行

セキュリティとDevOpsも専用AIで自動化

障害原因の特定時間を数時間から15分に短縮

制御と記憶を司る基盤の進化

自然言語で権限を制限するPolicy機能

ユーザーの好みを保持するエピソード記憶

正確性や安全性を監視する評価システム

詳細を見る

AWSは年次イベントre:Inventにて、人間の介入なしに数日間稼働する新世代の「フロンティアエージェント」と、開発基盤「AgentCore」の大規模アップデートを発表しました。開発・セキュリティ・運用（DevOps）の領域で、AIによる完全自律型の業務遂行を可能にし、エンジニアリングの生産性を劇的に向上させる狙いです。

今回発表された3つのエージェント（Kiro、Security、DevOps）は、単なる支援ツールではなく自律的なチームメイトとして機能します。特にコーディング担当の「Kiro」は、既存コードやログから学習し、仕様の策定から実装、プルリクエストの作成までを独力で完遂する能力を持ちます。

運用とセキュリティの自動化も加速します。DevOpsエージェントは、コモンウェルス銀行の事例において、通常なら熟練エンジニアが数時間要する複雑な障害原因の特定をわずか15分で完了させました。Securityエージェントも同様に、数週間かかる侵入テストを数時間に短縮可能です。

企業導入のカギとなる「制御と信頼」も強化されました。AgentCoreに追加された「Policy」機能は、AIの行動境界を自然言語で設定可能です。例えば「100ドル以下の返金は自動承認するが、それ以上は人間へエスカレーションする」といったルールを厳格に適用できます。

また、新機能「エピソード記憶」により、AIはユーザーの長期的な好みや過去の文脈を保持できるようになります。さらに、安全性や正確性を監視する13種類の「評価システム」も導入され、企業はAIエージェントが意図通りに機能しているかを常にモニタリング可能です。

AWS幹部は、これらの進化がエンジニアの職を奪うのではなく、「エンジニアリングのクラフト（職人芸）」を変化させると強調しています。コーディングやデバッグといった下流工程から解放され、システム設計やAIへの適切な指示出しといったより高次な業務へシフトすることが求められます。

GoogleやOpenAIとの競争が激化する中、AWSは20年にわたるクラウド運用の知見をAIに注入することで差別化を図っています。自律エージェントがコードを書き、システムを守り、運用する未来は、エンジニアにとって生産性革命の新たな幕開けとなるでしょう。

出典：TechCrunch | VentureBeat | TechCrunch | VentureBeat

AWS re:Invent 2025開幕、AI戦略の全貌を配信で

2025年12月02日 Amazon AWS スケジュール調整エンジニアインフラセキュリティ基盤モデル

ラスベガスで年次総会が開幕

re:Invent 2025が開始

注力領域はAgentic AIや保安

Fortniteでも基調講演を配信

注目の基調講演スケジュール

12/2朝: Matt Garman CEO

12/3朝: AI担当Swami副社長

12/4午後: Werner Vogels CTO

詳細を見る

AWSの最大イベント「re:Invent 2025」が12月2日、ラスベガスで開幕しました。今年の焦点は昨年に続きAIで、特にAgentic AIやセキュリティの新発表が期待されます。現地に行けない方も、主要セッションをオンラインで視聴可能です。

今年の基調講演は、通常のライブストリームに加え、人気ゲームFortnite上の特設島でも生配信されるというユニークな試みが行われています。チケット不要で誰でもアクセスでき、業界別のショーケースや連携配信も多数用意されています。

注目の基調講演は5つです。初日12月2日朝にはAWS CEOのMatt Garman氏が登壇し幕を開けました。続く3日朝にはAI担当副社長のSwami Sivasubramanian氏が、最新のAI戦略や基盤モデルについて語る予定です。

技術的な深堀りとして、4日は見逃せません。午前9時からは計算部門トップのPeter DeSantis氏が、午後3時半からはAmazon CTOのWerner Vogels氏が登壇します。エンジニア必見のインフラや未来予測が語られるでしょう。

出典：TechCrunch

AWS、自社データで「特化型AI」を創る新基盤を発表

2025年12月02日 AWS エコシステム専門家推論ファインチューニング推論モデルインフラクラウドコンテンツ音声エージェントベンチマーク基盤モデル Reddit

特化型AI構築サービス

独自データを学習過程に注入可能

ファインチューニングの限界を突破

開発コストと時間を大幅削減

新モデル「Nova」4種

高コスパな推論モデル「Lite」

複雑なタスク処理の「Pro」

音声・マルチモーダルも網羅

AWSのAI戦略

数値性能より実用性を重視

Reddit等が導入を開始

詳細を見る

米AWSは2日、新基盤モデル「Nova」と、企業が自社データで特化型AIを構築できる「Nova Forge」を発表しました。単なる性能競争から脱却し、ビジネス現場での「実用性」と「カスタマイズ」を最優先する戦略を鮮明にしています。

目玉の「Nova Forge」は、学習の初期段階から独自データを注入できる点が画期的です。既存モデルの微調整で起きがちな知識の消失を防ぎつつ、ゼロからの開発より低コストで、自社ビジネスに特化した「専門家モデル」を構築できます。

既にRedditが導入し、過去の投稿データを学習させた自社専用モデルを開発しました。汎用モデルでは理解が難しいコミュニティ特有の文脈やルールをAIに習得させ、コンテンツ管理の自動化と精度向上という実利を得ています。

同時発表の「Nova」モデル群は、高速な「Lite」や複雑な推論が得意な「Pro」など4種です。これらは他社とのベンチマーク競争よりも、コスト効率やエージェント機能としての使いやすさに主眼を置いた設計となっています。

AWS幹部は「ベンチマークは現実を反映していない」とし、数値上の性能より企業が制御可能なインフラとしての価値を強調します。AI開発の民主化を通じて顧客をエコシステムに定着させ、クラウド市場での優位性を盤石にする狙いです。

出典：WIRED | TechCrunch | VentureBeat | The Verge | WIRED

NVIDIAとAWSがインフラ統合、AIチップ連携を強化

2025年12月02日 NVIDIA Amazon AWS 生産性検索 AI導入エンジニア推論半導体 GPU ハードウェアインフラクラウドデータセンターセキュリティロボティクス提携 Jensen Huang

次世代チップとインフラの融合

AWS次世代チップTrainium4にNVLinkを統合

Blackwell搭載GPUをAWSで提供拡大

両社技術の融合で計算性能と開発速度を最大化

AI産業革命に向けた計算ファブリックを共同構築

ソフトウェア高速化とデータ主権

Amazon BedrockでNemotronモデル利用可能

OpenSearch検索がGPUで最大10倍高速化

データ主権を守るAWS AI Factories発表

ロボティクス向けCosmosモデルをAWSで提供

詳細を見る

NVIDIAとAmazon Web Services（AWS）は2025年12月2日、ラスベガスで開催中の「AWS re:Invent」において、戦略的パートナーシップの大幅な拡大を発表しました。この提携により、AWSの次世代AIチップ「Trainium4」とNVIDIAのインターコネクト技術「NVLink Fusion」が統合され、クラウドインフラの性能が飛躍的に向上します。両社はハードウェアだけでなく、ソフトウェアやロボティクス分野でも連携を深め、企業のAI導入を強力に支援します。

最大の目玉は、NVIDIAのスケールアップ技術とAWSのカスタムシリコンの融合です。AWSは「NVLink Fusion」を採用し、自社の推論・学習用チップ「Trainium4」やCPUと組み合わせます。これにより、大規模AIモデルの学習や推論のボトルネックを解消し、市場投入を加速します。NVIDIAのジェンスン・フアンCEOは、この動きを「AI産業革命のための計算ファブリックの創造」と位置づけています。

データセキュリティと規制順守を重視する企業向けに、「AWS AI Factories」も発表されました。これは、NVIDIAの最新GPU「Blackwell」アーキテクチャを搭載したインフラを、顧客自身のデータセンター内に配備し、AWSが運用管理を行うサービスです。これにより、企業は機密データの主権（ソブリンAI）を維持しながら、世界最高峰のAI計算能力を活用することが可能になります。

開発者の生産性を高めるソフトウェア統合も進みます。NVIDIAのオープンモデル「Nemotron」が「Amazon Bedrock」に統合され、即座に利用可能になりました。「Amazon OpenSearch Service」ではGPU活用のベクトル検索が導入され、最大10倍の高速化を実現しています。さらに、ロボティクス開発を支援する物理AIモデル「NVIDIA Cosmos」もAWS上で利用可能となりました。

出典：NVIDIA公式

Vercel上でAWSデータベースが即時利用可能に

2025年12月01日 Vercel Amazon AWS エンジニアインフラ認証提携

AWSとの提携拡大

12月15日よりMarketplaceで提供

AuroraやDynamoDBが対象

ダッシュボードから直接構築が可能

開発スピードの加速

環境変数や認証情報を自動管理

インフラ設定不要で開発に集中

数分で本番環境への展開を実現

生成AI「v0」との連携

要件定義だけでDBを自動生成

スキーマ作成からデータ投入まで完結

詳細を見る

VercelはAWSとの提携を強化し、2025年12月15日よりVercel MarketplaceにてAWSの主要データベースサービスを提供開始します。これにより、開発者はインフラの複雑な設定を行うことなく、迅速にスケーラブルなアプリを構築できるようになります。

対象となるのはAurora PostgreSQL、Amazon DynamoDB、Aurora DSQLの3種です。Vercelのダッシュボードからワンクリックでデータベースを作成でき、面倒な接続設定や環境変数の管理はプラットフォームが自動的に行います。

生成AIツール「v0」との連携も目玉の一つです。自然言語でアプリを記述するだけで、v0が最適なAWSデータベースを自動的にプロビジョニングし、スキーマ設計や初期データの投入まで完了させるため、即座に開発に着手できます。

新規AWSユーザーには100ドルのクレジット付きの無料プランも用意されます。Vercelが掲げる「自動運転インフラ」のビジョンに基づき、世界クラスのAWS インフラを摩擦なく利用できる環境が整いました。

出典：vercel.com

AI攻撃に対抗、クラウド防御をリアルタイム検知へ刷新

2025年12月01日 Amazon AWS 経営者パッチクラウドセキュリティ投資

AI武装する脅威の現実

攻撃は数ミリ秒で実行され甚大な被害

従来型のバッチ処理では防御不能

組織の55%がクラウド侵害を経験

秒速の防御システム

CrowdStrikeがリアルタイム検知発表

対応時間を15分から数秒へ圧縮

AIが自動トリアージし負荷軽減

リーダーへの提言

可視化ギャップの解消が急務

パッチサイクルを72時間以内へ

詳細を見る

CrowdStrikeは12月1日、AWS re:Inventにて、ハイブリッドクラウド向けのリアルタイム検知・対応機能を発表しました。AIにより高速化したサイバー攻撃に対抗するため、従来のバッチ処理型セキュリティを刷新し、攻撃検知から対応までの時間を数秒レベルに短縮します。AIを悪用した脅威が急増する中、企業の防御態勢を根本から見直す新たな業界標準となりそうです。

AIを武器化した攻撃者は、パッチ公開からわずか72時間以内に弱点を突く手法を開発しています。従来のセキュリティツールはログ収集に15分程度の遅延があり、数ミリ秒で実行されるAI攻撃に対しては「検知＝事後処理」となってしまうのが実情です。

新機能はAmazonのAWS EventBridgeと連携し、イベントストリームを直接分析します。これにより、攻撃の予兆をリアルタイムで捉え、SOC（セキュリティ監視センター）チームが介入する前に、AIが自動で悪意ある通信を遮断・修復することが可能になりました。

CrowdStrike幹部は「リアルタイム検知のないCNAPP（クラウドネイティブ保護基盤）は時代遅れになる」と断言します。ハイブリッド環境の複雑化と攻撃の高度化が進む中、リアルタイム性は今後のセキュリティ投資における必須要件となるでしょう。

経営者やリーダーは、自社のセキュリティが「人間速度」か「機械速度」かを見極める必要があります。可視化できない死角をなくし、パッチ適用サイクルを短縮するなど、AI時代のスピード感に合わせた戦略の再構築が求められています。

出典：VentureBeat

AWS最大イベント開幕、自律型AIとインフラが焦点

2025年12月01日 Amazon AWS エンジニアハルシネーションインフラクラウドセキュリティ基盤モデル

AIとインフラの最新動向

ラスベガスで年次イベントが開幕

自律型AIやインフラに焦点

セキュリティ対策の新機能も公開

基調講演と視聴方法

CEOやCTOら5名の基調講演

公式サイトで無料ライブ配信

フォートナイト上でも視聴可能

詳細を見る

アマゾン・ウェブ・サービス（AWS）は2025年12月、年次最大イベント「re:Invent 2025」を米ラスベガスにて開催します。本イベントでは、昨年に引き続きAI技術が主要テーマとなり、特に「自律型AI（Agentic AI）」やクラウドインフラ、セキュリティの新機能に注目が集まっています。現地参加に加え、基調講演のオンライン配信も行われ、世界中のリーダーやエンジニアに向けた最新戦略が発表されます。

今年のre:Inventは、生成AIの次のフェーズとも言える自律型AIへのシフトを鮮明にしています。AWSは基盤モデルの拡充だけでなく、AIハルシネーション（幻覚）対策や新たなセキュリティサービスの提供を通じて、企業がAIを実務で安全に活用するための環境整備を加速させています。

注目の基調講演は12月2日から4日にかけて行われます。AWS CEOのマット・ガーマン氏による戦略発表を皮切りに、自律型AI担当VPのスワミ・シバスブラマニアン氏、Amazon.com CTOのワーナー・ボーゲルス氏らが登壇予定です。これらのセッションでは、今後の技術トレンドやAWSの長期的なビジョンが語られるため、見逃せません。

ユニークな試みとして、今年は人気ゲーム「フォートナイト」上でも基調講演のライブ視聴が可能になりました。従来の公式サイトでの配信に加え、新たな視聴体験を提供することで、より幅広い層へのリーチを狙っています。技術者だけでなく、ビジネスリーダーにとっても必須のイベントといえるでしょう。

出典：TechCrunch

AWSとVisa、AI代理購入のインフラ構築で提携

2025年12月01日 Amazon AWS エンジニアインフラセキュリティ提携エージェント MCP Intel

開発障壁を下げるインフラ提供

Visaの決済基盤をAWSで提供

AIによる代理購入の実装を加速

開発用設計図をリポジトリで公開

旅行や小売りなど実用例を提示

安全な連携を実現する技術

MCP互換で複数エージェントが連携

カード情報のトークン化で安全確保

複雑な決済インフラの標準化を推進

詳細を見る

AWSとVisaは2025年12月1日、急速に拡大する「エージェンティック・コマース（AI代理購入）」の分野で戦略的提携を発表しました。この提携により、企業はAIエージェントに安全な決済機能を迅速に組み込めるようになり、複雑な商取引の自動化が加速します。

具体的には、AWS Marketplaceに「Visa Intelligence Commerce platform」が掲載され、開発者は容易にアクセス可能となります。さらに両社は、旅行予約やB2B決済などの開発用ブループリント（設計図）を「Amazon Bedrock AgentCore」リポジトリにて公開する予定です。

特筆すべきは、これらのツールがMCP（Model Context Protocol）と互換性を持つ点です。これにより、異なる機能を持つ複数のエージェントがスムーズに連携し、複雑なタスクを完遂できるようになります。また、カード情報のトークン化により、高度なセキュリティも担保されます。

これまでAIによる商取引は決済プロトコルの乱立により、「断片化した西部開拓時代」の状態にありました。今回の提携は、信頼性の高い標準インフラを提供することで、開発障壁を劇的に下げ、AIが自律的に経済活動を行う未来を大きく引き寄せるものです。

出典：VentureBeat

AWS、米政府AIインフラに500億ドル投資

2025年11月24日 Google OpenAI Anthropic Amazon Claude AWS AI活用インフラクラウドデータセンターセキュリティ米国創薬投資

巨額投資とインフラ強化

米政府専用に500億ドルを投資

1.3GWの計算能力を追加へ

2026年にデータセンター着工予定

提供サービスと目的

SageMakerやBedrockを拡充

AnthropicのClaudeも利用可能

創薬やサイバー防衛を加速

激化する政府市場競争

AWSは機密領域で長年の実績

OpenAIやGoogleも安価に攻勢

AI時代の米国の覇権を後押し

詳細を見る

Amazon Web Services（AWS）は24日、米国政府機関向けに特化したAIインフラ構築のため、500億ドル（約7.5兆円）を投資すると発表しました。この巨額投資により、連邦政府機関が高度なAI能力を迅速かつ安全に活用できる環境を整備します。

計画では2026年にデータセンター建設に着手し、新たに1.3ギガワット相当の計算能力を追加する予定です。これにより、政府機関はAmazon SageMakerやBedrockに加え、AnthropicのClaudeといった最新AIモデルへのアクセスが大幅に拡大します。

AWSのマット・ガーマンCEOは、この投資が政府機関のスーパーコンピューティング活用を根本から変革すると強調しています。技術的な障壁を取り除くことで、サイバーセキュリティ対策や創薬など、国家の重要ミッションにおけるAI活用が加速する見通しです。

AWSは2011年から政府向けクラウドを手掛け、機密情報を扱う「Top Secret」リージョンなどを運用してきた実績があります。今回の投資は、セキュリティ要件の厳しい政府機関に対し、より堅牢で高性能なAI基盤を提供するという決意の表れです。

一方、OpenAIやGoogleも政府向けAIサービスの提供を強化しており、一部では年間1ドル未満での提供を行うなど競争が激化しています。AWSの巨額投資は、こうした競合に対抗し、AI時代における米国のリーダーシップを支える重要な一手となります。

出典：TechCrunch

Cloudflare大規模障害、設定ミスでChatGPT等停止

2025年11月18日 Cloudflare ChatGPT AWS エンジニア経営者リスク脆弱性インフラクラウド

世界規模の影響

XやChatGPTが利用不能

広範囲でWebサービス停止

原因は内部エラー

攻撃ではなく設定ファイル超過

脅威管理システムの潜在バグ

自動生成ファイルの肥大化

復旧と教訓

修正完了し現在は復旧済み

クラウド依存のリスク露呈

詳細を見る

11月18日朝、Cloudflareの大規模障害により、XやChatGPTを含む主要なWebサービスが一時的に利用不能となりました。原因は設定ファイルの不具合によるもので、外部からのサイバー攻撃ではないことが公式に確認されています。

この障害は、UberやSpotify、さらには障害状況を追跡するDowndetectorに至るまで、広範囲なサービスに影響を及ぼしました。多くのサイトでエラーメッセージが表示され、グローバルな業務や日常利用に大きな混乱が生じました。

同社CTOによると、脅威トラフィック管理用の自動生成ファイルが想定サイズを超過したことが引き金でした。これにより、ボット対策機能の基盤システムに潜在していたバグが誘発され、システム全体のクラッシュに至ったのです。

AWSやAzureでも最近同様の障害が発生しており、クラウドインフラの脆弱性が改めて浮き彫りになりました。経営者やエンジニアにとって、特定のプラットフォームへの過度な依存リスクを見直す重要な契機となります。

出典：The Verge

OpenAI、ガートナーの生成AI分野で「新興リーダー」に

2025年11月17日 Google OpenAI マイクロソフト ChatGPT AWS AI導入インフラプライバシー投資

ガートナー社の最新評価

生成AI分野の新興リーダーに選出

Google、AWS、Microsoftも同カテゴリ

企業のAI導入の進展を反映

企業導入の急拡大

導入企業数は100万社を突破

ChatGPT Enterpriseは前年比9倍の成長

週間アクティブユーザー8億人

次世代AIへの展望

AIが企業インフラの中核へ

より協調的で有能なAIに進化

詳細を見る

OpenAIは2025年11月17日、大手調査会社ガートナーから「2025年版生成AIモデルプロバイダーに関するイノベーションガイド」において「新興リーダー（Emerging Leader）」の一社に選出されたと発表しました。この評価は、100万社を超える企業が同社のAIを安全かつ大規模に導入している実績を反映したものです。AIは今や、企業の中核インフラとなりつつあります。

OpenAIの企業向け事業は驚異的な成長を遂げています。導入企業は100万社を突破し、歴史上最も速く成長するAIビジネスプラットフォームとなりました。特に「ChatGPT Enterprise」の契約数は前年比9倍に急増。背景には、8億人を超える週間アクティブユーザーが既にChatGPTに習熟しており、企業での試験導入や投資対効果（ROI）の達成が迅速に進む点があります。

「AIはもはや実験段階ではない」。AmgenやCisco、Morgan Stanleyといった顧客企業からは、AIが業務の進め方を根本から変革し、企業インフラの基幹部分を担う存在になっているとの声が寄せられています。従業員が日常的に使うツールとしてChatGPTを求める声が、この流れを力強く後押ししているのです。

企業のAI導入を支えるため、OpenAIは安全性とガバナンスに重点的に投資してきました。プライバシー管理、データの保存場所を指定できるデータレジデンシー、利用状況の監視、そしてモデルの評価といった機能の強化により、企業が安心してAIを導入できる環境を整備しています。

今回のガートナーによる評価は、あくまで序章に過ぎないとOpenAIは見ています。次世代のAIシステムは、より協調的で有能になり、企業のオペレーションにさらに深く統合されていくでしょう。同社は今後も、あらゆる組織がAIをアイデアから測定可能なインパクトへと変える支援を続ける方針です。

出典：OpenAI公式

AWS Kiro正式版、仕様準拠テストでコード品質向上へ

2025年11月17日 Claude AWS 生産性エンジニア品質保証コーディングスタートアップエージェント

Kiro正式版の主な特徴

仕様駆動開発でコードの堅牢性を向上

プロパティベーステストで仕様を自動検証

CLI対応でターミナルから直接操作

スタートアップ向けに無料クレジット提供

開発体験を変える新機能

数百のシナリオでエッジケースを自動検出

カスタムエージェントで組織の開発を特化

チェックポイント機能で安全な試行錯誤が可能

最適なLLMを自動選択し高精度を実現

詳細を見る

アマゾン・ウェブ・サービス（AWS）は2025年11月17日、AIコーディングエージェント「Kiro」の一般提供（GA）を開始しました。コードが仕様通りに動作するかを自動検証する「プロパティベーステスト」や、コマンドラインから操作できる「Kiro CLI」などの新機能を搭載し、コードの信頼性を高め、開発者の生産性向上を支援します。

Kiroの最大の特徴は「仕様駆動開発」を重視している点です。開発者のアイデアを明確な仕様に落とし込み、それに沿ってコーディングを進めることで、AIが生成するコードの品質を高めます。これにより、単にコードを書く速さだけでなく、長期的な保守性や堅牢性も確保できるとAWSは説明しています。

新機能の「プロパティベーステスト」は、コードの品質保証において画期的です。仕様書からコードが満たすべき特性をAIが自動で抽出し、人間が想定しきれないエッジケースを含む数百ものテストシナリオを生成・実行します。これにより、AIがテストをごまかすといった問題を回避し、意図通りの動作を確実にします。

もう一つの新機能「Kiro CLI」は、開発者が普段利用するターミナルから直接Kiroを操作できるようにするものです。これにより、IDEとターミナルの行き来が不要になり、作業に集中できます。また、バックエンド専門など、組織のコードベースに合わせたカスタムエージェントの構築も可能になります。

AIコーディングエージェント市場は競争が激化していますが、AWSはKiroの「構造化されたアプローチ」と「仕様への忠実性」で差別化を図ります。Kiroは特定のLLMに依存せず、タスクに応じてClaude 4.5など最適なモデルを自動で選択する柔軟性も備えており、高い精度を維持します。

出典：VentureBeat

Vercel、脱ベンダーロックインで開発者の自由を担保

2025年11月10日 OpenAI Vercel Cloudflare AWS 生産性エコシステムエンジニアインフラクラウド

脱ベンダーロックイン戦略

特定クラウドへの依存を回避

Vercelではなくフレームワークに準拠

コードのポータビリティを最大化

FDIがもたらす可搬性

Next.jsアプリの7割はVercel外

ローカル開発は標準ツールで完結

主要クラウドがNext.jsをサポート

標準技術の積極採用

DBは標準プロトコル採用

AI GatewayはOpenAI API互換

詳細を見る

Webフロントエンド開発プラットフォームを提供するVercelは11月10日、ベンダーロックインを回避する「アンチ・ベンダーロックイン・クラウド」としての戦略を公式ブログで発表しました。開発者が特定のクラウド事業者に縛られることなく、コードのポータビリティ（可搬性）を最大限に確保できる「Framework-Defined Infrastructure (FDI)」という概念を提唱し、技術選択の自由度を高める狙いです。

ベンダーロックインとは、AWS LambdaやCloudflare Workersのような特定ベンダー独自のサービスに依存することで、他プラットフォームへの移行が困難になる状態を指します。Vercelはこれに対し、開発者がVercel独自のAPIではなく、Next.jsなどのフレームワーク規約に準拠してコードを書けば、必要なインフラが自動構築されるFDIのアプローチを推進します。

このアプローチの大きな利点は、開発体験の向上です。ローカルでの開発時に、ベンダー固有の複雑なシミュレーターは必要ありません。Next.jsであれば「next dev」といった標準的な開発サーバーをそのまま利用でき、ローカル環境と本番環境の差異を最小限に抑えられます。これにより、開発の生産性が大きく向上します。

Vercelの主張を裏付けるように、同社が開発を主導するNext.jsのアプリケーションの約70%がVercel以外の環境で稼働しているというデータも公開されました。WalmartやNikeといった大企業も自社インフラ上でNext.jsを大規模に運用しており、そのポータビリティの高さが実証されています。

さらにVercelは、エコシステム全体のオープン性を担保するため、Next.jsとプラットフォーム間の連携仕様を「Build Adapters」APIとして標準化しています。これにより、NetlifyやAWS Amplifyといった競合プラットフォームもVercelと対等な条件でNext.jsをサポートでき、健全な競争環境を促進します。

Vercelの哲学は、データベースやAIサービスにも一貫しています。データベース接続にはPostgresやRedisといった標準プロトコルを、AI GatewayにはOpenAI API互換のインターフェースを採用。これにより、開発者は業界標準のツールを自由に組み合わせ、最適なシステムを構築できます。

Vercelは、オープンな技術とポータビリティを確保することで開発者の信頼を獲得し、エコシステム全体を拡大させることが自社の持続的な成長につながると考えています。ユーザーに「縛られるからではなく、選びたいから」使われ続けるプラットフォームを目指す姿勢を明確にしました。

出典：vercel.com

Google、GeminiにRAG統合複雑な開発を不要に

2025年11月06日 Google OpenAI Gemini AWS 生産性検索アシスタントエンジニア専門家経営者インフラ RAG

File Searchの主な特徴

複雑なRAGパイプラインを完全自動化

ストレージや埋め込み生成は実質無料

最新モデルによる高精度なベクトル検索

回答の根拠を示す引用機能を内蔵

開発者・企業への提供価値

開発工数と運用コストを大幅削減

PDFやDOCXなど多様なファイルに対応

競合よりシンプルな統合体験を提供

数時間かかった作業が数秒に短縮した事例も

詳細を見る

Googleは、同社の生成AI「Gemini」のAPIに、フルマネージドの検索拡張生成（RAG）システム「File Search Tool」を統合したと発表しました。この新機能は、企業が自社データに基づいた高精度なAIを開発する際に直面する、複雑なRAGパイプラインの構築・管理作業を完全に自動化します。これにより、開発者はインフラ構築から解放され、アプリケーション開発に集中できるようになります。

従来、RAGシステムを構築するには、ファイルストレージの準備、適切なチャンキング（分割）戦略の策定、埋め込みモデルの選定、ベクトルデータベースの契約と管理など、専門的な知識と多大な工数が必要でした。File Searchは、これら一連の複雑なプロセスをすべて抽象化し、開発者にシンプルな統合体験を提供します。

このツールは、Googleの最新かつ最高性能を誇る「Gemini Embedding model」を搭載しています。ベクトル検索技術を用いて、ユーザーの質問の意図や文脈を深く理解し、関連文書から的確な情報を抽出します。さらに、生成された回答には自動で引用元が付与されるため、情報の検証が容易になり、AIの信頼性向上にも貢献します。

特に注目すべきは、その画期的な料金体系です。クエリ（検索）実行時のストレージ利用と埋め込み生成は無料とし、課金はファイルを初めてインデックスする際の埋め込み作成時に限定されます。これにより、RAGの導入・運用コストが大幅に削減され、あらゆる規模の企業が利用しやすくなっています。

OpenAIやAWSといった競合他社も同様のRAG支援ツールを提供していますが、多くの専門家はGoogleのFile SearchがRAGパイプラインの「一部」ではなく「すべて」を抽象化する点で一線を画すと指摘しています。これにより、開発者はより少ない労力で、高性能なRAGアプリケーションを迅速に市場投入できる可能性があります。

先行導入したAIゲーム生成プラットフォーム「Beam」では、既に大きな成果を上げています。数千に及ぶテンプレートデータの中から必要な情報を瞬時に検索し、これまで数時間を要していたプロトタイピングが数分で完了するようになったと報告されており、生産性向上の好例と言えるでしょう。

File Searchの登場は、高精度な社内ナレッジアシスタントやインテリジェントな顧客サポートボットなど、企業のデータ活用を前提としたAIアプリケーション開発のハードルを大きく下げるものです。自社の競争力強化を目指す経営者や開発者にとって、見逃せない選択肢となりそうです。

出典：Google公式 | VentureBeat

グーグル、AI開発基盤を刷新観測・統制を強化

2025年11月05日 Google OpenAI マイクロソフト AWS エコシステムエンジニアプロンプトインジェクションクラウドデプロイエージェントプロンプトコンテキスト Arm

エージェント開発を高速化

最先端のコンテキスト管理

自己修復機能付きプラグイン提供

開発キットでGo言語を追加サポート

ワンクリックでの本番環境移行

本番運用のガバナンス強化

新観測ダッシュボードで稼働監視

エージェントIDによる監査証跡の明確化

プロンプト注入などを防ぐ新機能

パフォーマンスを事前評価する機能

詳細を見る

Google Cloudは2025年11月5日、AI開発プラットフォーム「Vertex AI」の中核をなす「Agent Builder」の大規模アップデートを発表しました。この更新は、企業がAIエージェントの構想から設計、展開までをより迅速かつ安全に行えるようにするものです。主な特徴は、開発プロセスを加速する新ツール群と、本番運用に不可欠なガバナンス機能を大幅に強化した点にあります。

開発の高速化は、今回のアップデートの大きな柱です。最先端のコンテキスト管理レイヤーや、失敗したタスクを自己修復する事前構築済みプラグインを導入。開発キット（ADK）はPythonやJavaに加え、新たにGo言語をサポートしました。さらに、コマンド一つでローカル環境からテスト環境へ移行できる「ワンクリックデプロイ」機能も提供します。

同時に、企業利用で必須となるガバナンス機能も大幅に拡充されました。新たに導入された観測可能性ダッシュボードでは、トークン消費量やエラー率などを本番環境で追跡できます。また、エージェントに固有のIDを付与して監査証跡を明確にする機能や、プロンプトインジェクションを防ぐ「Model Armor」も搭載されました。

この観測可能性ダッシュボードは、開発者にとって強力なツールとなるでしょう。本番環境で稼働するエージェントのトークン消費量、エラー率、レイテンシー（遅延）を可視化し、問題が発生した際の原因特定と再現を容易にします。これにより、クラウドベースでの本番監視が格段に効率化され、安定した運用が可能になります。

Google CloudがAgent Builderの強化を急ぐ背景には、熾烈な開発者獲得競争があります。OpenAIの「AgentKit」やマイクロソフトの「Azure AI Foundry」、AWSの「Bedrock」など、競合他社もAIエージェント開発基盤の機能拡充を競っています。今回のアップデートは、自社エコシステム内に開発者を留め、競争優位性を確保するための戦略的な一手と言えるでしょう。

出典：VentureBeat

OpenAI、AWSと380億ドル契約 AI開発基盤を強化

2025年11月03日 OpenAI NVIDIA マイクロソフト Amazon ChatGPT AWS 専門家投資家 GPU インフラクラウドサム・アルトマン投資提携バブル

380億ドルの戦略的提携

7年間の大規模クラウド契約

数十万個のNVIDIA製GPUを提供

次世代モデルの開発・運用を加速

2026年末までのインフラ展開完了目標

AI業界の地殻変動

OpenAIのマルチクラウド戦略が鮮明に

マイクロソフトとの独占的関係からの変化

激化するAI計算資源の確保競争

発表を受けAmazon株価は史上最高値を更新

詳細を見る

生成AI開発をリードするOpenAIは2025年11月3日、アマゾン・ウェブ・サービス（AWS）と複数年にわたる戦略的パートナーシップを締結したと発表しました。契約総額は380億ドル（約5.7兆円）に上り、OpenAIはAWSの高性能なクラウドインフラを利用して、次世代AIモデルの開発と運用を加速させます。これはAI業界の計算資源確保競争を象徴する動きです。

この7年契約に基づき、AWSはOpenAIに対し、NVIDIA製の最新GPU「GB200」や「GB300」を数十万個規模で提供します。Amazon EC2 UltraServers上に構築されるこのインフラは、数千万のCPUにも拡張可能で、ChatGPTの応答生成から次世代モデルのトレーニングまで、幅広いAIワークロードを効率的に処理するよう設計されています。

今回の提携は、OpenAIがマイクロソフトのAzureに依存する体制から、マルチクラウド戦略へ移行する姿勢を鮮明にするものです。OpenAIのサム・アルトマンCEOは「最先端AIのスケーリングには、大規模で信頼性の高い計算能力が不可欠だ」と述べ、AWSとの連携がAIの普及を後押しするとの期待を示しました。

一方、AWSにとってもこの契約は、急成長するAIインフラ市場での優位性を確固たるものにする大きな一歩です。長年のライバルであるマイクロソフトの牙城を崩す一手となり、市場はこの提携を好感。発表を受けてAmazonの株価は史上最高値を更新し、投資家の高い期待が示されました。

AI業界では、モデルの性能向上に伴い、計算能力の需要が爆発的に増加しています。今回の巨額契約は、AI開発の前提となるインフラ確保競争の激しさを物語っています。一方で、一部の専門家からは、実用化や収益化の道筋が不透明な中での巨額投資が続く現状に、「AIバブル」への懸念も指摘されています。

出典：OpenAI公式 | WIRED | Ars Technica | TechCrunch | The Verge

AI特需でAWSが急加速、前年比20%の増収

2025年10月31日 Google OpenAI Anthropic Amazon Perplexity オラクル AWS 検索インフラクラウド開発ツール投資提携 Cursor

好調な第3四半期決算

前年同期比20%の増収

過去3年で最も力強い成長

営業利益は114億ドルに増加

ウォール街の市場予想を上回る

AIが牽引するインフラ需要

AI業界の旺盛な需要が要因

過去12ヶ月で3.8GWの容量追加

PerplexityなどAI企業と提携

競合もAI関連で大型契約を締結

詳細を見る

アマゾン・ウェブ・サービス（AWS）が10月31日に発表した2025年第3四半期決算は、AI業界からの旺盛な需要を追い風に、ウォール街の予想を上回る結果となりました。売上高は前年同期比で20.2%増加し、過去3年間で最も力強い成長率を記録。クラウドインフラ市場における同社の競争力の高さと、AIがもたらす巨大なビジネス機会を明確に示しています。

第3四半期までの累計売上高は331億ドルに達し、同事業部門の営業利益は前年同期の104億ドルから114億ドルへと増加しました。アンディ・ジャシーCEOは「AWSは2022年以来見られなかったペースで成長している」と述べ、業績の再加速を強調。堅調な収益性が、同社の積極的な投資を支える基盤となっています。

この急成長を牽引しているのは、言うまでもなくAIインフラへの爆発的な需要です。ジャシーCEOは「AIとコアインフラの両方で強い需要が見られる」と指摘。AWSは需要に応えるため、過去12ヶ月で3.8ギガワット以上の処理能力を追加し、ニュージーランドに新たなインフラリージョンを開設するなど、積極的な設備投資を続けています。

顧客獲得も順調です。第3四半期には、AI検索エンジンのPerplexityが法人向け製品の基盤としてAWSを採用したほか、AIを活用した開発ツールを提供するCursorとも提携しました。これは、最先端のAI企業がAWSのインフラを信頼し、選択していることの証左と言えるでしょう。

クラウド市場全体がAIによって活況を呈しています。競合他社も、OpenAIとOracle、GoogleとAnthropicがそれぞれ数十億から数千億ドル規模の巨大契約を結ぶなど、インフラ需要の獲得競争は激化。一部には市場の過熱を懸念する声もありますが、クラウド各社は好機を逃すまいと攻勢を強めています。

興味深いことに、この好決算はAmazonが法人従業員14,000人の削減を発表したわずか2日後のことです。これは、同社が不採算部門を整理し、経営資源を成長ドライバーであるAIとAWSに集中させるという、明確な戦略的判断を下したことを示唆しており、今後の投資動向が注目されます。

出典：TechCrunch

AIに「記憶」を、スタートアップMem0が36億円調達

2025年10月28日 OpenAI GitHub AWS エンジニア投資家インフラスタートアップ投資

AIの『記憶』問題を解決

対話を忘れるLLMの課題を解決

アプリ間で記憶を共有するパスポート

モデル非依存で中立的な基盤を提供

個別最適化されたAI体験を実現

36億円調達と開発者の支持

シリーズAで総額2,400万ドルを調達

YコンビネータやGitHubファンドも参加

GitHubスター4万件超の圧倒的支持

AWSの新Agent SDKで採用

詳細を見る

AI向け「記憶層」を開発するスタートアップMem0が、シリーズAで2,000万ドルを調達、総額は2,400万ドル（約36億円）に達しました。大規模言語モデル（LLM）が過去の対話を記憶できない根本課題を解決し、AIとの対話を持続的で人間らしいものに変えることを目指します。Yコンビネータなどが支援しています。

なぜ「記憶」が重要なのでしょうか。現在のAIは対話が途切れると文脈を忘れてしまい、継続的な体験を提供できません。Mem0はアプリ間で記憶を持ち運べる「メモリパスポート」を開発。AIがユーザーの好みや過去のやり取りを記憶し、真にパーソナライズされた応対を可能にします。

Mem0の技術は開発者から圧倒的な支持を得ています。オープンソースAPIはGitHubで4万1,000以上のスターを獲得し、Pythonパッケージは1,300万回以上ダウンロード。AWSの新しいAgent SDKで唯一のメモリプロバイダーに採用されるなど、実用性も証明済みです。

OpenAIなども記憶機能開発を進めますが、特定プラットフォームに依存する可能性があります。対照的にMem0は、あらゆるモデルと連携可能なオープンで中立的な基盤を提供。開発者はベンダーに縛られず、自由度の高いアプリケーションを構築できます。同社は自らを「記憶のためのPlaid」と位置づけています。

今回の調達を主導したBasis Set Venturesは「記憶はAIの未来の基盤」と強調し、Mem0がAIインフラの最重要課題に取り組んでいると高く評価。GitHubファンドや著名な個人投資家も参加しており、その将来性への期待の高さがうかがえます。資金はさらなる製品開発に充てられます。

出典：TechCrunch

Vertex AI強化、独自AIモデル開発をGoogleが支援

2025年10月27日 Google Gemini AWS 検索ファインチューニング半導体 GPU ハードウェア RAG

新サービス「Vertex AI Training」

企業独自の大規模モデル開発

マネージドSlurm環境を提供

数百〜数千チップの長期ジョブ

ハードウェア障害から自動復旧

競合との差別化と提供価値

AWS、CoreWeaveに対抗

多様なチップへのアクセス

Gemini開発の専門知識を活用

GPU調達の課題を解決

詳細を見る

Google Cloudが、企業による独自の大規模AIモデル開発を支援する新サービス「Vertex AI Training」を発表しました。AWSや専門プロバイダーのCoreWeaveなどに対抗するもので、マネージドSlurm環境を提供し、大規模な計算資源へのアクセスを容易にします。

このサービスは、単純なファインチューニングやRAG（検索拡張生成）の利用者を対象としていません。ゼロからモデルを構築したり、大幅なカスタマイズをしたりする、数百から数千のチップを要する大規模なトレーニングジョブに焦点を当てています。

最大の特徴は、マネージドSlurm環境にあります。これにより、ジョブのスケジューリングやハードウェア障害発生時の自動復旧が実現します。ダウンタイムを最小限に抑え、大規模クラスタでの効率的なトレーニングを可能にするのです。

なぜ今、このようなサービスが求められるのでしょうか。背景には、企業がモデル開発に必要なGPUを確保する際の熾烈な競争があります。Vertex AI Trainingは、単なる計算資源のレンタルではなく、包括的な開発環境を提供することで競合との差別化を図ります。

Googleは、多様なチップへのアクセスや、自社のGeminiモデル開発で培った専門知識も提供価値として挙げています。既にシンガポールのAI Singaporeなどが早期顧客として名を連ねており、専門的なモデル開発の需要の高まりを示しています。

出典：VentureBeat

Amazon、AIが最適商品を推薦する新機能発表

2025年10月23日 Google Amazon AWS 検索 AI活用チャットボット気象機械学習行動データ米国

新機能『Help me decide』

ユーザーの行動履歴をAIが分析

類似商品から最適な一品を推薦

AIが選定理由も要約して提示

米国で先行して提供開始

多様な選択肢を提案

閲覧・検索・購入履歴を基に判断

安価な代替案『バジェットピック』

高価な上位版『アップグレード』

AWSの生成AI技術をフル活用

詳細を見る

Amazonは10月23日、米国で新たなAIショッピング機能「Help me decide」を発表しました。この機能は、ユーザーの閲覧・購入履歴といった行動データをAIが分析し、多数の類似商品の中から最適な一品を推薦するものです。購買時の迷いを解消し、意思決定を支援することで、顧客体験の向上と売上拡大を狙います。アプリやモバイルサイトで展開されます。

新機能は、ユーザーが複数の類似商品を閲覧した後に表示される「Help me decide」ボタンを押すことで作動します。例えば、キャンプ用テントを探しているユーザーが過去に大人用と子供用の寝袋を閲覧していれば、AIは家族利用を想定し、4人用の全天候型テントを提案するなど、高度なパーソナライズを実現します。

このツールの特徴は、単に商品を推薦するだけでなく、「なぜその商品が最適か」という理由をAIが要約して提示する点にあります。これにより、ユーザーは納得感を持って購入を決められます。さらに、手頃な価格の「バジェットピック」や、より高機能な「アップグレードオプション」も併せて提案し、多様なニーズに応えます。

この機能の背景には、Amazon Web Services（AWS）の強力な技術基盤があります。大規模言語モデル（LLM）に加え、生成AIアプリサービス「Bedrock」、検索サービス「OpenSearch」、機械学習プラットフォーム「SageMaker」などを活用し、複雑なユーザーの意図を汲み取っています。

Amazonはこれまでも、AIチャットボット「Rufus」やAIによるレビュー要約など、購買体験にAIを積極的に導入してきました。今回の新機能は、その流れを加速させるものです。GoogleなどもAIショッピングツールの開発に注力しており、EコマースにおけるAI活用競争はますます激化しています。

出典：The Verge | TechCrunch

AWSのAI「Nova」、4大活用法で企業変革を加速

2025年10月15日 Amazon AWS 検索アシスタント広告 AI導入クリエイティブ業務効率カスタマーサービス推論コンテンツ動画ブランド不動産

主要4活用分野

高度なAI顧客サービス

高速なマルチモーダル検索

動画の自動理解・分析

クリエイティブ制作の自動化

導入による主な成果

推論コストを85倍削減

検索パフォーマンスが3倍向上

コンテンツ作成時間を30%短縮

動画監視の誤報を55%削減

詳細を見る

Amazon Web Services (AWS)は2025年10月15日、マルチモーダルAI「Amazon Nova」の企業向け4大活用事例を公開しました。顧客サービス、検索、動画分析、コンテンツ生成の各分野で、業務効率の向上やコスト削減、顧客満足度の向上に大きく貢献しています。本記事では、具体的な導入企業の実例を交え、Novaがもたらすビジネスインパクトを解説します。

第一に、カスタマーサービス分野ではAIが顧客対応を高度化します。Fortinet社はサポートアシスタントで推論コストを85倍削減。Infosys社はイベントでのリアルタイム翻訳や要約に活用し、参加者の体験価値を高めるなど、コスト削減と顧客満足度向上を両立しています。

第二に、企業内に散在する膨大なデータ検索もNovaが得意な領域です。Siemens社は検索性能を3倍に向上させ、業務効率を大幅に改善しました。不動産サービス大手CBRE社は、文書処理速度を75%高速化し、年間98,000人日以上の従業員時間削減を見込んでいます。

第三に、動画コンテンツの活用も進んでいます。Novaは動画を直接理解し、分析や要約が可能です。Accenture社は長編動画からハイライトを自動生成し、コストを10分の1に圧縮。Loka社は監視映像の分析で誤報を55%削減しつつ、97%以上の脅威検出率を維持しました。

第四に、広告・マーケティング分野ではコンテンツ制作を自動化し、期間を劇的に短縮します。大手広告代理店の電通は、Novaで広告制作を数週間から数日へと短縮。Quantiphi社は、ブランドの一貫性を保ちながらコンテンツ作成時間を約30%削減するサービスを開発しています。

これらの事例は、Amazon Novaが多様な業界で具体的なビジネス成果を生んでいることを示します。業務効率化やコスト削減はもちろん、新たな顧客体験の創出にも繋がります。自社の課題解決に向けAI導入を検討する企業にとって、Novaは強力な選択肢となるでしょう。

出典：AWS公式

AWS流、LLM分散学習クラスター構築・検証術

2025年10月15日 Meta Amazon AWS 生産性ネットワーク Llama エンジニア経営者ディープラーニングリスク GPU インフラ

分散学習の複雑な設定

高性能GPUインスタンスの精密設定

ネットワークとストレージの複雑性

バージョン不整合による性能劣化リスク

構築・検証の主要ステップ

DLCベースのDockerイメージ構築

EKSでのGPUクラスター起動

GPU・EFA等必須プラグイン導入

ヘルスチェックによる設定検証

サンプルジョブでの最終動作確認

詳細を見る

アマゾンウェブサービス（AWS）は、大規模言語モデル（LLM）の分散学習に不可欠なインフラ構築を効率化するため、Amazon EKSとAWS Deep Learning Containers（DLC）を用いたクラスターの構築・検証手順を公開しました。この体系的なアプローチは、複雑な設定ミスを防ぎ、開発チームがモデル性能の向上に集中できる環境を実現します。AI開発の生産性を高めたい経営者やエンジニアにとって、必見の内容と言えるでしょう。

最新のLLM開発では、Meta社のLlama 3が16,000基のGPUを使用したように、膨大な計算資源が求められます。しかし、高性能なGPUインスタンスは、ネットワークやストレージ、GPUの構成が極めて複雑です。わずかな設定ミスが性能の大幅な低下やエラーを招き、プロジェクトの遅延やコスト増大に直結する大きな課題となっています。

この課題に対し、AWSは解決策の核として「AWS Deep Learning Containers（DLC）」の活用を推奨しています。DLCは、CUDAやNCCLといった互換性が重要なライブラリ群を最適化した状態で提供するコンテナイメージです。これにより、バージョン不整合のリスクを根本から排除し、開発チームはインフラの細かな調整から解放され、開発を迅速に開始できます。

具体的な構築手順は、まずDLCを基盤にカスタムDockerイメージを作成することから始まります。次に、Amazon EKS（Elastic Kubernetes Service）を用いてGPU対応クラスターを起動。その後、GPUや高速ネットワーク（EFA）、ストレージ（FSx for Lustre）を連携させるための各種プラグインを導入し、計算、通信、データ保管が三位一体となった本番環境レベルの基盤を完成させます。

インフラ構築後の検証プロセスもまた、成功の鍵を握ります。GPUドライバーの確認、複数ノード間の通信テスト、そして小規模なサンプル学習ジョブの実行といった段階的なヘルスチェックが不可欠です。これにより、大規模な学習を開始する前に問題を特定し、高価なGPUリソースと時間の浪費を未然に防ぐことが可能になります。

この体系的な手法を導入することで、企業はインフラ管理の負担を大幅に軽減し、エンジニアをモデル開発という本来の価値創出業務に集中させることができます。結果として、AI開発の生産性と成功確率が向上し、市場における企業の競争力強化に大きく貢献するでしょう。

出典：AWS公式

SageMakerでScala開発、Almondカーネル導入法

2025年10月15日 Amazon AWS 生産性ワークフローエンジニア機械学習クラウド

課題と解決策

SageMakerのScala非対応

別環境による生産性の低下

Almondカーネルによる統合

既存Scala資産の有効活用

導入の主要ステップ

カスタムConda環境の作成

OpenJDKとCoursierの導入

Almondカーネルのインストール

カーネル設定ファイルの修正

詳細を見る

アマゾン・ウェブ・サービス（AWS）は、機械学習プラットフォーム「Amazon SageMaker Studio」でプログラミング言語Scalaを利用するための公式ガイドを公開しました。標準ではサポートされていないScala開発環境を、オープンソースの「Almondカーネル」を導入することで実現します。これにより、Apache SparkなどScalaベースのビッグデータ処理ワークフローをSageMaker上でシームレスに実行可能となり、生産性向上に貢献します。

これまでSageMaker StudioはPython中心の設計で、Scalaを主に使う開発者は別の開発環境を併用する必要がありました。この非効率な状況は、特にSparkで大規模なデータ処理を行う企業にとって、開発の遅延や生産性低下の要因となっていました。既存のScalaコード資産とSageMakerの機械学習機能を連携させる際の複雑さも課題でした。

今回の解決策の中核をなすのが、Jupyter環境にScalaを統合するAlmondカーネルです。インストールには、Scalaのライブラリ管理を自動化するCoursierを利用します。これにより、依存関係の競合を避け、安定した開発環境を効率的に構築できると説明しています。

具体的な導入手順は、カスタムConda環境を作成後、Java開発キット（OpenJDK）をインストールし、Coursier経由でAlmondカーネルを導入します。最後に、カーネルが正しいJavaパスを参照するよう設定ファイルを修正することで、セットアップは完了します。これにより、JupyterLabのランチャーからScalaノートブックを直接起動できるようになります。

導入後の運用では、JVMのバージョン互換性の確認が重要です。特にSparkは特定のJVMバージョンを要求するため、不整合は性能劣化や実行時エラーにつながる可能性があります。また、SageMakerの基本環境との競合を避けるため、カスタム環境を分離して管理することが安定稼働の鍵となります。

この統合により、Scala開発者は使い慣れた言語とツールでSageMakerの強力な機械学習機能やクラウドコンピューティング能力を最大限に活用できます。既存のScalaコード資産を活かしつつ、高度なMLワークフローの導入を加速させることが期待されるでしょう。

出典：AWS公式

AWS、AIエージェントの長期記憶術を詳解

2025年10月15日 Amazon AWS 検索アシスタントエンジニアエージェントベンチマーク

AgentCore長期記憶の仕組み

会話から重要情報を自動抽出

高い性能と実用性

最大95%のデータ圧縮率

約200ミリ秒の高速な情報検索

ベンチマークで実用的な正答率を証明

導入に向けたベストプラクティス

ユースケースに合う記憶戦略を選択

非同期処理を前提としたシステム設計が鍵

詳細を見る

Amazon Web Services (AWS) が、AIサービス「Amazon Bedrock」のエージェント機能「AgentCore」に搭載された長期記憶システムの詳細を公開しました。この技術は、AIエージェントがユーザーとの複数回にわたる対話内容を記憶・統合し、文脈に応じた、より人間らしい応答を生成することを可能にします。これにより、一過性のやり取りを超えた、継続的な関係構築の実現が期待されます。

AIエージェントが真に賢くなるには、単なる会話ログの保存では不十分です。人間のように、雑談から重要な情報（「私はベジタリアンです」など）を見極めて抽出し、矛盾なく知識を更新し続ける必要があります。AgentCoreの長期記憶は、こうした複雑な課題を解決するために設計された、高度な認知プロセスを模倣するシステムです。

記憶システムの核となるのが「抽出」と「統合」です。まず、大規模言語モデル（LLM）が会話を分析し、事実や知識、ユーザーの好みといった意味のある情報を自動で抽出します。開発者は、用途に応じて「セマンティック記憶」「要約記憶」「嗜好記憶」といった複数の戦略を選択、あるいは独自にカスタマイズすることが可能です。

次に「統合」プロセスでは、抽出された新しい情報が既存の記憶と照合されます。LLMが関連情報を評価し、情報の追加、更新、あるいは重複と判断した場合は何もしない（NO-OP）といったアクションを決定。これにより、記憶の一貫性を保ち、矛盾を解消しながら、常に最新の情報を維持します。

このシステムは性能面でも優れています。ベンチマークテストでは、会話履歴の元データと比較して最大95%という驚異的な圧縮率を達成。ストレージコストと処理負荷を大幅に削減します。また、記憶の検索応答時間は約200ミリ秒と高速で、大規模な運用でも応答性の高いユーザー体験を提供できます。

AgentCoreの長期記憶は、AIエージェント開発における大きな一歩と言えるでしょう。単に「覚える」だけでなく、文脈を「理解」し、時間と共に成長するエージェントの構築を可能にします。この技術は、顧客サポートからパーソナルアシスタントまで、あらゆる対話型AIの価値を飛躍的に高める可能性を秘めています。

出典：AWS公式

Salesforce、AWS活用でLLM運用コスト40%削減

2025年10月14日 Amazon Salesforce AWS 生産性推論ファインチューニング GPU インフラクラウドデプロイ

カスタムLLM運用の課題

数ヶ月かかるデプロイ作業

ピーク時を見越したGPU予約コスト

頻繁なリリースに伴う保守の複雑化

Bedrock導入による成果

デプロイ時間を30%短縮

運用コストを最大40%削減

サーバーレスによる自動スケール実現

導入成功のポイント

既存APIを維持するハイブリッド構成

コールドスタートへの対策実施

詳細を見る

クラウド大手のセールスフォースは、AWSのAIサービス「Amazon Bedrock」を導入し、自社でカスタマイズした大規模言語モデル（LLM）の運用を効率化しました。これにより、モデルのデプロイにかかる時間を30%短縮し、インフラコストを最大40%削減することに成功。AI開発の生産性向上とコスト最適化を両立した事例として注目されます。

同社はこれまで、ファインチューニングしたLLMを自社で運用していましたが、インフラの最適化や設定に数ヶ月を要し、運用負荷の高さが課題でした。また、ピーク時の需要に備えてGPUリソースを常に確保する必要があり、コストが嵩む一因となっていました。

そこで採用したのが、Bedrockの「カスタムモデルインポート」機能です。これにより、インフラ管理の大部分をAWSに任せ、チームはモデル開発やビジネスロジックに集中できるようになりました。既存の運用フローへの影響を最小限に抑え、スムーズな移行を実現しています。

移行の鍵は、既存システムとの後方互換性を保つハイブリッド構成です。アプリケーションからのリクエストをまずSageMakerのCPUコンテナで受け、前処理を行った後、GPUを要する推論処理のみをBedrockに転送。これにより、既存のAPIや監視ツールを変更することなく、サーバーレスの利点を享受できました。

導入後の効果は顕著です。インフラ選定などの複雑な作業が不要になり、モデルのデプロイ時間は30%短縮されました。コスト面では、従量課金制への移行により、特に開発・テスト環境など利用頻度に波がある場面で効果を発揮し、最大40%のコスト削減を達成しました。

一方で、大規模モデルでは「コールドスタート」と呼ばれる初回起動時の遅延が発生する点は注意が必要です。同社は、遅延が許容できない本番環境では、定期的にエンドポイントにアクセスして「ウォーム」状態を維持する対策を講じています。自社モデルがサポート対象かも事前に確認すべきです。

Salesforceの事例は、サーバーレスAIが本番環境のワークロードにも十分対応できることを示しています。特にトラフィックが変動するAIアプリケーションにおいて、コストと運用の両面で大きなメリットをもたらすでしょう。LLMの自社運用に課題を抱える企業にとって、有力な選択肢となりそうです。

出典：AWS公式

AWS、対話型AIで複雑なIoTデバイス管理を簡素化

2025年10月14日 Amazon AWS 生産性専門家プロンプトインジェクションインフラセキュリティ認証プロンプト

複雑化するIoT管理の課題

複数アプリでの管理が煩雑

専門知識を要する複雑な設定

デバイス状態の可視性の限界

Bedrock AgentCoreによる解決策

自然言語による対話型操作

サーバーレス構成でインフラ管理を不要に

Lambda関数で具体的タスクを実行

導入で得られる主なメリット

直感的な操作によるUX向上

管理の一元化による運用効率化

エンタープライズ級のセキュリティ

詳細を見る

アマゾンウェブサービス（AWS）が、IoTデバイス管理の複雑化という課題に対し、対話型AIで解決する新手法を公開しました。新サービス「Amazon Bedrock AgentCore」を活用し、自然言語での対話を通じてデバイスの状態確認や設定変更を可能にします。これにより、ユーザーは複数の管理画面を往来する手間から解放され、直感的な操作が実現します。

IoTデバイスの普及に伴い、その管理はますます複雑になっています。デバイスごとに異なるアプリケーションやUIを使い分ける必要があり、ユーザーの学習コストは増大。また、専門知識なしでは設定が難しく、デバイス全体の状況を把握することも困難でした。こうした「管理の断片化」が、IoTソリューション導入の大きな障壁となっています。

今回のソリューションは、こうした課題を統一された対話型インターフェースで解決します。ユーザーはチャット画面のようなUIを使い、「デバイスの状態を教えて」「Wi-Fi設定を変更して」といった日常会話の言葉で指示を出すだけ。複雑なメニュー操作は不要となり、専門家でなくても簡単にIoT環境を管理できます。

このシステムの核となるのが「Amazon Bedrock AgentCore」です。ユーザー認証にCognito、ビジネスロジック実行にAWS Lambda、データ保存にDynamoDBを利用するサーバーレス構成を採用。ユーザーからの自然言語リクエストはAgentCoreが解釈し、適切なLambda関数を呼び出すことで、迅速かつ安全な処理を実現します。

企業利用を想定し、セキュリティと性能も重視されています。ユーザー認証やアクセス制御はもちろん、通信やデータの暗号化、プロンプトインジェクション攻撃を防ぐGuardrails機能も搭載。また、Lambdaの自動スケーリング機能により、多数の同時リクエストにも安定して対応可能です。

Bedrock AgentCoreを用いたこの手法は、IoT管理のあり方を大きく変える可能性を秘めています。直感的なUXによる生産性向上、管理の一元化による運用効率化が期待できます。特定のAIモデルに依存しない設計のため、将来の技術進化にも柔軟に対応できる、未来志向のアーキテクチャと言えるでしょう。

出典：AWS公式

SlackbotがAIアシスタントに進化

2025年10月13日 Google マイクロソフト Salesforce Slack AWS 検索アシスタントリスクデータ漏洩クラウドセキュリティブランド

新機能の概要

AIアシスタントに進化

ワークスペース情報を検索

自然言語でのファイル検索

カスタムプランの作成支援

導入とセキュリティ

会議の自動調整・設定

年末に全ユーザーへ提供

企業単位での利用選択可能

データは社内に保持

詳細を見る

ビジネスチャットツールSlackが、SlackbotをAIアシスタントへと進化させるアップデートをテスト中です。従来の通知・リマインダー機能に加え、ワークスペース内の情報検索や会議調整など、より高度な業務支援が可能になります。本機能は年末に全ユーザー向けに提供される予定です。

新Slackbotは、個人の会話やファイル、ワークスペース全体の情報を基に、パーソナライズされた支援を提供します。「先週の会議でジェイが共有した書類を探して」のような自然な言葉で情報検索が可能です。

さらに、複数のチャンネル情報を集約して製品の発売計画を作成したり、ブランドのトーンに合わせてSNSキャンペーンを立案したりといった、より複雑なタスクも支援します。

Microsoft OutlookやGoogle Calendarとも連携し、会議の調整・設定を自動化。既存のリマインダー機能なども引き続き利用可能です。

セキュリティ面では、AWSの仮想プライベートクラウド上で動作。データはファイアウォール外に出ず、モデル学習にも利用されないため、企業の情報漏洩リスクを低減します。

現在は親会社であるSalesforceの従業員7万人と一部顧客にてテスト中。年末には全ユーザー向けに本格展開される見込みです。

出典：The Verge

Kitsa、AIで臨床試験サイト選択を革新

2025年10月13日 Amazon AWS ワークフローコンプライアンス医療エージェント

課題はサイト選定の非効率

データの断片化

手作業への依存

優良施設の見逃し

AWSが自動化を支援

UIエージェントで自動化

Webから大量データ抽出

厳格なコンプライアンスを維持

絶大な効果を実現

コスト91%削減

データ取得が96%高速化

抽出網羅率96%を達成

詳細を見る

健康テック企業のKitsaは、AWSの生成AIワークフロー自動化サービス「Amazon Quick Automate」を活用し、臨床試験の実施施設選定プロセスを革新しました。これにより、手作業に依存していた従来プロセスから脱却し、コストを91%削減、データ取得速度を96%向上させることに成功しました。

臨床試験において施設選定は長年の課題でした。施設のパフォーマンスデータは断片化し、手作業による評価には時間とコストがかさみます。その結果、一部の施設に評価が偏り、試験開始の遅延や機会損失が発生していました。

Kitsaはこの課題を解決するためQuick Automateを導入。同サービスのUIエージェントがWebサイトを自律的に巡回し、施設に関する50以上のデータポイントを自動で抽出・構造化します。

このソリューションは、AIの抽出精度が低い場合に人間によるレビューを組み込む「人間-in-the-ループ」機能も備え、品質を担保します。また、医療分野の厳格なコンプライアンス要件も満たしています。

導入効果は絶大で、データ取得に数ヶ月要していた作業が数日に短縮されました。分析対象の施設数も飛躍的に増加し、これまで見過ごされていた優良な施設の発見にも繋がっています。

この変革は、施設選定を人脈や主観に頼るものから、データに基づく客観的な評価へと転換させました。製薬企業はより良い意思決定ができ、施設側は自らの能力を証明する場を得ています。

出典：AWS公式

AWS、AIエージェント運用基盤AgentCoreをGA

2025年10月13日 OpenAI Amazon AWS ワークフローエンジニアインフラセキュリティ品質保証デプロイデバッグ医療エージェント Cohere

エージェント運用基盤

AIエージェントの本番運用を支援

開発から運用まで包括的サポート

主要な機能と特徴

任意のフレームワークを選択可能

コード実行やWeb操作などのツール群

文脈維持のためのメモリ機能

監視や監査証跡などの可観測性

企業導入のメリット

セキュリティとスケーラビリティを両立

インフラ管理不要で迅速な開発

詳細を見る

AWSは10月13日、AIエージェントを本番環境で安全かつ大規模に運用するための包括的プラットフォーム『Amazon Bedrock AgentCore』の一般提供を開始したと発表した。開発者は任意のフレームワークやモデルを選択し、インフラ管理なしでエージェントを構築、デプロイ、運用できるようになる。企業がAIエージェントにビジネスの根幹を委ねる時代を加速させる。

AIエージェントは大きな期待を集める一方、プロトタイプの段階で留まるケースが多かった。その背景には、エージェントの非決定的な性質に対応できる、セキュアで信頼性が高くスケーラブルなエンタープライズ級の運用基盤が不足していた問題がある。AgentCoreはまさにこの課題の解決を目指す。

AgentCoreの最大の特徴は柔軟性だ。開発者はLangGraphやOpenAI Agents SDKといった好みのフレームワーク、Amazon Bedrock内外のモデルを自由に選択できる。これにより、既存の技術資産やスキルセットを活かしながら、エージェント開発を迅速に進めることが可能になる。

エージェントが価値を生み出すには具体的な行動が必要だ。AgentCoreは、コードを安全に実行する『Code Interpreter』、Webアプリケーションを操作する『Browser』、既存APIをエージェント用ツールに変換する『Gateway』などを提供。これらにより、エージェントは企業システムと連携した複雑なワークフローを自動化できる。

さらに、企業運用に不可欠な機能も充実している。対話の文脈を維持する『Memory』、行動の監視やデバッグを支援する『Observability』、microVM技術でセッションを分離する『Runtime』が、セキュリティと信頼性を確保。これらはエージェントをビジネスの中心に据えるための礎となる。

すでに多くの企業がAgentCoreを活用し、成果を上げている。例えば、Amazon Devicesの製造部門では、エージェントが品質管理のテスト手順を自動生成し、モデルの調整時間を数日から1時間未満に短縮。医療分野ではCohere Healthが、審査時間を3〜4割削減するコピロットを開発した。

AgentCoreは、アジア太平洋（東京）を含む9つのAWSリージョンで利用可能となった。AWS Marketplaceには事前構築済みのエージェントも登場しており、企業はアイデアからデプロイまでを迅速に進められる。AIエージェントの時代を支える確かな基盤として、その活用がさらに広がりそうだ。

出典：AWS公式

Amazon Quick Suite、MCPで企業連携を強化

2025年10月13日 OpenAI Amazon AWS 生産性アシスタント AI導入業務効率エンジニア経営者投資エージェント MCP SaaS

MCPによる標準化された連携

MCPで安全な接続を実現

カスタム統合が不要に

主要SaaSやエージェントと接続

Atlassian製品と連携

AWSナレッジベースに接続

Bedrock AgentCore経由でエージェント統合

業務自動化と生産性向上

チャットエージェントでの業務自動化

オンボーディング業務を効率化

詳細を見る

Amazonは2025年10月13日、AIアシスタントサービス『Amazon Quick Suite』が、AIと企業アプリケーションの接続を標準化する『Model Context Protocol（MCP）』に対応したと発表しました。これにより、開発者は複雑なカスタム統合を必要とせず、AIエージェントを既存の業務ツールやデータベースに安全かつ容易に接続できるようになります。

MCPは、AIエージェントが企業のナレッジベースやアプリケーションと連携するためのセキュアな標準規格です。従来は個別に開発が必要だった連携処理が、MCPを利用することで大幅に簡素化されます。Amazon Quick SuiteのMCPクライアントは、この標準化された接続をサポートし、企業のAI導入ハードルを下げます。

具体的には、AtlassianのJiraやConfluenceといった主要プロジェクト管理ツールとのMCP連携が可能です。これにより、Quick Suiteのチャットエージェントは、ユーザーの指示に基づきJira課題の作成やConfluenceページの情報取得を自動で行えるようになります。チームの業務効率が飛躍的に向上するでしょう。

さらに、AWSが提供する公式ドキュメントやコードサンプルにアクセスする『AWS Knowledge MCP Server』とも接続できます。エンジニアは、チャット形式で最新のAWS技術情報を即座に取得可能になり、開発スピードの向上が期待されます。複数の情報源を横断した質問にも対応します。

より高度な活用として、『Amazon Bedrock AgentCore Gateway』を介した自社AIエージェントの統合も実現します。これにより、Amazon Kendraを内蔵したITヘルプデスクエージェントや、OpenAIを基盤としたHRサポートエージェントなど、既存のAI資産をQuick Suite上でシームレスに利用できます。

この連携は具体的な業務シーンで威力を発揮します。例えば、新入社員のオンボーディングでは、マネージャーがエージェントに指示するだけで、Confluenceからチェックリストを取得し、Jiraにタスクを作成して担当者を割り振るまでの一連のプロセスを自動化できます。

今回のMCP対応は、Amazon Quick Suiteを単なるAIチャットツールから、企業のあらゆるシステムとAIを繋ぐハブへと進化させる重要な一歩です。経営者やエンジニアは、この新機能を活用することで、AIの投資対効果を最大化し、事業の競争力強化につなげることができるでしょう。

出典：AWS公式

AIが医療データを可視化・分析

2025年10月13日 Amazon LangChain AWS 生産性セキュリティコンプライアンス医療

活用技術

Amazon BedrockのAI基盤

LangChainで文書処理

StreamlitでUI構築

主な機能

自然言語での対話的分析

データの動的可視化機能

複数のAIモデル選択可能

導入のポイント

セキュリティとコンプライアンス

Guardrailsでの利用制限

詳細を見る

AWSは、Amazon BedrockやLangChain、Streamlitを活用した医療レポート分析ダッシュボードを開発しました。自然言語での対話と動的な可視化を通じて、複雑な医療データの解釈を支援します。

このソリューションは、Amazon BedrockのAI基盤、LangChainの文書処理、StreamlitのUI技術を組み合わせています。これにより、医療データへのアクセスと分析が容易になります。

ユーザーはダッシュボード上で自然言語で質問すると、AIがレポート内容を解釈して回答します。健康パラメータの推移を示すグラフによる可視化機能も搭載されています。

このシステムの強みは、会話の文脈を維持しながら、継続的な対話分析を可能にする点です。これにより、より深く、インタラクティブなデータ探索が実現します。

医療データを扱う上で、セキュリティとコンプライアンスは不可欠です。実運用では、データ暗号化やアクセス制御といった対策が求められます。

特にAmazon Bedrock Guardrailsを設定し、AIによる医療助言や診断を厳しく制限することが重要です。役割はあくまでデータ分析と解釈に限定されます。

この概念実証は、生成AIが医療現場の生産性と意思決定の質を高める大きな可能性を秘めていることを示しています。

出典：AWS公式

脱・大手クラウド、分散ストレージTigrisが挑戦

2025年10月09日 AWS エコシステムエンジニア推論 GPU クラウドデータセンター米国欧州スタートアップ医療資金調達 Andreessen Horowitz

AI時代の新たな課題

AI需要で分散コンピューティングが急増

ストレージは大手クラウドに集中

コンピューティングとデータの距離が課題に

Tigrisが提供する価値

GPUの近くにデータを自動複製

低レイテンシでAIワークロードを高速化

高額なデータ転送料金を回避

成長と今後の展望

シリーズAで2500万ドルを調達

欧州・アジアへデータセンター拡大計画

詳細を見る

米国のスタートアップTigris Dataが、シリーズAラウンドで2500万ドルを調達しました。同社は、AIの普及で需要が急増する分散コンピューティングに対応するため、AWSなど大手クラウドが抱える高コスト・高遅延の問題を解決する分散型データストレージを提供。大手からの脱却を目指す企業の新たな選択肢として注目されています。

生成AIの台頭で、コンピューティングパワーは複数のクラウドや地域に分散する傾向が加速しています。しかしデータストレージの多くは依然として大手3社に集中。この「コンピューティングとデータの距離」が、AIモデルの学習や推論における遅延のボトルネックを生み出しているのです。

Tigrisは、GPUなど計算資源の近くにデータを自動で複製・配置するAIネイティブなストレージ網を構築。これにより開発者は低レイテンシでデータにアクセスでき、AIワークロードを高速かつ低コストで実行可能になります。顧客は、かつて支出の大半を占めたデータ転送料金を不要にできたと証言します。

大手クラウドは、顧客がデータを他サービスへ移行する際に高額な「データ転送料金」を課してきました。TigrisのCEOはこれを「より深い問題の一症状」と指摘。中央集権型のストレージ自体が、分散・高速化するAIエコシステムの要求に応えられていないと強調します。

企業がTigrisを選ぶもう一つの動機は、データ主権の確保です。自社の貴重なデータをAI開発に活用する上で、外部のプラットフォームに依存せず、自らコントロール下に置きたいというニーズが高まっています。特に金融やヘルスケアなど規制の厳しい業界でこの傾向は顕著です。

今回の資金調達はSpark Capitalが主導し、Andreessen Horowitzなども参加。Tigrisは調達資金を元に、既存の米国内3拠点に加え、ヨーロッパやアジアにもデータセンターを拡大する計画です。2021年の設立以来、年8倍のペースで成長しており、今後の展開が期待されます。

出典：TechCrunch

統合AIプラットフォーム競争激化、GoogleとAWSが新サービス

2025年10月09日 Google マイクロソフト Amazon Salesforce Slack Gemini AWS Chrome 生産性検索エコシステムワークフローチャットボットエージェントコンテキストノーコード

Googleの新統合AI基盤

Google AIを単一プラットフォームに集約

ノーコードでエージェントを構築・管理

Microsoft 365など外部データと連携

月額30ドル/人から利用可能

AWSのブラウザ拡張AI

ブラウザ拡張機能で提供

OutlookやSlack上で直接利用

多様な企業データソースに接続

既存のBedrockエージェントを活用

詳細を見る

GoogleとAmazon Web Services (AWS)が、企業向けに新たな統合AIプラットフォームを相次いで発表しました。Googleは「Gemini Enterprise」を、AWSは「Quick Suite」を投入し、従業員が業務で使うアプリケーションから離れることなく、シームレスにAI機能を呼び出せる環境を目指します。この動きは、作業の文脈（コンテキスト）を維持し、生産性を劇的に向上させることを狙ったものです。

これまでAIチャットボットを利用するには、作業中のアプリとは別に専用画面を開く必要があり、手間や思考の中断が課題でした。この「摩擦」を解消し、作業の文脈を失うことなくAIを活用できるフルスタックな環境が求められています。従業員のワークフローにAIを自然に組み込むことが、生産性向上の鍵となるのです。

Googleの「Gemini Enterprise」は、同社のAIサービスを一つのプラットフォームに統合します。Google Workspaceに加え、Microsoft 365やSalesforceといった外部データソースにも接続可能です。専門知識がなくても、ノーコードで情報検索や業務自動化のためのエージェントを構築・管理できる点が大きな特徴と言えるでしょう。

一方のAWSが発表した「Quick Suite」は、ブラウザ拡張機能として提供されます。これにより、ChromeやOutlook、Slackといった日常的に使うツール上で直接AIエージェントを呼び出せます。バックエンドではAWSのAI基盤「Bedrock」で構築したエージェントを活用でき、企業ごとの独自データに基づいた応答が可能です。

両社の新サービスが目指すのは、従業員を一つのエコシステム内に留め、作業を中断させないシームレスなAI体験の提供です。企業向けAI市場の覇権を巡る戦いは、いかに既存の業務フローに溶け込めるかという「利便性」の競争へと移行し始めています。今後、各社はさらなる差別化を迫られることになるでしょう。

出典：VentureBeat

AWS Nova、AI監視を低コスト・高精度に自社化

2025年10月09日 Amazon AWS 広告コンテンツポリシーブランド

独自AIモデレーター開発

既存モデルを自社データで調整

専門用語や文脈をAIが理解

開発時間とコストを大幅削減

過剰な検閲と見逃しを防止

高い精度とコスト効率

精度(F1スコア)が平均7.3%向上

他社比10-100倍の費用対効果

1万件のデータで約1時間の学習

大規模導入でも運用費を抑制

詳細を見る

米Amazon Web Services(AWS)は、AIモデル「Amazon Nova」を自社専用に調整し、高精度なテキスト監視を実現する新手法を発表しました。独自のデータでAIを再教育し、各社のポリシーに沿った低コストなモデレーションを可能にします。

ソーシャルメディアなどでは不適切な投稿の監視が不可欠ですが、従来のシステムでは専門用語や文脈を理解できず、無害な投稿を誤検知したり、巧妙な違反を見逃す課題がありました。これはユーザー体験と広告主の信頼を損なう大きな原因です。

新手法では「Nova」を自社データ1万件ほどで追加学習します。これにより精度(F1スコア)が平均7.3%向上。自社のガイドラインや特有のニュアンスを理解する、賢いAIモデレーターを構築できます。

ゼロからの開発に比べ、開発期間とコストを大幅に削減できる点も強みです。学習は約1時間で完了し、他の商用モデル比で圧倒的なコスト効率を実現。大規模導入のハードルを下げます。

このカスタマイズは、企業が独自のポリシーやデータ形式を柔軟に適用できる設計です。既存の資産を活かしながら、迅速に自社特化のAIを構築し、運用に乗せることが可能になります。

高い精度とコスト効率を両立するこの手法は、コンテンツ監視の新たな標準となるでしょう。企業はブランドイメージを保護しつつ、より健全なプラットフォーム運営が期待できます。

出典：AWS公式

AWSとAnyscale連携、大規模AI開発を高速・効率化

2025年10月09日 Amazon AWS 生産性エコシステムエンジニア機械学習インフラ投資

大規模AI開発の課題

不安定な学習クラスタ

非効率なリソース利用

複雑な分散コンピューティング

AWSとAnyscaleの解決策

SageMaker HyperPodによる耐障害性インフラ

Anyscale RayTurboによる高速分散処理

EKS連携でKubernetes環境に対応

導入によるビジネス成果

学習時間を最大40%削減

TCO削減と生産性向上

詳細を見る

Amazon Web Services (AWS)は、Anyscale社との協業で、大規模AIモデル開発の課題を解決する新ソリューションを発表しました。AWSのAIインフラ「SageMaker HyperPod」と、Anyscaleの分散処理プラットフォームを統合。これにより、開発者は耐障害性の高い環境で効率的にリソースを活用し、AI開発の高速化とコスト削減を実現できます。

大規模AIモデルの開発現場では、学習クラスタの不安定さやリソースの非効率な利用がコスト増やプロジェクト遅延の直接的な原因となっています。複雑な分散コンピューティングの専門知識も必要とされ、データサイエンスチームの生産性を阻害する大きな課題でした。

この課題に対し、AWSの「SageMaker HyperPod」は堅牢な解決策を提供します。大規模機械学習に最適化されたこのインフラは、ノードの健全性を常時監視。障害発生時には自動でノードを交換し、チェックポイントから学習を再開することで、トレーニング時間を最大40%削減できるとしています。

一方のAnyscaleプラットフォームは、オープンソースのAIエンジン「Ray」の能力を最大限に引き出します。特に最適化版「RayTurbo」は、コード変更なしで分散コンピューティングを高速化し、リソース使用率を最適化。開発者の俊敏性とコスト効率を大幅に向上させます。

両者の統合により、強力な相乗効果が生まれます。SageMaker HyperPodの耐障害性と、Anyscaleの高速処理が組み合わさることで、AIモデルの市場投入までの時間を短縮。同時に、リソースの最適化を通じて総所有コスト(TCO)を削減し、データサイエンティストの生産性を高めます。

このソリューションは、特にKubernetesベースの環境（Amazon EKS）を運用する組織や、大規模な分散トレーニングを必要とするチームに最適です。すでにRayエコシステムやSageMakerを利用している企業にとっても、既存の投資をさらに活用する強力な選択肢となるでしょう。

出典：AWS公式

Amazon Nova Actがデータ分析を自律化 QuickSightのレポーティング効率を革新

2025年10月07日 Amazon AWS 生産性 AI活用ワークフローエージェントプロンプト

新エージェントAIの核心

アクション志向の自律型AI

複雑なWebタスクを自動実行

タスクをアトミックコマンドに分割

従来のLLMと異なる生産性特化

データストーリー自動化

手動作業の削減と生産性向上

複雑なデータを対話型物語に変換

意思決定プロセスを大幅に加速

データ分析者が本来業務に集中

詳細を見る

AWSは、新しいエージェントAIツール「Amazon Nova Act」を活用し、Amazon QuickSightにおけるデータストーリー作成の自動化ソリューションを発表しました。QuickSightのデータストーリーは、複雑なデータを対話型の報告書に変換し、迅速な意思決定を支援します。従来、手動で行われていた多量のレポーティング作業を自律化することで、組織全体の生産性を劇的に向上させる狙いです。

Amazon Nova Actの最大の特徴は、従来のLLMが会話に重点を置いていたのに対し、「アクション志向」に特化している点です。この技術は、複雑なWebインターフェース操作タスクを信頼性の高い「アトミックコマンド」に分解し、自律的に実行します。これにより、最小限の人間監視でWebブラウザ自動化を実現し、ビジネス生産性とIT運用を根本的にモダン化します。

データストーリーの作成自動化は、ビジネスユニットごとの多様なレポーティングニーズに対応します。手作業による複数のナラティブ（物語）作成にかかっていた膨大な時間が削減されます。分析担当者はルーティンワークから解放され、より価値の高いデータ分析と、データ駆動型の意思決定そのものに時間を振り向けられるようになります。

この自動化を実現するためのプロンプト（指示）設計にはベストプラクティスが推奨されています。具体的には、エージェントに行わせたい動作を簡潔かつ具体的に記述することです。さらに、ログインやダッシュボード公開などの大きなアクションを、複数の小さな実行ステップ（act()コール）に分割することが、信頼性の高いワークフロー構築に不可欠とされています。

Amazon Nova Actは、QuickSightの堅牢な視覚化能力と結びつくことで、データの活用方法を一変させます。これにより、反復的なタスクが最小限に抑えられ、チーム全体のデータに基づいた意思決定が加速されます。これは、AWSが提供する次世代の自律型自動化の一例であり、AI活用による市場価値向上の鍵となるでしょう。

出典：AWS公式

AWSがBedrockバッチ推論の自動モニタリングを提供、50%のコスト削減へ

2025年10月07日 Amazon AWS 推論

バッチ処理のメリット

オンデマンド比で50%のコスト削減

大量データの効率的な分析

パーソナライズされた推奨を大規模展開

リアルタイム応答が不要なケースに最適

自動モニタリングの価値

ジョブステータスのリアルタイム可視化

運用オーバーヘッドの最小化

手動確認やポーリングの排除

監査記録とコスト分析データの蓄積

詳細を見る

AWSは、Amazon Bedrockのバッチ推論ジョブに対する自動モニタリングソリューションを発表しました。これは、大規模なデータセットをコスト効率よく処理しつつ、運用管理のオーバーヘッドを最小化する目的で設計されています。リアルタイムのジョブステータス可視化と監査記録の自動保持を実現し、AIを活用した大規模なデータ処理の信頼性を高めます。

Bedrockのバッチ推論は、即時性が要求されない大規模ワークロードに特化しており、オンデマンドオプションと比較して最大50%の価格削減が可能です。例えば金融サービスでは、数百万件の顧客データからパーソナライズされた推奨を効率的に生成するなど、大量データ分析に大きなメリットをもたらします。

このソリューションは、AWS Lambda、Amazon EventBridge、Amazon DynamoDBといったサーバーレスサービスを組み合わせています。EventBridgeがバッチ推論ジョブの状態変化を監視し、ジョブ完了や失敗時に即座にLambda関数を起動させ、手動でのステータス確認作業を不要にします。

起動されたLambda関数は、ジョブの詳細やステータスをDynamoDBテーブルに記録します。このテーブルは、一元化されたジョブのライフサイクル管理機能として機能します。これにより、処理の開始/終了時刻、処理件数、エラー件数などが追跡可能です。

DynamoDBに記録されるデータには、インプット/アウトプットトークン数といった重要なコスト要素のメトリクスも含まれます。これらの詳細な統計情報は、リソース配分の最適化を可能にし、将来的なバッチ推論ワークロードのコスト効率とパフォーマンスを改善するための監査記録となります。

さらに、CloudWatchアラームを設定することで、失敗したジョブへの迅速な対応が促されます。平均ジョブ実行時間やトークンスループット率などを監視し、オペレーションの可視性を高めることが推奨されています。この自動化により、チームは結果分析などの高付加価値業務に集中できます。

出典：AWS公式

Anthropic、元Stripe CTOを迎え、エンタープライズ向け基盤強化へ

2025年10月07日 Anthropic Stripe Claude AWS 生産性エンジニア創業者推論強化学習インフラクラウドセキュリティ人事

新CTOが担う役割

グローバルなエンタープライズ需要に対応

製品、インフラ、推論を全て統括

Claudeの信頼性・スケーラビリティ確保

世界水準のインフラ構築への注力

パティル氏のキャリア資産

直近はStripeの最高技術責任者（CTO）

Stripeで数兆ドル規模の取引を支援

AWSやMSなど大手クラウドでの経験

20年超のミッションクリティカルな構築実績

詳細を見る

AI大手Anthropicは、元Stripeの最高技術責任者（CTO）であるラフル・パティル（Rahul Patil）氏を新たなCTOとして迎えました。これは、急速に増大するエンタープライズ顧客の需要に応えるため、Claudeの大規模かつ信頼性の高いインフラ基盤を構築することを最優先する、戦略的な人事です。

パティル氏は、製品、コンピューティング、インフラストラクチャ、推論、データサイエンス、セキュリティを含むエンジニアリング組織全体を監督します。彼のミッションは、Anthropicが持つ研究の優位性を活かしつつ、Claudeをグローバル企業が依存できる堅牢なプラットフォームへとスケールさせることです。

新CTOは、20年以上にわたり業界をリードするインフラを構築してきた実績があります。特にStripeでは、年間数兆ドルを処理する技術組織を指導しました。この経験は、高い可用性とセキュリティが求められる金融技術の領域で、ミッションクリティカルなシステムを構築する専門知識を示しています。

共同創業者兼社長のダニエラ・アモデイ氏は、Anthropicがすでに30万を超えるビジネス顧客にサービスを提供している点を強調しました。パティル氏の採用は、Claudeを「企業向けをリードするインテリジェンスプラットフォーム」に位置づけるという、同社の強いコミットメントを裏付けるものです。

なお、共同創業者であり前CTOのサム・マキャンディッシュ氏は、Chief Architect（チーフアーキテクト）に就任しました。彼は、大規模モデルトレーニング、研究生産性、RL（強化学習）インフラストラクチャといった根幹の研究開発分野に専念し、技術的な進化を引き続き主導します。

出典：Anthropic公式

PowerSchool、SageMakerで実現した教育AI向けコンテンツフィルタリング

K-12教育特化AIの安全確保

K-12教育向けAIアシスタント「PowerBuddy」

歴史教育などでの誤検出（False Positive）を回避

いじめ・自傷行為の即時検知を両立させる必要性

SageMaker活用によるモデル育成

Llama 3.1 8BをLoRA技術で教育特化ファインチューニング

高い可用性とオートスケーリングを要件にSageMakerを採用

有害コンテンツ識別精度約93%、誤検出率3.75%未満

事業へのインパクトと将来性

学校現場での教師の負担を大幅に軽減

将来的にマルチアダプター推論で運用コストを最適化

詳細を見る

教育分野向けのクラウドソフトウェア大手PowerSchoolは、AIアシスタント「PowerBuddy」の生徒安全を確保するため、AWSのAmazon SageMaker AIを活用し、コンテンツフィルタリングシステムを構築しました。オープンな基盤モデルであるLlama 3.1を教育ドメインに特化してファインチューニングし、高い精度と極めて低い誤検出率を両立させ、安全な学習環境の提供を実現しています。

このソリューションが目指したのは「責任あるAI（Responsible AI）」の実現です。ジェネリックなAIフィルタリングでは、生徒が歴史的な戦争やホロコーストのような機微な学術的話題を議論する際に、誤って暴力的コンテンツとして遮断されるリスクがありました。同時に、いじめや自傷行為を示唆する真に有害な内容は瞬時に検知する必要があり、ドメイン特化の調整が不可欠でした。

PowerSchoolは、このカスタムモデルの開発・運用基盤としてAmazon SageMaker AIを選定しました。学生の利用パターンは学校時間帯に集中するため、急激なトラフィック変動に対応できるオートスケーリング機能と、ミッションクリティカルなサービスに求められる高い信頼性が決め手となりました。また、モデルの重みを完全に制御できる点も重要でした。

同社はLlama 3.1 8Bモデルに対し、LoRA（Low Rank Adaptation）技術を用いたファインチューニングをSageMaker上で行いました。その結果、教育コンテキストに特化した有害コンテンツ識別精度は約93%を達成。さらに、学術的な内容を誤って遮断する誤検出率（False Positive）を3.75%未満に抑えることに成功しました。

この特化型コンテンツフィルタリングの導入は、学生の安全を確保するだけでなく、教育現場に大きなメリットをもたらしています。教師はAIによる学習サポートにおいて生徒を常時監視する負担が減り、より個別指導に集中できるようになりました。現在、PowerBuddyの利用者は420万人以上の学生に拡大しています。

PowerSchoolは今後、SageMaker AIのマルチアダプター推論機能を活用し、コンテンツフィルターモデルの隣で、教育ドメインに特化した意思決定エージェントなど複数の小型言語モデル（SLM）を展開する計画です。これにより、個別のモデルデプロイが不要となり、専門性能を維持しつつ大幅なコスト最適化を目指します。

出典：AWS公式

AWS Bedrock、AI推論の世界規模での最適化

2025年10月03日 Anthropic Amazon Claude AWS Sonnet エンジニア推論インフラ

新機能「グローバル推論」

Bedrockで世界規模のAI推論

AnthropicのClaude 4.5に対応

最適なリージョンへ自動ルーティング

導入によるメリット

トラフィック急増にも安定稼働

従来比で約10%のコスト削減

監視・管理は単一リージョンで完結

グローバルなリソースで高いスループット

詳細を見る

Amazon Web Services（AWS）は、生成AIサービス「Amazon Bedrock」において、新機能「グローバルクロスリージョン推論」の提供を開始しました。まずAnthropic社の最新モデル「Claude Sonnet 4.5」に対応し、AIへのリクエストを世界中の最適なAWSリージョンへ自動的に振り分けます。これにより企業は、トラフィックの急増や需要変動に柔軟に対応し、AIアプリケーションの安定性と処理能力をグローバル規模で高めることが可能になります。

この新機能の核心は、インテリジェントなリクエストルーティングにあります。Bedrockがモデルの可用性や各リージョンの負荷状況をリアルタイムで判断し、地理的な制約なく最適な場所で推論を実行します。開発者は、これまで必要だった複雑な負荷分散の仕組みを自前で構築する必要がなくなります。

最大のメリットは、耐障害性の向上です。予期せぬアクセス集中が発生しても、世界中のリソースを活用してリクエストを分散処理するため、安定したパフォーマンスを維持できます。これは、特にビジネスクリティカルなアプリケーションにおいて、機会損失や信用の低下を防ぐ上で極めて重要です。

さらに、コスト効率の改善も大きな魅力と言えるでしょう。このグローバル機能は、従来の特定の地理的範囲内でのクロスリージョン推論と比較して、入出力トークン価格が約10%安価に設定されています。つまり、より高い性能と安定性を、より低いコストで実現できるのです。

運用管理の負担も軽減されます。推論がどのリージョンで実行されても、ログデータはリクエストを発信した「ソースリージョン」に集約されます。これにより、AWS CloudWatchなどの使い慣れたツールでパフォーマンスや利用状況を一元的に監視・分析することができ、管理が煩雑になる心配はありません。

利用開始は簡単で、既存のアプリケーションコードをわずかに変更するだけで済みます。API呼び出し時に、リージョン固有のモデルIDの代わりにグローバル推論プロファイルIDを指定し、適切なIAM権限を設定すれば、すぐにこの強力なグローバルインフラの恩恵を受けられます。

出典：AWS公式

AWS、Bedrock AgentCoreの通信をVPC内で完結

2025年10月03日 Amazon AWS ネットワークリスククラウドデータセンターセキュリティポリシーコンプライアンスエージェント AIゲートウェイ

セキュリティ強化の要点

VPCエンドポイントでプライベート接続

インターネットを介さない安全な通信

機密データを扱うAIエージェントに最適

AWS PrivateLink技術を活用

導入のメリット

通信遅延の削減とパフォーマンス向上

エンドポイントポリシーで厳格なアクセス制御

企業のコンプライアンス要件に対応

オンプレミスからのハイブリッド接続も可能

詳細を見る

アマゾンウェブサービス（AWS）が、生成AIサービス「Amazon Bedrock」のAgentCore Gatewayへのセキュアな接続方法として、VPCインターフェイスエンドポイントを利用する手法を公開しました。これにより、企業はAIエージェントが扱う機密データの通信をインターネットから隔離し、セキュリティとコンプライアンスを大幅に強化できます。

企業の自動化を推進するAIエージェントは、機密データや基幹システムにアクセスするため、本番環境での利用には通信経路のセキュリティ確保が不可欠です。パブリックインターネットを経由する通信は、潜在的なリスクを伴い、多くの企業のセキュリティポリシーや規制要件を満たすことが困難でした。

今回公開された手法では、「AWS PrivateLink」技術を活用したVPCインターフェイスエンドポイントを利用します。これにより、VPC（仮想プライベートクラウド）内で稼働するAIエージェントからAgentCore Gatewayへの通信が、AWSのプライベートネットワーク内で完結します。外部のインターネットを経由しないため、極めて安全な通信経路を確立できます。

プライベート接続の利点はセキュリティ強化に留まりません。AWS ネットワーク内での直接接続により、通信の遅延が削減され、パフォーマンスが向上します。また、エンドポイントポリシーを設定することで、特定のゲートウェイへのアクセスのみを許可するなど、最小権限の原則に基づいた厳格なアクセス制御も可能です。

このVPCエンドポイントは、AIエージェントがツールを利用する際の「データプレーン」通信にのみ適用される点に注意が必要です。ゲートウェイの作成や管理といった「コントロールプレーン」操作は、引き続き従来のパブリックエンドポイントを経由して行う必要があります。この違いを理解しておくことが重要です。

このアーキテクチャは、オンプレミスのデータセンターからAIエージェントに安全にアクセスするハイブリッドクラウド構成や、複数のVPCをまたいだ大規模なシステムにも応用できます。企業は、自社の環境に合わせて柔軟かつスケーラブルなAI基盤を構築することが可能になります。

出典：AWS公式

AWS Bedrock活用、営業AI『Rox』が生産性50%向上

2025年10月01日 Slack Claude AWS 生産性ワークフロー CRM Sonnet 推論セキュリティスタートアップエージェント

AIが営業業務を自動化

点在する営業データを統合

AIエージェントがワークフローを実行

対話で調査から提案書作成まで指示

Slackなど日常ツールで利用可能

驚異的な生産性向上

営業担当者の生産性が50%向上

営業サイクルを20%高速化

担当者あたりの収益が2倍に

新人育成の時間を半減

詳細を見る

営業支援スタートアップRox社は、AIエージェントを活用した新サービス「Rox」の一般提供を開始しました。AWS Bedrockを基盤にClaude 4 Sonnetモデルを採用。社内に散在する営業データを統合・自動化し、営業チームの生産性を飛躍的に高めることを目指します。

多くの企業では営業データがCRMやMAツールなどに分散し、サイロ化しています。担当者はデータの集約や入力に時間を奪われ、本来の営業活動に集中できません。この非効率性が組織全体の生産性を下げる一因です。

Roxは、これを「レベニューオペレーティングシステム」で解決します。点在するデータをナレッジグラフに集約し、AIエージェント群が連携。アカウント調査から商談管理まで、一連のワークフローを自動実行します。

中核機能は対話型UI「Command」です。「ACME社の契約更新準備」といった指示だけで、AIが複数の業務を自動実行。調査から提案書のドラフト作成まで、特化したエージェント群がシームレスに処理します。

この強力なAIの基盤がAWS Bedrockです。特にツール連携と推論能力に優れた「Claude 4 Sonnet」を採用。エンタープライズ級のセキュリティと拡張性を確保し、複雑な営業業務の自動化を実現しました。

導入企業からは目覚ましい成果が報告されています。営業担当者の生産性は50%向上し、営業サイクルは20%高速化。担当者あたりの収益が2倍になった事例もあります。新人育成の時間も半減しました。

Roxは、AIエージェント群が常に営業活動を支援する未来を目指します。サービスは公式サイトやAWS Marketplaceから利用可能。データとAIを駆使した新しい営業の形が、市場での競争力を左右しそうです。

出典：AWS公式

AWSのAI活用、ハパックロイドが海運予測精度12%向上

2025年10月01日 Amazon AWS 生産性 AI活用アシスタント業務効率気象スケジュール調整推論機械学習クラウド品質保証デプロイドイツ

従来の課題

リアルタイム性に欠ける静的な統計予測

天候や港湾混雑など複雑な変動要因

大量の過去データとリアルタイム情報の統合

AIによる解決策

航海区間ごとの4つの専門MLモデル

Amazon SageMakerによる堅牢なMLOps基盤

バッチとAPIによるハイブリッド推論構成

導入成果

予測の平均絶対誤差が12%改善

信頼性ランキングで平均2位上昇

詳細を見る

ドイツの海運大手ハパックロイド社が、AWSの機械学習プラットフォーム「Amazon SageMaker」を活用し、船舶運航のスケジュール予測を革新しました。新しいMLアシスタントは、予測の平均絶対誤差を従来比で約12%改善。業界の重要指標であるスケジュール信頼性を向上させ、国際ランキングを平均2つ押し上げる成果を上げています。

従来は過去の統計計算に依存し、港湾の混雑や天候などリアルタイムの変動要因を考慮できませんでした。特に2021年のスエズ運河座礁事故のような不測の事態では、手動での大幅な計画修正が不可避となり、業務効率の低下を招いていました。

新システムは航海の区間ごとに専門MLモデルを構築し、それらを統合する階層的アプローチを採用。これにより、予測の透明性を保ちつつ、複雑な要因を織り込んだ高精度なETA（到着予定時刻）の算出を可能にしました。

モデル学習には社内運航データに加え、船舶位置を追跡するAISデータなどリアルタイムの外部データを統合。SageMakerのパイプライン機能でデータ処理からモデル学習、デプロイまでを自動化し、継続的な精度改善を実現しています。

推論は、夜間バッチ処理とリアルタイムAPIを組み合わせたハイブリッド構成です。99.5%の高い可用性を保ちながら、API応答時間を従来比80%以上高速化。オペレーターが対話的に利用する際の操作性も大幅に向上させました。

本件はAIとクラウドが物流の課題を解決する好例です。データに基づく高精度な予測は顧客への品質保証を強化し、競争優位性を確立します。自社の業務にAIをどう組み込み、生産性・収益性を高めるか、そのヒントがここにあります。

出典：AWS公式

AWSのAI、NBAに新次元の観戦体験を提供

2025年10月01日 Amazon AWS 検索クラウド

AIが生む新たなバスケ指標

選手の29の身体部位を追跡

AIによるシュート難易度の数値化

選手のコート貢献度「Gravity」

ディフェンスに特化した新指標導入

テクノロジーで変わる観戦

試合中継やアプリで新データ提供

プレー映像を瞬時に検索可能に

より深いファンエンゲージメントへ

詳細を見る

Amazon Web Services (AWS)は、2025-2026シーズンから、全米プロバスケットボール協会(NBA)の試合でAIを活用した新たなリアルタイム統計を提供します。この取り組みは、選手の動きを詳細に分析し、これまで数値化できなかったプレーの側面を可視化することで、ファンに全く新しい観戦体験をもたらすことを目的としています。

新技術の中核をなすのは、コート上の全選手の29の身体部位を追跡するシステムです。収集された膨大な運動データをAWSのAIがリアルタイムで解析。「これまで測定不可能だったバスケットボールの側面を捉える」ことを可能にし、より深く、多角的な試合分析を実現します。

これにより、ファンは「シュートの難易度」といった新しい指標に触れられるようになります。単にシュートが成功したか否かだけでなく、選手の体勢やディフェンダーの位置などを加味して、そのシュートがいかに困難だったかを客観的に評価します。また、成功確率を予測する「期待フィールドゴール成功率」も算出されます。

さらに、「グラビティ」と呼ばれる指標は、個々の選手がボールを持っていない時でも、いかに味方のためにスペースを作り出し、チームに貢献しているかを数値化します。ディフェンダーに特化した「ディフェンス・スコアボックス」も導入され、守備面の評価もより詳細になるのです。

これらの新しい統計データは、試合の生中継やNBAの公式アプリ、ウェブサイト上で提供されます。さらに「Play Finder」という新ツールを使えば、ファンは膨大な試合映像から特定のプレーを瞬時に検索できるようになり、エンゲージメントの向上が期待されます。

この取り組みは、2024年にAmazonとNBAが締結した11年間のメディア放映権契約の一環です。この契約によりAWSはNBAの公式クラウドおよびAIパートナーとなり、Prime Videoでの試合配信に加え、テクノロジー面でも連携を深めています。

出典：The Verge

NVIDIA、GPUで量子計算の三大課題を解決

2025年09月30日 NVIDIA AWS エコシステムシミュレーションエンジニア経営者半導体 GPU 開発ツール TRL

量子計算の三大課題を解決

実用化を阻む3つのボトルネック

GPU並列処理で計算量を克服

CUDA-Qなど開発ツール群を提供

大学や企業との連携で研究を加速

驚異的な性能向上事例

AIによるエラー訂正を50倍高速化

回路コンパイルを最大600倍高速化

量子シミュレーションを最大4,000倍高速化

詳細を見る

NVIDIAは、同社のアクセラレーテッド・コンピューティング技術が、量子コンピューティングの実用化に向けた最大の課題を解決していると発表しました。GPUの並列処理能力を活用し、量子分野の「エラー訂正」「回路コンパイル」「シミュレーション」という三大課題でブレークスルーを生み出しています。これにより、研究開発が大幅に加速され、産業応用の可能性が現実味を帯びてきました。

最初の課題は「量子エラー訂正」です。量子コンピュータはノイズに弱く、正確な計算のためにはエラーの検出と訂正が不可欠です。NVIDIAは、大学やQuEra社との協業で、AIを活用したデコーダーを開発。CUDA-Qなどのライブラリを用いることで、デコード処理を最大50倍高速化し、精度も向上させることに成功しました。

次に「量子回路コンパイル」の最適化です。これは、抽象的な量子アルゴリズムを物理的な量子チップ上の量子ビットに最適配置する複雑なプロセスです。NVIDIAはQ-CTRL社などと連携し、GPUで高速化する新手法を開発。この最適化プロセスにおいて、従来比で最大600倍の高速化を達成しました。

最後に、より良い量子ビット設計に不可欠な「高忠実度シミュレーション」です。量子システムの複雑な挙動を正確に予測するには膨大な計算が必要となります。NVIDIAはcuQuantum SDKをオープンソースツールキットと統合し、大規模なシミュレーションで最大4,000倍の性能向上を実現。AWSなども協力しています。

NVIDIAのプラットフォームは、単に計算を速くするだけでなく、量子研究のエコシステム全体を加速させる基盤技術となっています。経営者やエンジニアにとって、これらのツールをいち早く理解し活用することが、未来の市場で競争優位を築く鍵となるでしょう。

出典：NVIDIA公式

AWS、GNN不正検知を1コマンドで実用化

2025年09月30日 Amazon AWS ネットワークエンジニア専門家推論機械学習インフラデプロイ

巧妙化する不正とGNN

巧妙化・組織化する金融不正

従来の個別分析手法の限界

関係性を捉えるGNNの有効性

GraphStorm v0.5の新機能

GNN本番実装の課題を解決

リアルタイム推論をネイティブサポート

SageMakerへのデプロイを1コマンドで実現

標準ペイロードでシステム連携を簡素化

詳細を見る

Amazon Web Services（AWS）は、グラフ機械学習フレームワークの新バージョン「GraphStorm v0.5」を公開しました。このアップデートにより、グラフニューラルネットワーク（GNN）を用いたリアルタイム不正検知システムの本番実装が劇的に簡素化されます。巧妙化・組織化する金融不正に対し、企業が迅速かつ低コストで高度な対策を講じるための強力なツールとなりそうです。

金融不正の手口は年々高度化しており、個別の取引データだけを分析する従来型の機械学習モデルでは、巧妙に隠された組織的な不正ネットワークを見抜くことが困難になっています。この課題に対し、エンティティ間の関係性をモデル化できるGNNは極めて有効ですが、本番環境で求められるサブ秒単位の応答速度や大規模データへの対応、そして運用の複雑さが導入の大きな障壁となっていました。

GraphStorm v0.5は、この障壁を打ち破る新機能を搭載しています。最大の特長は、Amazon SageMakerを通じたリアルタイム推論のネイティブサポートです。従来は数週間を要したカスタム開発やサービス連携作業が不要となり、学習済みモデルを本番環境のエンドポイントへ単一コマンドでデプロイできるようになりました。

このデプロイの簡素化により、開発者はインフラ構築の複雑さから解放され、モデルの精度向上に集中できます。また、標準化されたペイロード仕様が導入されたことで、クライアントアプリケーションとの連携も容易になりました。これにより、不正が疑われる取引データをリアルタイムでGNNモデルに送信し、即座に予測結果を受け取ることが可能になります。

AWSは、公開データセットを用いた具体的な実装手順も公開しています。このソリューションは、①グラフ構築、②モデル学習、③エンドポイントデプロイ、④リアルタイム推論という4ステップで構成されます。これにより、企業は自社のデータを用いて、迅速にGNNベースの不正防止システムを構築し、不正取引を未然に防ぐプロアクティブな対策を実現できます。

GraphStorm v0.5の登場は、これまで専門家チームによる多大な工数を必要としたGNNの実用化を、より多くの企業にとって現実的な選択肢としました。この技術革新は、金融サービスに限らず、様々な業界で応用が期待されるでしょう。

出典：AWS公式

AWS、セキュアな医療AI開発を加速

2025年09月26日 Amazon AWS AI活用ネットワーク業務効率セキュリティ医療エージェント

Bedrock AgentCoreの威力

複雑な医療AI開発を簡素化

既存APIをセキュアにツール化

サーバレスで大規模運用が可能

HIPAA準拠など高セキュリティ

具体的な導入効果と事例

予約業務などを自動化し負担軽減

Innovaccer社は15億ドル削減

400以上のデータソースを統合

患者中心の医療ネットワークを実現

詳細を見る

AWSは、医療向けAIエージェントの開発・運用を大規模かつセキュアに行うための新サービス群「Amazon Bedrock AgentCore」を発表しました。これにより、医療機関は複雑なデータ連携の課題を克服し、HIPAAなどの厳格な規制に準拠したインテリジェントなソリューションを迅速に構築できます。

医療業界では、電子カルテの形式が多様でデータがサイロ化しやすいという長年の課題があります。FHIRのような標準規格も存在しますが、既存システムとの統合には専門知識が求められ、AIエージェントを導入する際の障壁となっていました。

Bedrock AgentCoreは、この課題を解決します。既存のAPIをAIが利用可能なツールへと安全に変換する「AgentCore Gateway」や、セキュアな実行環境を提供する「Runtime」などを組み合わせることで、開発の負担を大幅に軽減します。

具体的な活用例として、子供の予防接種履歴の確認から予約までを対話形式で完結させるAIエージェントが紹介されています。これにより、保護者や医療機関の管理負担が軽減され、患者体験の向上が期待できます。

ヘルスケアAI企業のInnovaccer社は、いち早く自社プラットフォームにBedrock AgentCoreを採用しました。400以上のデータソースを統合し、AIエージェントを活用することで、既に15億ドルのコスト削減を達成するなど、大きな成果を上げています。

Bedrock AgentCoreの登場は、AIによる患者ケアの向上と業務効率化を大きく前進させるものです。セキュアでスケーラブルなAI活用が、より患者中心のインテリジェントな医療ネットワークの実現を加速させるでしょう。

出典：AWS公式

AWS、Bedrock AgentCoreでSRE業務を高度化

2025年09月26日 Amazon AWS アシスタントエンジニア専門家経営者インフラデバッグエージェント MCP

AIアシスタントの仕組み

複数AIエージェントの連携

自然言語でのインフラ照会

リアルタイムでのデータ統合

障害対応手順書の自動実行

Bedrock AgentCoreの威力

既存APIをMCPツールに変換

対話履歴を記憶し応答を最適化

本番環境への容易な展開

本番グレードの監視機能を提供

詳細を見る

米Amazon Web Services(AWS)は、生成AI基盤「Amazon Bedrock」の新機能「AgentCore」を活用し、サイト信頼性エンジニアリング（SRE）業務を支援するマルチエージェントアシスタントの構築方法を公開しました。このシステムは、Kubernetesやログ、メトリクスなどを担当する複数の専門AIエージェントが連携し、自然言語での問い合わせに対して包括的かつ実用的な洞察を提供。インシデント対応の迅速化とインフラ管理の高度化を実現します。

なぜ今、SREアシスタントが求められるのでしょうか。現代の分散システムは複雑性が増し、障害発生時にはログ、メトリクス、イベントなど多様な情報源から原因を特定する必要があります。従来の手法では、SREが手作業で情報を繋ぎ合わせる必要があり、膨大な時間と労力がかかっていました。生成AIアシスタントは、このプロセスを自動化し、調査時間を劇的に短縮します。

このソリューションの中核は、スーパーバイザーエージェントが5つの専門エージェントを統括するマルチエージェントアーキテクチャです。問い合わせを受けると、スーパーバイザーが調査計画を立案し、Kubernetes、ログ、メトリクス、手順書（Runbook）の各専門エージェントに作業を割り振り。結果を集約して包括的なレポートを生成します。

技術的な鍵となるのが「Amazon Bedrock AgentCore」の各機能です。特に「Gateway」は、既存のインフラAPIをMCP（Model Context Protocol）という標準規格のツールに変換します。これにより、LangGraphのようなオープンソースのフレームワークで構築されたエージェントが、インフラAPIへシームレスかつ安全にアクセスできるようになります。

2025年09月18日 Anthropic Amazon Claude AWS ワークフロー Sonnet 推論

詳細を見る

Amazon Web Services（AWS）は、生成AIサービス「Amazon Bedrock」のバッチ推論ジョブを監視する新機能を発表しました。監視ツール「Amazon CloudWatch」と連携し、処理の進捗状況を詳細なメトリクスで追跡できます。これにより、利用者は大規模なAIワークロードのパフォーマンスやコストを正確に把握し、運用効率を最適化することが可能になります。 Amazon Bedrockのバッチ推論は、リアルタイム応答が不要な大規模データ処理に適した機能です。オンデマンド推論より50%低いコストで、履歴データ分析や大量のテキスト要約などを効率的に実行できます。今回の機能強化は、このコスト効率の高い処理の運用性をさらに高めることを目的としています。新機能では、Bedrockのバッチ推論ジョブに関するメトリクスがCloudWatchに自動で発行されます。これにより、カスタムの監視ソリューションを構築する手間なく、アカウントレベルでジョブの進捗を可視化できるようになりました。大規模ワークロードの管理がこれまで以上に容易になります。監視できる主要なメトリクスは4つです。「処理待ちトークン数」「処理待ちレコード数」でジョブの進捗を把握し、「毎分入力トークン処理数」「毎分出力トークン処理数」で処理速度を測定します。これらにより、性能とコストの定量的評価が可能になります。 AWSは監視機能のベストプラクティスも提示しています。トークン処理数からコストを予測・最適化する、スループットを監視して性能低下時にアラートを発する、処理待ちレコード数がゼロになったことをトリガーに後続ワークフローを自動起動する、といった活用が考えられます。 CloudWatchの機能を使えば、特定のしきい値を超えた際に通知を送るアラームを設定したり、関連メトリクスを一覧表示するダッシュボードを構築したりできます。例えば、トークン処理数が一定量を超えた際に運用チームへメール通知する、といった自動化が可能です。今回のアップデートでは、監視機能に加えて、バッチ推論がサポートするモデルも拡大されました。Anthropic社のClaude Sonnet 4などが追加されています。また、新しいモデルではバッチ処理のスループットも向上しており、より迅速な大規模処理が期待できます。

出典：AWS公式

AWSがGPT-OSS活用、エージェント構築加速へ

2025年09月17日 OpenAI Amazon AWS 生産性アシスタントワークフロー gpt-oss エンジニア専門家推論オープンウェイト GPU インフラデプロイエージェント

主要構成要素

OpenAIのGPT-OSS（オープンウェイトLLM）採用

モデルのデプロイ・管理にAmazon SageMaker AIを使用

エージェントの統合にAmazon Bedrock AgentCoreを活用

グラフベースのワークフロー構築にLangGraphを利用

システム設計の要点

複雑なタスクを専門エージェントに分業させる構造

高速推論を実現するvLLMサービングフレームワーク

スケーラブルでサーバーレスなエージェント運用基盤

低コストでの強力なオープンソースLLMの活用

詳細を見る

AWSは、OpenAIが公開したオープンウェイトの大規模言語モデル（LLM）である「GPT-OSS」を活用し、実用的なエージェントワークフローを構築する詳細なガイドを発表しました。Amazon SageMaker AIでモデルをデプロイし、Amazon Bedrock AgentCoreでマルチエージェントを統合運用するエンドツーエンドのソリューションです。これにより、複雑なタスクを自動化し、企業生産性を大幅に高める道筋が示されました。

このソリューションの核となるのは、高度な推論とエージェントワークフローに優れるGPT-OSSモデルです。MoE（Mixture of Experts）設計のこれらのモデルを、高速な推論フレームワークであるvLLMと組み合わせ、SageMaker AI上にデプロイします。この組み合わせにより、単一のGPU（L40sなど）上でも大規模なモデルを効率的に動かすことが可能となり、運用コストを抑えつつ高性能を実現しています。

現実世界の複雑なアプリケーションには、単なるLLM応答以上のワークフロー管理とツール利用能力が求められます。この課題を解決するため、グラフベースの状態管理フレームワークLangGraphを採用し、複数の専門エージェントの協調を設計しました。これらのエージェントは、Bedrock AgentCore Runtimeという統合レイヤー上でデプロイ・運用されます。

Amazon Bedrock AgentCoreは、エージェントのインフラストラクチャ管理、セッション管理、スケーラビリティといった重労働を抽象化します。開発者はロジックの構築に集中でき、エージェントの状態を複数の呼び出し間で維持できるため、大規模かつセキュアなAIエージェントシステムをサーバーレスで展開・運用することが可能になります。

具体例として、株価分析エージェントアシスタントが構築されました。このシステムは、データ収集エージェント、パフォーマンス分析エージェント、レポート生成エージェントの3つで構成されます。ユーザーの問い合わせに対し、専門化されたコンポーネントが連携し、株価データ収集から技術・ファンダメンタル分析、そして最終的なPDFレポート生成までを一気通貫で実行します。

このエージェントワークフローは、定型的な分析業務を自動化し、アナリストの生産性向上に大きく貢献します。処理時間の大幅な短縮に加え、スキルを持つ専門家が、より複雑な意思決定や顧客との関係構築といった高付加価値業務に注力できる環境を提供します。オープンソースLLMの力を最大限に引き出し、ビジネス価値に変える実践例です。

出典：AWS公式

Amazon Qがブラウザ拡張を投入。既存ワークフローで生産性を向上

2025年09月17日 Amazon AWS Chrome 生産性アシスタントワークフロー AI導入コンテンツセキュリティブランドコンテキスト

新機能の概要

Amazon Q Businessのブラウザ拡張機能

コンテキスト認識型AIを導入

ワークフロー中断の課題解消

主な利用効果

ウェブコンテンツの高速分析

外部情報連携による洞察獲得

複数の情報源を用いたコンテンツ検証

導入のメリット

意思決定プロセスの加速

企業データのシームレスな接続

Chrome/Edge/Firefoxに対応

詳細を見る

AWSは先日、企業向け生成AIアシスタント「Amazon Q Business」にブラウザ拡張機能を追加しました。これは、従業員が日常業務で利用するブラウザ内で、コンテキストを認識したAIアシスタンスを直接提供するものです。これにより、慣れたワークフローを中断することなく、企業データや外部情報に基づいた迅速な洞察抽出や意思決定が可能となり、組織全体の生産性の大幅な向上を目指します。

従来の生成AI導入における課題は、ユーザーがAI分析のために手動でデータを転送したり、慣れた環境を離れたりする必要がある点でした。本拡張機能は、こうした「摩擦」を解消します。ブラウザにAI機能を直接組み込むことで、業務中にAIを活用する機会を見逃すことなく、シームレスなサポートを受けられるのが最大の特長です。

具体的な活用事例として、ウェブコンテンツの分析が挙げられます。戦略部門や技術チームは、外部のレポートや競合分析、業界文書など、社外の断片的な情報から戦略的な洞察を導き出す必要があります。拡張機能を使えば、信頼できる内部・外部データを瞬時に統合し、トレンドの特定やインサイト生成を数秒で完了できます。

また、コンテンツ品質の改善にも大きく寄与します。通常、生成AIアシスタントがアクセスできない複数の外部データソースや、ウェブベースのスタイルガイドを含めたクエリが可能です。これにより、コンテンツのリアルタイムな検証が可能となり、多様な情報源に基づいた高品質なコンテンツ作成プロセスを加速させることができます。

導入には、Amazon Q BusinessのアプリケーションとWeb Experienceの設定が必要です。管理者は、Chromium（Chrome、Edge）やFirefoxに対応した拡張機能を一括で展開でき、さらに企業のブランドに合わせてアイコンや名称をカスタマイズすることも可能です。これにより、組織への浸透と迅速な導入をサポートします。

セキュリティ面では、Amazon Q Businessはユーザーの会話データをLLMのトレーニングには使用しません。会話はアプリケーション内に30日間のみ保存され、ユーザーはこれを削除することも可能です。このデータ管理方針は、機密情報を扱う企業ユーザーにとって重要な安心材料となります。

出典：AWS公式

QuoraのPoe、AWS BedrockでAIモデル統合を96倍高速化

2025年09月16日 Amazon AWS Poe 生産性エンジニア認証画像動画デプロイ投資基盤モデル

開発生産性の劇的向上

デプロイ時間を96倍高速化（数日→15分）。

必須コード変更を95%削減。

テスト時間を87%短縮。

開発リソースを機能開発へ集中。

統一アクセスレイヤーの構築

異なるAPI間のプロトコル変換を実現。

設定駆動型による迅速なモデル追加。

認証（JWTとSigV4）のブリッジング機能。

マルチモデル戦略の強化

30以上のテキスト/画像モデル統合。

設定変更でモデル能力を拡張可能に。

詳細を見る

QuoraのAIプラットフォーム「Poe」は、Amazon Web Services（AWS）と協業し、基盤モデル（FM）のデプロイ効率を劇的に改善しました。統一ラッパーAPIフレームワークを導入した結果、新規モデルのデプロイ時間が数日からわずか15分に短縮され、その速度は従来の96倍に達しています。この成功事例は、複数のAIモデルを大規模に運用する際のボトルネック解消法を示しています。

Poeは多様なAIモデルへのアクセスを提供していますが、以前はBedrock経由の各モデルを統合するたびに、独自のAPIやプロトコルに対応する必要がありました。Poeはイベント駆動型（SSE）、BedrockはRESTベースであり、この違いが膨大なエンジニアリングリソースを消費し、新しいモデルの迅速な提供が課題となっていました。

AWSのGenerative AI Innovation Centerとの連携により、PoeとBedrockの間に「統一ラッパーAPIフレームワーク」を構築しました。この抽象化レイヤーが、異なる通信プロトコルのギャップを埋め、認証や応答フォーマットの違いを吸収します。これにより、「一度構築すれば、複数のモデルを展開可能」な体制が確立されました。

この戦略の結果、新規モデルを統合する際の必須コード変更量は最大95%削減されました。エンジニアの作業内容は、以前の65%がAPI統合だったのに対し、導入後は60%が新機能開発に集中できるようになりました。この生産性向上により、Poeはテキスト、画像、動画を含む30以上のBedrockモデルを短期間で統合しています。

高速デプロイの鍵は、「設定駆動型アーキテクチャ」です。新しいモデルの追加には統合コードの記述は不要で、設定ファイルへの入力のみで完結します。さらに、Bedrockが導入した統一インターフェース「Converse API」を柔軟に活用することで、チャット履歴管理やパラメーター正規化が容易になり、統合作業がさらに簡素化されました。

本フレームワークは、マルチモーダル機能の拡張にも貢献しています。例えば、本来テキスト専用のモデルに対しても、Poe側が画像を分析しテキスト化することで、擬似的な画像理解能力を付与できます。これにより、基盤モデルのネイティブな能力によらず、一貫性のあるユーザーエクスペリエンスを提供可能になりました。

本事例は、AIモデル活用の競争優位性を得るには、個別のモデル連携に時間を使うのではなく、柔軟な統合フレームワークへの初期投資が極めて重要であることを示唆しています。抽象化、設定駆動、堅牢なエラー処理といったベストプラクティスは、AIを大規模展開し、市場価値を高めたい組織にとって必須の戦略となるでしょう。

出典：AWS公式

AIで人事業務を変革。msgがBedrock活用し高精度な人材配置を実現

2025年09月15日 Amazon AWS 検索推論インフラクラウドクラウドサービスコンプライアンス欧州ドイツ人事ベンチマーク SaaS

導入の背景と目的

HRデータが非構造化・断片化

候補者マッチングやスキル分析の非効率

人員配置・人材育成の迅速化が急務

Bedrock活用の仕組み

AWS BedrockによるLLM駆動のデータ連携

ハイブリッド検索アプローチで精度向上

SaaSソリューションmsg.ProfileMapの中核機能

経営インパクトと実績

マニュアル検証作業を70%以上削減

高確度な統合提案の精度95.5%達成

詳細を見る

ドイツのITサービス企業msgは、Amazon Bedrockを導入し、人事部門におけるデータ連携（ハーモナイゼーション）の自動化に成功しました。これにより、従業員のスキルや能力に関する断片的なデータを高精度で統一。手作業による検証負荷を70%以上削減し、人材配置や育成計画の精度を大幅に向上させています。

多くの企業が直面するのは、HRデータが非構造化文書やレガシーシステムに散在し、フォーマットが不整合である点です。このデータの「不協和音」が、候補者マッチングやスキルギャップ分析を妨げていました。msgは、この課題を解決するため、スケーラブルで自動化されたデータ処理基盤の構築を目指しました。

msgのスキル・能力管理SaaS「msg.ProfileMap」は、多様な入力データを抽出し、AI駆動の調和エンジンに送ります。ここではAmazon BedrockのLLMが活用され、異なるテキスト記述であっても意味的な一致性（セマンティック・エンリッチメント）を確保。重複を防ぎ、一貫性のあるデータへと変換します。

このAI駆動のデータ調和フレームワークは高い効果を発揮しました。社内テストでは、高確率で統合すべき推奨概念について95.5%という高精度を達成しています。また、外部の国際的なベンチマーク（OAEI 2024 Bio-ML）においてもトップクラスのスコアを獲得し、その汎用性の高さを証明しました。

msgがAmazon Bedrockを選定した主な理由は、低遅延な推論実行、柔軟なスケーリング、および運用上のシンプルさです。サーバーレスな完全マネージド型サービスであるため、インフラ管理のオーバーヘッドが不要。消費ベースの課金体系がSaaSモデルに適し、迅速な拡張を可能にしました。

さらに、Bedrockは欧州連合（EU）のAI法やGDPR（一般データ保護規則）などの厳格なコンプライアンス要件を満たす上で重要な役割を果たしました。msgの事例は、複雑なインフラを構築せずに、生成AIとクラウドサービスを組み合わせることで、高精度かつコンプライアンス対応可能なプラットフォームが実現することを示しています。

出典：AWS公式

SageMaker HyperPod、LLM学習の通信遅延を解消するトポロジー認識型スケジューリング導入

2025年09月15日 Amazon AWS 生産性ネットワークエンジニア GPU データセンター

導入された新機能の概要

物理的配置を考慮するトポロジー認識型スケジューリング

大規模AIワークロードの最適化を目的

Amazon EKSクラスター上でのリソース管理を効率化

LLM学習効率化への貢献

データセンター内のネットワーク遅延を最小化

ネットワークホップ削減による通信速度の向上

GPUクラスターの利用効率とスループットを改善

活用方法と技術要件

Kubernetesマニフェストでの必須/推奨トポロジー設定

SageMaker HyperPod CLIからのジョブ送信に対応

Task Governanceアドオン（v1.2.2以降）が必要

詳細を見る

Amazon Web Services（AWS）は、大規模な生成AI（LLM）モデルのトレーニング効率を飛躍的に向上させるため、Amazon SageMaker HyperPodのタスクガバナンス機能に「トポロジー認識型スケジューリング」を導入しました。この新機能は、GPUインスタンス間のネットワーク通信遅延という、LLM学習における最大のボトルネックの一つを解消します。

生成AIワークロードは通常、Amazon EC2インスタンス間で広範な通信を必要とし、ネットワーク帯域幅と遅延が学習時間全体に大きく影響します。データセンター内のインスタンス配置は階層的な構造を持っており、同じ物理単位内に配置されたインスタンス間の通信は、異なる単位間の通信よりもはるかに高速になるため、配置最適化が重要でした。

このトポロジー認識型スケジューリングは、EC2のネットワークトポロジー情報を活用し、ジョブ提出時に物理的な近接性を考慮してリソースを割り当てます。具体的には、クラスター内のインスタンスの配置をネットワークの階層構造（レイヤー1〜3）に基づいて把握し、通信頻度の高いポッドを最も近いネットワークノードに集中配置します。

企業にとっての最大のメリットは、AIイノベーションの加速と市場投入までの時間（Time to Market）の短縮です。タスクガバナンス機能により、管理者やデータサイエンティストはリソース調整に時間を費やすことなく、効率的に計算リソースを利用できます。これは大規模なGPUクラスターを持つ組織全体の生産性向上に直結します。

エンジニアは、この新機能をKubernetesマニフェストファイルを通じて簡単に利用できます。ジョブ実行時に、全てのポッドを同一ネットワークノードに配置することを「必須（required）」とするか、「推奨（preferred）」とするかを選択可能です。また、SageMaker HyperPod CLIからもトポロジー指定パラメータを用いてジョブを送信することができ、柔軟な運用が実現します。

出典：AWS公式

AWS（プロダクト）に関するニュース一覧

AWS（プロダクト）に関するニュース一覧

新GPUインスタンス

検索と学習の強化

事業転換の中身

新CEOの戦略

3つの脆弱性連鎖

実害と影響

対策の要点

相次ぐ脆弱性

共通の根本原因

外販方針の転換

Nvidiaとの競争

資金調達の規模

出資陣とクラウド戦略

創業者と世界モデル

発表の柱

主な機能

SDKの中身

実機への展開

大手AI依存からの脱却

競合と差別化戦略

攻撃の手口と被害

Microsoftの対応と背景

障害の経緯

反響と各社の見解

基盤モデルへの転換

大手金融の採用状況

エコシステムの整備

提供開始の概要

企業導入の狙い

今後の展開

AI番組化の経緯

原作者の主張と反応

OpenSearch新世代

業界全体の転換

過去最大級の資金調達

計算資源の大規模確保

SpaceXとの契約に食い違い

準ランダム型設計の突破口

大幅なコスト削減効果

世界展開の現状

先物市場の動き

市場形成の背景

大型契約の背景

クラウド各社のチップ競争

メルクの実装事例

マスターカードの挑戦

共通する教訓

プラットフォームの技術的特徴

大手に挑むベンダー中立戦略

侵害の経緯と影響

連鎖するサプライチェーン攻撃

史上最大級のAI半導体IPO

OpenAI・AWSとの大型契約

残る経営リスク

提携初期の内部対立

関係変化の転機

現在への示唆

相次ぐ大型投資・提携

AI以外の注目動向

爆発的な収益成長

計算資源の確保に奔走

評価額1兆ドル視野

規制転換の背景

新たな安全体制

実験から本番への壁

AI工場という解決策

シャドーAIの脅威

Agent 365の主要機能

段階的導入モデル

契約の全体像

Anthropic排除の背景

軍のAI活用の現状

イベント駆動型の自律実行

ガバナンスと市場戦略

契約再編の骨子

収益構造の変化

調達と構造の二重のムダ

改善への具体策