Codexに関する最新ニュース（160件） | 【AI Times】生成AIやLLMの最新情報・ニュース

OpenAI、初の自社推論チップをBroadcomと公開

2026年06月24日 Google OpenAI NVIDIA マイクロソフト Meta Amazon ChatGPT Codex ネットワーク GPT-5 推論事前学習半導体 GPU TPU データセンターエネルギー ASI コーディング提携

チップの概要

Jalapeñoと名付けた初の自社チップ

推論専用のASIC設計

現行・将来のLLM向けに最適化

性能と狙い

電力当たり性能が従来最高水準を大幅超

設計から量産までわずか9カ月

Nvidia依存の低減が狙い

今後の展開

2026年末からギガワット規模で配備

複数世代の計算基盤の第一歩

詳細を見る

OpenAIは2026年6月24日、半導体大手Broadcomと共同開発した初の自社AIチップ「Jalapeño（ハラペーニョ）」を公開しました。同チップはAIの推論処理に特化したASIC（特定用途向け集積回路）で、ChatGPTやCodexなどのサービスを動かすサーバー向けに設計されています。早期テストでは、電力当たりの性能が現行の最高水準を大幅に上回る見込みだと説明しました。

Jalapeñoは、汎用チップを転用したものではなく、LLMの推論に最適化してゼロから設計された点が特徴です。OpenAIがモデルやサービング系の知見をもとにチップアーキテクチャを設計し、Broadcomがシリコン実装やネットワーク技術、Celesticaが基板やラックなどのシステム統合を担いました。試作チップはすでに研究室で量産想定の周波数と電力でMLワークロードを実行しており、コーディング向けの「GPT-5.3-Codex-Spark」も動作しているといいます。

今回の最大の狙いは、Nvidia製GPUへの依存を減らすことにあります。Nvidiaのチップは供給が限られており、OpenAIは自社設計によって推論コストの引き下げと安定供給を目指します。BroadcomのHock Tan最高経営責任者（CEO）はReutersのインタビューで、JalapeñoはNvidiaの「Blackwell」やGoogleのTPUに匹敵する性能だと述べました。

開発スピードも注目点です。OpenAIとBroadcomの提携は2025年10月に発表されており、設計から製造のテープアウトまでわずか9カ月で到達しました。OpenAIは、これを高性能半導体で過去最速のASIC開発サイクルだと位置づけ、自社のAIモデルが設計や最適化の一部を支援したと説明しています。

Jalapeñoは複数世代にわたる計算基盤の第一歩にすぎません。Hock Tan CEOは、Microsoftをはじめとするパートナーと組み、2026年からギガワット規模のデータセンター展開を可能にすると述べました。初期配備は2026年末を見込み、以降数世代にわたって拡張していく計画です。

MicrosoftやMeta、Amazonなども自社向けAIチップを相次いで投入しており、推論の効率化はAIの経済性を左右する鍵になりつつあります。事前学習などの重い処理は引き続きNvidia製ハードに頼るとみられますが、推論コストのわずかな削減でもOpenAIの収益改善に大きく寄与する可能性があります。

出典：OpenAI公式 | The Verge | TechCrunch

旅行予約OmioがOpenAIで開発工数8割減

2026年06月23日 OpenAI ChatGPT Codex 検索ネットワークエンジニアコーディング欧州

対話で旅程を予約

3000社超の交通事業者と接続

47カ国を網羅する移動ネットワーク

ChatGPTで自然言語の経路検索

実在する予約可能な旅程を提示

社内のAIネイティブ化

全エンジニアがCodexを活用

開発工数を従来比約20%に削減

四半期規模の案件を約1カ月に

意思決定の責任は人が保持

詳細を見る

欧州の複合交通予約大手Omioは2026年6月23日、OpenAIと連携し、対話型AIによる旅行体験の構築と社内業務の変革を進めていると明らかにしました。同社は世界3000社超の交通事業者と接続し、47カ国で鉄道・バス・フェリー・航空便を仲介しています。利用者が行き先を伝えるだけで、予約可能な旅程を受け取れる仕組みを目指しています。

対顧客面では、Omioは2023年にChatGPT経由で利用できる早期の旅行体験の一つを公開しました。「ローマからフィレンツェへの最速ルートは」といった自然言語の質問に対し、ChatGPTをリアルタイムの運行・価格データに接続して回答します。最近では自社の交通ネットワークと結んだ専用のChatGPT体験へと拡張しています。

社内では、まず全社員にChatGPTを展開し、その後コーディング支援AIのCodexをエンジニアリングの工程へ深く組み込みました。CTOのトマス・ボツェトカ氏は「ChatGPTは前哨戦だった。本当の仕事はCodexで進む」と語っています。現在は全エンジニアが調査から計画、コーディング、テスト、レビュー、保守までCodexを使うといいます。

この取り組みは製品開発の速度を大きく変えました。Omioは多くの製品を従来の約20%の時間で構築できると見積もります。ボツェトカ氏は「複数の開発者が四半期かけていた案件を、今は1人が約1カ月でこなせる」と述べ、実験や意思決定の高速化につながったとしています。

一方で同社は責任ある運用を原則に掲げています。「責任と説明責任は人に残る。AIは開発や分析、意思決定を速めるが、主導権を握るのは人だ」と強調します。AIツールへの広いアクセスと統制、人による監督を組み合わせ、人が成果に責任を持つ運用モデルを築いているとしています。

出典：OpenAI公式

OpenAI、Codexを長時間作業の作業基盤と位置づけ

2026年06月22日 OpenAI Codex ワークフローエンジニア経営者プロンプト

公開された指針

単一プロンプトを超える長時間作業支援

Jason Liu氏執筆の実践指針

Codexを持続的作業空間に活用

文脈保持と複雑な作業管理

実践のポイント

目標を検証可能な手順へ分解

複数業務を横断した継続性確保

委任と人の監督の判断基準

詳細を見る

米OpenAIは6月22日、対話AIのCodexを単一のプロンプトを超える長時間作業の基盤として使うための実践指針をまとめたホワイトペーパーを公開しました。Jason Liu氏が執筆し、文脈を保持しながら複雑なワークフローを管理し、長期にわたるプロジェクト全体で進捗を持続させる方法を、組織でAIを活用するリーダー向けに示しています。

中心となる考え方は、Codexを一度きりの応答ツールではなく、持続的な作業空間として扱う点です。組織が単一のやり取りで完結しない業務にAIを使う場面が増えていることを背景に、文脈の引き継ぎを重視しています。

実践面では、野心的な目標を検証可能な手順へ分解し、複数の業務ライン間で継続性を保つ手法が紹介されています。大きなゴールを段階的に進めることで、長期作業でも方向性を見失いにくくなるという狙いです。

もう一つの焦点は、実行をCodexに委ねる場面と、人の監督が最も価値を持つ場面の見極めです。すべてを自動化するのではなく、判断の境界を意識した使い分けを促しています。

詳細はOpenAIが公開したPDF版のガイドで読むことができます。長期的な開発や運用にAIを組み込みたい経営者やエンジニアにとって、実務的な参照点となりそうです。

出典：OpenAI公式

OpenAIがDaybreak拡張、OSS脆弱性を大規模修正

2026年06月22日 OpenAI Anthropic Codex GPT-5 エンジニア専門家脆弱性パッチインフラセキュリティ開発ツール日本オーストラリア

新サービスの中身

脆弱性発見から修正まで自動化

GPT-5.5-Cyber正式版を提供

Codex Security機能を更新

防御者向け限定アクセス

OSS脆弱性に集中投下

Trail of Bitsと共同設立

OSS30件超が参加表明

初週で数百件の不具合発見

専門家が人手で検証

詳細を見る

OpenAIは6月22日、サイバー防御の取り組みDaybreakを拡張すると発表しました。AIモデルで脆弱性の発見から修正までを高速化し、防御側に能力を行き渡らせるのが狙いです。あわせてオープンソース支援策「Patch the Planet」、専用モデルの新版、開発ツール向けプラグイン、企業連携プログラムを公開しました。

中核となるのが専用モデルGPT-5.5-Cyberの正式版です。既知の脆弱性を再現できるかを測る指標CyberGymで85.6%を記録し、通常版の81.8%を上回りました。Wiredによれば、この数値はAnthropicが米政権の輸出規制で撤回したMythos 5の83.8%も超えており、両社のサイバーAI競争を象徴する形となっています。

開発者向けには「Codex Security」プラグインを更新しました。コードベースを深く走査して脆弱性を検出し、影響範囲の特定や修正パッチの生成、検証までを担います。研究プレビュー開始以降、3000万件超のコミットと3万を超えるコードベースを走査し、50万件以上の修正を確認したといいます。

オープンソース支援策「Patch the Planet」は、セキュリティ企業Trail of Bitsと共同で設立しました。HackerOneやCalifとも連携し、人手不足に悩む保守担当者に専門家と高度なモデルを無償で提供します。cURLやGo、Pythonなど30以上のプロジェクトが参加を表明しています。

AIによる脆弱性発見が加速する一方、保守担当者は質の低い誤検知報告の山に追われてきました。同プログラムは専門研究者が報告を事前に検証・重複排除し、保守側の負担を軽減します。初週の5日間スプリントでは数百件の問題を洗い出し、数十件のパッチを統合しました。

OpenAIは各国政府との連携も拡大しています。日本やオーストラリア、カナダなどと信頼アクセスの枠組みを結び、重要インフラの防御強化に取り組む方針です。攻撃者より先に脆弱性を見つけて塞ぐ、防御主導の体制づくりが進んでいます。

出典：OpenAI公式 | WIRED | OpenAI公式

OpenAI、法人向けにAI利用分析と支出管理機能を追加

2026年06月18日 OpenAI ChatGPT Codex AI活用 AI導入投資

新しい利用分析

クレジット利用の一元可視化

ユーザー・製品・モデル別の内訳

利用と支出の傾向把握

Cost APIでの外部分析対応

柔軟な支出管理

ワークスペース全体の既定上限設定

グループ・個人別の上限調整

従業員による追加申請機能

詳細を見る

米OpenAIは6月18日、法人向けプラン「ChatGPT Enterprise」に新しいクレジット利用分析と支出管理機能を追加したと発表しました。管理者は利用状況や導入の広がり、支出を明確に把握でき、AI活用を重要な事業投資と同じ厳格さで管理できるようになります。本日から利用可能です。

中核となるのが「Global Admin Console」での利用分析です。ChatGPTとコード生成支援「Codex」のクレジット消費を一つの画面に統合し、ユーザー・製品・モデル別に細かく内訳を確認できます。これにより、価値ある業務による利用増加と、精査が必要な利用パターンを見分けやすくなります。

管理者は利用とクレジットの推移を時系列で追い、主要ユーザーや新たな消費傾向を特定できます。同じデータは統合Cost API経由でも取得でき、各社のシステムに取り込んでより深い分析が可能です。

支出管理も強化されました。同社は年初にカスタムロール向けのクレジット利用上限を導入済みでしたが、今回はワークスペース全体の既定上限の設定に加え、特定グループへの上限設定や個人単位の上書きにも対応します。

従業員は自分の予算に対する利用状況を確認し、必要に応じて追加クレジットを申請できます。その際に作業内容を添えられるため、管理者は状況を踏まえて判断できます。全員の上限を引き上げることなく、一部のヘビーユーザーが業務を止めずに作業を続けられる仕組みです。

これらの機能で企業は大規模なAI導入をより慎重かつ柔軟に進められます。管理者は本日から利用を開始でき、対象ワークスペースの利用者も設定画面から自分のクレジット利用を確認できます。

出典：OpenAI公式

AI最適化Arbor、Codexら2.5倍上回る

2026年06月18日マイクロソフト Claude Claude Code Codex 検索 AI活用エンジニアコーディング中国エージェント

性能の成果

検証可能な改善が2.5倍以上

検索精度45%→67%

既存エージェントは50%台で停滞

MLE-Bench Liteで最高成績

仕組み

仮説を木構造で蓄積学習

司令役と実行役の役割分離

テスト合格時のみ統合するマージゲート

詳細を見る

中国人民大学とMicrosoft Researchの研究者は、AIシステムの自律最適化を担う新フレームワークArborを発表しました。試行錯誤の繰り返しを、過去の失敗から学んで改善を積み上げる累積的な学習プロセスへと引き上げる狙いです。実環境のエンジニアリング課題で、同じ計算資源のもとCodexやClaude Codeの2.5倍以上の検証可能な性能向上を実現しました。

従来のコーディングAIは各試行を独立して扱い、得た知見が会話履歴に埋もれて失われる弱点がありました。タスクが数百ターンに及ぶと文脈の上限を超え、初期の失敗で行き詰まるか、評価のぶれに振り回されてしまいます。複数の研究方針を同時に保持し比較する仕組みも欠いていました。

Arborは戦略立案と実装作業を分けて解決します。コーディネーターと呼ぶ司令役が仮説と方針を管理し、自身はコードを直接編集しません。実際の実装と評価は短命のエグゼキューターが担い、独立したgitワークツリー上で一つの仮説だけを検証して結果を報告します。

中核となるのが仮説ツリー精緻化(HTR)です。仮説・成果物・事実証拠・抽出した洞察を結びつけた節点を枝分かれさせ、失敗した実験は負の制約として記録します。これにより同じ誤りの反復を防ぎ、複数の競合する方針を安全に並行探索できます。

過剰適合を防ぐため、HTRは厳格なマージゲートを設けます。開発スコアが高くても、別の評価データで実際に改善が確認できなければ統合しません。検索エージェント課題では精度を45.33%から67.67%へ高め、50%台で止まったCodexやClaude Codeを大きく上回りました。

企業のAI活用では、複雑な実システムの継続的改善を自動化できる点が直接の価値となります。あなたの開発チームが抱える最適化のボトルネックも、こうした構造化された記憶を持つ手法で解きほぐせるかもしれません。

出典：VentureBeat

Vercel、AIエージェント向け基盤に全面転換

2026年06月17日 OpenAI Anthropic Vercel Amazon Claude Claude Code Codex 認証コーディングデプロイエージェント ElevenLabs

発表の柱

ロンドンで開催の年次イベント

エージェント特化の基盤戦略

新フレームワークeveを公開

外部接続を担うVercel Connect

企業向け強化

7月開始のVercel Services

自律監視するVercel Agent

Python等バックエンド対応拡大

詳細を見る

Vercelは6月17日、英ロンドンで年次イベントVercel Ship 2026を開催し、AIエージェント向けに設計した基盤への全面転換を打ち出しました。来場者は2,500人を超え、CEOのギレルモ・ラウク氏は「考えるソフトウェアをデプロイする」と表明しました。同社はWeb構築のあり方を主導してきた実績を、今後はエージェント領域で再現する構えです。

中核となるエージェント基盤は三つの柱で構成されます。第一に、Claude CodeやCodexなどのコーディングエージェントがコードを展開する場としての役割です。第二に利用者自身がエージェントを構築・運用する場、第三にVercel自体が運用をエージェントで自動化する仕組みで、障害の検知から修正のプルリクエスト提示までを担います。

新たに公開したのは、エージェント構築用のオープンソース基盤eveです。指示をマークダウン、ツールをTypeScriptで記述し、単一ディレクトリで本番運用できる点が特徴です。あわせて、長期保存の認証情報を残さず一時的な権限で外部システムへ安全に接続するVercel Connectも発表しました。

企業向けでは、7月1日提供開始のVercel Servicesでマイクロサービスを正式対応とし、サービス間が公開インターネットを介さず通信できるようにします。さらに本番環境を自律監視し、異常を調査して修正案を提示するVercel Agentを限定ベータで投入しました。読み取り専用を既定とし、本番操作前に限定的な権限承認を求める設計です。

基盤面ではFastAPIやFlask、Expressといったバックエンドフレームワークや、Amazon Auroraなどのデータベース対応も拡大しました。会場ではAnthropicやOpenAI、ElevenLabsなどの登壇者が実装事例を紹介し、Vercelの社内支援エージェントがサポート対応の91%を自動化した実績も示されました。次回はベルリンやニューヨークなどでの開催を予定しています。

出典：vercel.com

NVIDIA、AIエージェントがロボットを自律訓練

2026年06月17日 OpenAI Anthropic NVIDIA Claude Claude Code Codex GPT-5 Opus GPU ハードウェアロボットコーディングエージェント

自律訓練の仕組み

AIコーディングエージェントがロボット訓練を自律実行

結束バンド切断とGPU装着を習得

成果上がる変更のみ保持し反復改善

ENPIREの構成

NVIDIA GEARとCMU・UCバークレーが開発

リセット・検証・評価・失敗分析の4機能

複数ロボットの並列評価

公開と展望

3社のコーディングエージェントで検証

全要素のオープンソース化を表明

詳細を見る

NVIDIAのGEAR研究所は2026年6月、AIコーディングエージェントがロボットの訓練を自律的に指揮する新たな枠組み「ENPIRE」を発表しました。カーネギーメロン大学とカリフォルニア大学バークレー校が共同開発したこの仕組みでは、エージェントが訓練手順を自ら考案し、ロボットに結束バンドの切断やマザーボードへのGPU装着といった精密な作業を習得させました。

ENPIREは、AIモデルにツール利用や記憶・制約・フィードバックの機能を与える「エージェントハーネス」と呼ばれるソフトウェアです。具体的には4つのモジュールで構成され、作業の自動リセットと検証、ロボットの行動指針となる方策の改良、複数の実機を並列で動かす評価、そしてログ解析や論文の取り込みによる失敗対応を担います。

訓練は人手を介さず反復します。エージェントは独自のアルゴリズムを考えて実機で試し、成功率を高めた変更だけを残すサイクルを自己主導で繰り返します。NVIDIAでAI担当ディレクターを務めるジム・ファン氏は「研究所の一部が夜通し自己改善し、朝に報告書を読むだけだ」とLinkedInに投稿しました。

検証には3社のエージェントが使われました。OpenAIのGPT-5.5を用いたCodex、AnthropicのOpus 4.7を用いたClaude Code、Moonshot AIのKimi K2.6を用いたKimi Codeです。チームを組んだエージェントが互いに異なる訓練手法を独立して編み出し、実験で比較しました。

ファン氏はすべてをオープンソース化する方針を示し、誰もが自宅で「自走するロボット研究所」を持てるようにすると述べました。技術的な詳細は6月16日に公開された研究論文にまとめられています。AIが自らハードウェアの訓練を回す時代が、研究現場で現実味を帯び始めています。

出典：Ars Technica

SpaceX、Cursorを600億ドルで買収しAIコーディング参入

2026年06月16日 Google OpenAI Anthropic Amazon xAI Codex 投資家インフラコーディングイーロン・マスク投資買収評価額 IPO Cursor SpaceX

600億ドル買収

全株式によるCursor 買収

第3四半期に取引完了見込み

xAI統合でAI事業を強化

AnthropicとOpenAIを追撃

IPO後の急騰

史上最大857億ドル調達

一時Amazonの時価総額超え

評価額が2.9兆ドル到達

詳細を見る

SpaceXは6月16日、AIコーディングツールを手がけるCursorを600億ドルの全株式取引で買収すると発表しました。これは同社が史上最大規模のIPOを実施したわずか数日後の動きで、取引は2026年第3四半期に完了する見込みです。Elon Musk氏率いる同社は、AI事業でAnthropicやOpenAIに追いつくことを狙っています。

買収の背景には、今年初めにSpaceXと統合したMusk氏のAI企業xAIの立て直しがあります。xAIのコーディング製品はAnthropicのクロードコードやOpenAIのCodexに後れを取っており、Musk氏は自社製品の出来に不満を表明していました。Visual Studio Codeを基盤に早くからLLMを統合したCursorの取得で、この差を縮める狙いです。

Cursorは2022年にAnysphereとして創業し、AIコーディング需要の高まりで急成長しました。しかしクロードコードの台頭で市場シェアを落とし、損益分岐点に届かず苦戦していたと報じられています。SpaceXは4月、600億ドルでの買収か10億ドルの違約金支払いかを選ぶという異例の契約を結び、IPO完了まで取引を保留していました。

IPOの規模は突出していました。SpaceXは5億5560万株を1株135ドルで売り出し、最終的に857億ドルを調達しました。これは史上最大のIPOであり、Musk氏は世界初の兆万長者となりました。上場初日に株価は20%上昇し、その後も上昇を続けています。

Cursor 買収の発表とオプション取引の開始を受け、SpaceXの評価額は一時2.9兆ドルまで急騰し、Amazonを抜いて世界第5位の高評価企業となりました。ただし同社は昨年、187億ドルの売上に対し49億ドルの赤字を計上しており、利益を出すAmazonとは対照的です。

SpaceXは投資家に対し、AIインフラで2.4兆ドル、企業向けアプリケーションで22.7兆ドルという巨大な市場機会を提示しました。AnthropicやGoogleとの計算資源リース契約も新たな収益源としており、Cursorの買収はこれらの約束を実現するための中核的な一手と位置づけられています。

出典：TechCrunch | Ars Technica | TechCrunch | TechCrunch | The Verge

NewCoreがAIエージェント用ID基盤で66億円調達

2026年06月15日 OpenAI Anthropic マイクロソフト Claude Claude Code Codex 創業者クラウドセキュリティ認証コーディング米国投資評価額エージェント Cursor Devin

調達と評価額

シード調達66百万ドル

Cyberstarts主導

投資後評価3億ドル

ステルス脱却

事業内容

人とAIの統合ID管理

エージェントを正規ID扱い

split-key方式で単一障害点排除

夏に有料提供開始

詳細を見る

サイバーセキュリティ新興企業のNewCoreが6月15日、ステルスを脱却し6600万ドルのシード資金を調達したと発表しました。ラウンドはCyberstartsが主導し、Index VenturesやEvolution Equity Partnersも参加、投資後の企業価値は3億ドルと評価されました。企業がAIエージェントを大規模導入する際の認証・統制という課題の解決を狙います。

背景にあるのは、AIエージェントを単なるソフトではなく職場の一員として扱う動きの広がりです。Goldman SachsはAIコーディングエージェントのDevinを新入社員として試験運用し、McKinseyは6万人の従業員と並んで2万5000体のAIエージェントが既に働いていると述べています。NewCoreは、こうしたデジタル労働者を人間の従業員と同様に管理する必要が出てくると見ています。

共同創業者でCEOのZohar Alon氏は、既存のID基盤がAIエージェント時代に適さないと指摘します。同氏はクラウドセキュリティ企業Dome9を創業しCheck Pointに売却した経歴を持ち、「15年や20年前のID基盤は、AIエージェントが加える規模と複雑さで確実に崩壊する」と語りました。CTOには元Unit 8200のAmihai Neiderman氏、CCOには元T-Mobile USAのCIOであるErez Yarkoni氏が名を連ねます。

NewCoreの基盤は、人間とAIエージェントの双方のIDを単一システムで管理する設計です。AIエージェントを従来のサービスアカウントではなく、独自の権限やライフサイクル制御、失効機能を持つ第一級のIDとして扱います。重要な認証情報を顧客と基盤側で分割するsplit-key方式を採用し、単一の侵害点をなくす狙いです。

OktaやMicrosoftのEntraなど既存ベンダーもAIエージェント対応を進めますが、Alon氏は人間向け基盤を拡張したものにすぎず統合されていないと批判します。NewCoreはAnthropicのClaude CodeやOpenAIのCodex、Cursorといったコーディング支援ツール向けに連携パッケージを提供し、これらが手動の認証情報配布ではなく管理されたIDとして社内システムにアクセスできるようにします。従業員は専用モバイルアプリで権限の付与・確認・失効を行えます。

同社は米国とイスラエルで従業員50人超に成長し、現在は10社未満の顧客と10社超の設計パートナーが利用、この夏から課金を始める予定です。Alon氏は技術系組織ではAIエージェントが人間の従業員数を上回る可能性があると予測し、TCS会長も同様の見方を示しています。同氏は「AIエージェントが労働力の大きな部分になるのは避けられない。問題は、間に合うようガードレールを築けるかだ」と述べました。

出典：TechCrunch

Preply、OpenAIで語学指導を個別最適化

2026年06月12日 OpenAI ChatGPT Codex エンジニア創業者コーディング

導入の成果

週次利用率95%到達

講師の7割超が機能活用

満足度4.7／5を獲得

授業後の自動分析

授業記録から個別添削

文法・語彙・発音を評価

宿題エンジンと連携

人間とAIの協業

講師の準備時間半減

人間主導でAI支援

詳細を見る

オンライン語学学習で世界最大規模のPreplyは2026年6月12日、OpenAIのAPIを活用した新機能「Lesson Insights」の成果を公表しました。180以上の国・地域で10万人超の講師と学習者をつなぐ同社が、1対1の授業を個別最適化された学びへと変える狙いです。

Lesson Insightsは、学習者の同意のもとで録音・文字起こしした授業内容をOpenAIが分析し、文法・語彙・発音にわたる個別フィードバックを生成します。授業終了から数分以内に、要点のまとめや次の学習ステップを含む報告書がチャットに届く仕組みです。これらの知見は同社の自習用エンジンに直接流れ込み、一人ひとりに合わせた宿題へと変換されます。

Preplyは技術パートナー選定で複数のAIモデルを評価し、速度や信頼性、実運用への対応力からOpenAIを採用しました。共同創業者でCTOのドミトロ・ボロシン氏は「最先端のモデルが顧客の課題を解決してくれる。今や事業運営の中心にある」と語ります。社内ではChatGPT Enterpriseを600人超の従業員に展開し、週次利用率を60%から95%へ引き上げました。

効果は講師の業務にも及びます。これまで宿題や教材の作成に数時間かけていた講師は、その時間を半分以下に短縮できたと証言しています。さらにエンジニアの約94%がCodexなどのAIコーディング支援を使い、コード生成やレビューを効率化している点も特徴です。

同社は今後、学習者の目標や進捗、強みを数カ月単位で把握し、継続的に適応する学習体験の構築を目指します。Preplyが掲げる将来像は「人間かAIか」ではなく、人間主導でAIが支える語学学習です。

出典：OpenAI公式

OpenAIがOnaを買収しCodexのクラウド基盤を強化

2026年06月11日 OpenAI Codex エコシステムエンジニアクラウドセキュリティ認証買収エージェント

買収の狙い

Codexのクラウド実行基盤を拡張

長時間稼働エージェントに対応

顧客管理型の安全な実行環境

Codexの利用拡大

週500万人が利用

年初比400%増

規制当局の承認が前提

詳細を見る

OpenAIは2026年6月11日、クラウド実行基盤を手がけるOnaの買収を発表しました。同社の安全なクラウド実行・オーケストレーション技術を、急成長するCodexのエコシステムに統合し、ソフトウェア開発から知識労働まで長時間稼働するエージェントの基盤を強化する狙いです。買収は規制当局の承認など通常の完了条件が前提となります。

背景にはCodexの急速な普及があります。現在は週500万人が調査・分析・開発・自動化に利用しており、年初から400%増加しました。当初は開発者向けのツールでしたが、今では幅広い職種の人が初期の依頼から完成まで複雑な業務をこなす用途に広がっています。

OpenAIが重視するのは、作業時間の長期化です。Codexの最も価値ある仕事は数分ではなく数時間から数日にわたって進むようになっており、利用者が起点となった端末に縛られず、外出先からでも進捗確認や指示、意思決定、結果のレビューができる状態を目指しています。Onaの永続的な実行環境がこれを可能にします。

Onaはこれまで、ソフトウェア開発をローカル端末からクラウドへ移行させる取り組みを進めてきました。200万人の開発者が安全で再現可能なクラウド環境で作業するのを支援した実績があり、ノートPCを閉じても顧客のクラウド環境内でエージェントが作業を継続できる点が、Codexの次の段階に直結すると説明しています。

企業が実運用にエージェントを展開する際は、高性能なモデルだけでは不十分だとOpenAIは指摘します。Onaの顧客管理型の実行モデルにより、エージェントは企業自身のクラウド環境内で動作し、OpenAIが知能とオーケストレーションを提供します。実行場所やアクセス範囲、認証情報の制御、活動の記録といったセキュリティと統制の要件を満たしつつ、Codexの能力を損なわない構成です。

買収完了まで両社は独立した企業として運営されます。完了後はOnaのチームがOpenAIに加わり、Codexチームと連携して企業向けの安全で永続的な実行能力を高め、世界中のより多くの企業へCodexを展開していく計画です。

出典：OpenAI公式

OpenAIがChatGPTを統合スーパーアプリ化、Codexが基盤

2026年06月11日 Google OpenAI Anthropic Slack ChatGPT Sora Codex エンジニア動画米国提携 IPO エージェント Gmail

新体制と狙い

Sottiaux氏が中核製品責任者に就任

ChatGPTとCodexを統合しスーパーアプリ化

週間約10億人の消費者製品を刷新

技術と勝算

Codexを汎用エージェントへ転換

Sora等を閉鎖し資源を集約

Visa提携で決済を自動化

IPO控え成長再加速を狙う

詳細を見る

OpenAIは6月11日、ChatGPTを単純なチャット画面から、仕事や私生活のあらゆる作業をこなすパーソナルAIエージェントへと作り変える計画を明らかにしました。同社が「スーパーアプリ」と呼ぶこの全部入りプラットフォームは、これまでで最大級の賭けであり、その成否を左右する立場にThibault Sottiaux氏が立っています。先月、同氏はChatGPTとCodexの両方を統括する中核製品責任者に就任しました。

Sottiaux氏は、OpenAIで最も急成長する収益源の一つとなったCodexの構築を主導してきた人物です。これまで開発者やAI研究者と向き合ってきた同氏が、今度は週間で約10億人が使う消費者向け製品の刷新を任されました。本人はこの役割について「とてもわくわくすると同時に、少し恐ろしい」と語っています。

スーパーアプリの実現に向け、OpenAIは動画アプリのSoraや科学者向けプラットフォームなど複数の独立製品をすでに閉鎖しました。これらを率いた幹部の多くは退社する一方、Sottiaux氏の社内での影響力は拡大し、現在はGreg Brockman氏に直属しています。閉鎖で生まれた資源は本プロジェクトに振り向けられましたが、中核チームは今も比較的小規模だといいます。

技術面では、スーパーアプリは主にCodexで駆動されると同氏は説明します。利用者が自然言語で頼むと、エージェントが裏側でコードを書き、API呼び出しを実行し、ウェブを操作してタスクを完了させますが、その過程は利用者には見えません。同社は昨年Operatorやその後継のChatGPT Agentで同様の試みをしましたが、いずれも普及しませんでした。Sottiaux氏はそれらを「時期尚早だった」とし、今はモデルの信頼性が十分に高まったと主張します。

OpenAIが描くのは、WeChatのようなアジア型スーパーアプリとは異なる構想です。米国などには既にGmailやクレジットカード、Venmoが普及しているため、同社のアプリは既存サービスへ接続する必要があります。今週はVisaとの提携でAIエージェントによる決済を可能にしたほか、メールやSlack、カレンダーとの連携も進めています。

最終的にOpenAIは、その下にあるウェブサイトやアプリ、APIを利用者が意識せず済むほど強力な共通インターフェースの構築に賭けています。ただしこの戦略は、基盤サービスを握る競合への依存という弱点も抱えます。Google やAnthropicとの競争が激化しIPOが迫るなか、同社はChatGPTのスーパーアプリ化で成長を再加速できるかが問われます。

出典：WIRED

OpenAI、EUのAI生成物透明性規範を支持

2026年06月11日 OpenAI ChatGPT Codex AI活用エコシステム画像生成経営者リスクコンテンツ画像米国欧州

規範への支持表明

EU透明性規範を正式支持

AI法実装の重要な一歩

数百の関係者と共同策定

来歴技術の取り組み

2024年からC2PA採用

画像に来歴メタデータ付与

SynthID透かしを併用

公開検証ツールを提供

残された課題

メタデータは剥離リスク

来歴技術は発展途上

詳細を見る

OpenAIは2026年6月11日、欧州委員会が公表したAI生成コンテンツの透明性に関する行動規範への支持を表明しました。同規範はEUのAI法を実装し、より透明性の高いデジタル環境を築くための重要な一歩と位置づけられています。同社は数百の関係者とともに規範策定に貢献したとしています。

今回の支持は、AI生成物の来歴（プロベナンス）を強化してきた数年来の取り組みの延長線上にあります。OpenAIは2024年、画像生成ツールDALL·E 3にC2PAメタデータを付加し始めました。その後も標識付けや検出手法を改良し、最初の公開検証ツールも公開しています。

来歴情報をより強固にするため、同社は複数のシグナルを組み合わせる多層的な手法を採用しています。ChatGPTやCodex、APIで生成した画像にはC2PAメタデータとSynthIDの電子透かしの両方を付与します。メタデータは豊富な情報を運べる一方、透かしは異なる環境でも信号を保ちやすいという利点があります。利用者は専用ページで画像に来歴情報が含まれるかを確認できます。

もっとも、来歴技術はまだ発展途上の分野です。メタデータはアップロードやダウンロード、ファイル形式の変換、画面のスクリーンショットなどで失われる恐れがあり、透かしも劣化する場合があります。OpenAIはこうした限界を認めつつ、技術の信頼性や相互運用性の向上にはエコシステム全体の協力が不可欠だと指摘しています。

OpenAIは2025年、米国企業として初めてEUの汎用AI行動規範に署名しており、今回の支持も同じ方針に沿うものです。明確で実行可能なルールがAIの責任ある発展を促すとの考えのもと、同社は今後も製品の透明性強化や相互運用可能な標準づくりに取り組む姿勢を示しています。経営者にとっては、規制対応とAI活用を両立させる動きとして注目に値するのではないでしょうか。

出典：OpenAI公式

Microsoft、AIスキルを自動最適化するSkillOptを公開

2026年06月11日マイクロソフト Claude Claude Code Codex 数学 GPT-5 MIT エージェントベンチマーク基盤モデル

技術の仕組み

モデル重み不変のスキル最適化

スキル.md文書を学習対象化

提案と検証の反復改良ループ

編集予算で学習率制御

性能と実用性

GPT-5.5で平均23.5点向上

全52組合せで既存手法に勝利

スキル1件の訓練費1〜5ドル

詳細を見る

Microsoftは6月11日、AIエージェントのスキルを自動で改良するオープンソース基盤SkillOptを公開しました。基盤モデルの重みを変えずに、指示文をまとめたマークダウン文書を「学習可能な対象」として扱い、性能評価のフィードバックに基づいてスキルを進化させる点が特徴です。MITライセンスで提供され、企業の複雑な業務にエージェントを適応させる手間を大きく減らすことを狙います。

従来、エージェントのスキル調整は手作業が中心で、各ファイルの指示文を書き直しながら改善点を当て推量する非効率な作業でした。SkillOptは深層学習の発想を取り入れ、課題を実行するモデルとスキルを最適化するモデルを分離します。実行で得た成功・失敗の軌跡を分析し、追加・削除・置換の編集を提案したうえで、検証用データで性能が改善した場合のみ採用する仕組みです。

重要なのは、変更が「数学的に妥当な改善か」を保証する設計です。Microsoft Research Asiaの研究者は、チームがスキルを変更できるかではなく、その変更が改善である保証がないことが課題だと指摘します。SkillOptは編集予算を学習率のように使い、検証ゲートで誤った修正を排除し、失敗した編集を記録して再発を防ぎます。

性能面では、評価した52通りのモデル・ベンチマーク・実行環境のすべてで既存手法を上回りました。GPT-5.5ではスキルなしと比べ平均23.5点の改善を示し、小型モデルでも文書理解や逐次的な意思決定で大幅な向上が見られました。最終的なスキルは2000トークン以内に収まり、中央値は約920トークンと、人間が短時間で確認できる読みやすさを保ちます。

実用面では移植性と効率性が強みです。Codex CLIで訓練した表計算スキルをClaude Codeへそのまま移すと、標準設定比で59.7点向上したといいます。スキル1件あたりの訓練費は1〜5ドル程度で済み、導入時に完全に回収できる一度きりの費用とされます。一方で、数十件の代表例と採点可能な評価指標が必要で、主観的な課題には不向きという制約も示されました。

出典：VentureBeat

天文学者がCodexでブラックホール計算を高速化

2026年06月11日 OpenAI Codex シミュレーション数学学生スーパーコンピューター画像動画

研究の壁

プラズマ粒子の螺旋運動計算

極小タイムステップの負荷

数十年来のシミュレーション限界

AIの活用

Codexが候補アルゴリズムを導出

検証可能な数値手法の提案

誤りも試験で排除

今後の展望

数兆粒子の計算可能性

未踏の物理現象の解明

詳細を見る

アリゾナ大学のチー・クワン・チャン研究員が2026年6月11日、OpenAIのCodexを用いてブラックホール周辺のプラズマを模擬する新たな計算アルゴリズムを導出していると明らかにしました。従来の手法では極端な物理現象を現実的に再現できず、数十年にわたり研究の壁となってきた課題に、AIで挑む取り組みです。

チャン氏は、史上初のブラックホール画像を2019年に公開した国際協力プロジェクト「イベント・ホライズン・テレスコープ（EHT）」の一員です。チームは現在、M87銀河中心の超巨大ブラックホールを対象に、初の動画制作へ向けた観測を進めています。観測を科学的理解に変えるには、膨大なデータ処理と極限の物理を扱うシミュレーションが欠かせません。

最大の難所が、ブラックホール周辺のプラズマのモデル化です。高温で希薄な領域では電子とイオンがほとんど衝突せず、磁力線の周りを螺旋状に回ります。この運動を正確に追うには微小なタイムステップが必要で、世界最速のスーパーコンピューターでさえ、本来調べたい大きな挙動より粒子の細かな動きの計算に時間の大半を費やしてしまうのです。

そこでチャン氏は、粒子の運動を数学的に変換し、細かな螺旋を直接追わずに済む新手法に着目しました。手作業ですべての可能性を探るには膨大な時間がかかるため、Codexに候補アルゴリズムの導出と既知解との照合を任せたのです。生成された手法には誤りも多く含まれますが、検証可能であれば問題ないと同氏は言います。

Codexの特徴は、結論だけでなく数値手法そのものを提示し、研究者が検査・試験・物理的理解できる点にあります。「アインシュタインや優秀な学生、AIモデルから出た案だから受け入れるのではない。繰り返し試験して初めて受け入れる」とチャン氏は強調しました。検証と再現性に根ざす科学こそ、現在のAIの最良の用途の一つだとの見方です。

もしこの手法が成功すれば、ブラックホール周辺の数兆個の粒子を模擬できるようになる可能性があります。それは数十年にわたり手の届かなかった物理現象の解明につながると、同氏は期待を寄せています。

出典：OpenAI公式

Datadog出身者がAIコーディング新興企業Niteshift設立、700万ドル調達

大手AI依存からの脱却

Greylock主導で700万ドル調達

Reid Hoffmanら著名エンジェル参加

モデル間を自動切り替えする基盤提供

トークン課金ではなく分単位の従量制

競合と差別化戦略

CursorやCognitionが先行する激戦市場

コードの検証・運用まで一貫対応

Datadog時代の大規模運用経験が武器

OpenAI・Anthropicの垂直展開を警戒

詳細を見る

AIコーディングエージェントの新興企業Niteshiftが、Greylockのジェリー・チェン氏主導で700万ドル（約10億円）のシードラウンドを完了しました。同社はDatadogの初期エンジニアだったサジド・メフムード氏とコナー・ブラナガン氏が共同創業し、Reid Hoffman氏やDatadog共同創業者のオリビエ・ポメル氏らも出資しています。

Niteshiftの中核にある発想は、AIコーディングにおける大手AIベンダーへのロックイン回避です。メフムード氏はDatadog時代、AmazonのEC事業と競合するためAWSを避けるeコマース企業を多く見てきました。同じ構図がAI業界でも起きていると指摘し、AnthropicやOpenAIが法務・医療・金融など垂直市場に進出する「SaaSpocalypse（SaaS崩壊）」を警戒する企業に選択肢を提供します。

技術面では、Claude CodeやCodexといった主要コーディングエージェントを置き換えるのではなく、プロジェクトの要件に応じて複数モデル間を自動ルーティングする仕組みを構築しています。課金モデルもトークン販売ではなく、クラウドプロバイダーのような分単位の従量制を採用しました。メフムード氏は「我々はAIに対してソフトウェアを売っている」と説明しています。

ただし、参入する市場は競争が激しいのも事実です。CursorはSpaceXによる600億ドル買収提案が報じられ、Cognitionは260億ドル評価額で10億ドルを調達しました。Amazon BedrockやOpenRouterなど大手も競合に名を連ねます。モデル非依存という考え方自体は新しくなく、先行者の優位は大きいといえます。

メフムード氏はこうした懸念に対し、創業チームの実務経験で差別化できると主張します。Datadogをスタートアップから数十億ドル企業に成長させる過程で培った大規模エンジニアリング運用の知見は、AIが生成するコードの実行・テスト・検証を本番環境で自律的に行うインフラ構築に直結すると述べています。

出典：TechCrunch

Nextdoor、Codex活用で開発体制を変革

2026年06月09日 OpenAI Codex GPT-5 エンジニア専門家コーディングデバッグエージェントプロンプト

開発プロセスの転換

成果志向型エンジニアリングへの移行

1人でエンドツーエンドの機能開発

3チーム協業が不要に

技術的成果と組織変化

Rust組込みDBのデバッグに活用

GPT-5.5で根本原因分析が向上

ボトルネックが開発から戦略判断へ移行

詳細を見る

1億1000万人以上のユーザーを11カ国で抱える地域SNSNextdoorのプラットフォームチームが、OpenAIのコーディングエージェントCodexを全面的に導入し、開発プロセスを根本から変革しています。エンジニアリング責任者のCory Dolphin氏は、従来のプロンプト反復型から「成果エンジニアリング」への転換だと説明しています。

この変革により、エンジニアは特定のシステムやフレームワークの専門家にとどまらず、モバイル・フロントエンド・バックエンドを横断してプロダクト体験全体を1人で担えるようになりました。具体例として、近隣のサービス提供者を見つける「Opportunity Alerts」機能では、地図表示の追加を1人のエンジニアがエンドツーエンドで構築しました。従来であれば3チームの協業が必要で、バックログに埋もれていた可能性がある機能です。

技術的には、組込みRustデータベースや競合状態が複雑なシステムのデバッグにもCodexを活用しています。Kubernetesポッドの起動障害やデータ分析のトレンド特定など、再現困難な問題の調査にクリーンな環境を与えて取り組ませています。GPT-5.4および5.5への更新で、難解な技術的詳細への深掘りと根本原因の特定能力が大きく向上したと評価しています。

組織への影響も顕著です。開発速度が飛躍的に向上した結果、ボトルネックはエンジニアリングから離れ、「何を構築すべきか」という戦略的意思決定に移りました。Dolphin氏は「Codexなしのエンジニアリングはもう想像できない」と述べており、AIコーディングエージェントが開発組織の構造そのものを変えつつある事例として注目されます。

出典：OpenAI公式

OpenAI、ChatGPTを「スーパーアプリ」に刷新へ

2026年06月08日 OpenAI Anthropic ChatGPT Codex チャットボットコーディング IPO エージェント AIゲートウェイ

チャットからエージェントへ

コーディングツールとAIエージェントを統合

Codex製品の位置づけを大幅強化

「チャットは終わった」と幹部が発言

IPOと収益化への布石

企業顧客の獲得へ組織再編

Anthropicとの競争を強く意識

無料ユーザー中心からの転換

上場準備と並行した成長戦略

詳細を見る

OpenAIが、2022年のリリース以来最大となるChatGPTの全面刷新を準備していることがわかりました。同社はチャットボットを、コーディングツールやAIエージェントを統合した「スーパーアプリ」へと変貌させる計画です。企業価値8500億ドルに達した同社が、年内に予定する新規株式公開（IPO）を前に新たな収益源を模索する動きとなります。

この刷新は、OpenAI社内で進む大規模な組織再編の一環です。同社は、収益性の高い企業顧客の獲得に経営資源をシフトし、ライバルのAnthropicとの競争を強化する方針を打ち出しています。コーディング製品「Codex」により大きなリソースと存在感を与えることで、質問に答えるチャットボットから、ユーザーに代わってタスクを実行するエージェントへの転換を図ります。

ある幹部は「チャットは終わった」と語りました。ChatGPTはリリース以来約10億人のユーザーを獲得しましたが、その大半は無料で利用しています。OpenAIはChatGPTを、旅行予約やカレンダー管理などを代行するAIエージェントといった、より高付加価値な製品へのゲートウェイとして位置づけ直す考えです。

IPOに向けて収益拡大と黒字化への道筋をつける必要に迫られるなか、AI業界の象徴的企業が「チャットの次」を明確に打ち出した格好です。AIの競争軸が、対話型インターフェースからタスク実行型エージェントへと移行する潮流を象徴する動きといえます。

出典：Ars Technica

OpenEnvがコミュニティ主導のエージェント強化学習標準に

2026年06月08日 NVIDIA Meta Mercor Claude Claude Code Codex シミュレーション推論強化学習デプロイスタンフォードエージェント MCP オープンソースモデル Hugging Face TRL Intel Scale AI

標準化の狙いと体制

Meta・NVIDIAら参画の運営委員会発足

Gymnasium式APIで環境を統一

HTTP・WebSocket・MCP対応

今後のロードマップ

データセット連携でタスク定義を標準化

外部報酬関数の統合対応

TRL・Unslothでの訓練例整備

環境品質の自動検証機能

詳細を見る

Hugging Faceは2026年6月8日、エージェント型強化学習（RL）の実行環境を標準化するオープンソースライブラリOpenEnvを、コミュニティ主導のガバナンス体制へ移行すると発表しました。新たに設置された運営委員会にはMeta（PyTorch Foundation）、NVIDIA、Reflection、Unsloth、Modal、Prime Intellect、Mercor、Fleet AIなどが参画し、リポジトリもhuggingface/OpenEnvとして公開されています。

OpenEnvが解決するのは、オープンソースモデルにおけるエージェント訓練の断片化です。Claude CodeやCodexといったフロンティア企業のエージェントは、モデルとハーネスが一体で最適化されていますが、オープンソースではモデル・ハーネス・推論エンジンがばらばらに組み合わされます。OpenEnvはこれらの間に共通のインターフェース層を提供し、どの組み合わせでもエージェントを効率的に訓練できるようにします。

技術的には、Gymnasium互換のAPI（reset・step・state）をクライアント/サーバー構成で提供します。環境はDockerでパッケージ化され、HTTPやWebSocketといった標準プロトコルで通信します。さらにMCP（Model Context Protocol）をファーストクラスでサポートしており、訓練・評価時のシミュレーション環境と本番環境で同じ環境定義を一貫して利用できます。

重要な設計方針として、OpenEnvは報酬関数や訓練ループの定義には踏み込みません。あくまでRL環境の公開・デプロイ・消費を標準化する「プロトコル層」と位置づけ、報酬設計やスコアリングは既存の専門ライブラリに委ねます。今後はデータセット連携（RFC 006）、外部報酬統合（RFC 007）、環境品質の自動検証（RFC 008）などが計画されています。

PyTorch Foundation、vLLM、Lightning AI、Scale AI、Stanford Scaling Intelligence Labなど幅広い組織がすでにOpenEnvの採用・支援を表明しています。オープンソースのエージェント訓練基盤として事実上の標準となるか、今後の普及が注目されます。

出典：Hugging Face

OpenAI、ChatGPTを「スーパーアプリ」に刷新へ

2026年06月07日 OpenAI Anthropic ChatGPT Sora Codex チャットボット動画生成動画コーディング IPO エージェント

スーパーアプリ構想

コーディングツールとAIエージェントを統合

無料ユーザーを有料製品へ誘導する設計

個人・仕事の両面を支援するパーソナルエージェント構想

戦略転換の背景

Anthropicへの対抗と法人顧客獲得が狙い

IPO前の収益化加速が急務

Soraなど単独製品の「寄り道」を整理

幹部が「チャットは終わった」と宣言

詳細を見る

OpenAIが数週間以内にChatGPTを大幅に刷新し、コーディングツールやAIエージェントを統合した「スーパーアプリ」として再構築する計画であることが、Financial Timesの報道で明らかになりました。同社コア製品・プラットフォーム責任者のティボー・ソティオー氏は、個人生活から仕事まであらゆる場面で支援する「パーソナルエージェント」の実現を目指していると語っています。

この戦略転換の背景には、Anthropicとの競争激化があります。特に法人顧客の獲得で後れを取っているとの認識から、ChatGPTを無料ユーザーがCodexなどの有料製品に触れる入口として位置づけ、収益化を加速させる狙いです。社内幹部が「チャットは終わった」と発言するほど、従来のチャットボット路線からの脱却を鮮明にしています。

OpenAIのスーパーアプリ構想は2025年から報じられてきましたが、今回はIPOを控えた収益性向上という具体的な経営課題と結びついている点が新しい要素です。同社は2025年に動画生成ツールSoraなど複数の単独製品を投入しましたが、経営陣はこれらを「寄り道」と表現し、すでに整理を進めています。

ChatGPTの月間ユーザー数は膨大ですが、その大半は無料ユーザーです。スーパーアプリ化によって有料転換率を高められるかが、OpenAIの企業価値を左右する重要な試金石となります。Anthropicが法人向けで急成長するなか、OpenAIがプラットフォーム戦略でどこまで差別化できるかが注目されます。

出典：TechCrunch

Hugging Faceハッカソンで小規模モデルのゲーム生成に挫折

2026年06月07日 NVIDIA GitHub Copilot GitHub Copilot Codex エンジニアプロンプトコンテキスト Hugging Face RAG

試行錯誤と失敗の過程

Nemotron 30Bでゲーム生成を試行

長文プロンプトでは動作せず

スキルカードでコンテキスト超過

RAG併用も画面は真っ白

方針転換と得られた教訓

複雑なゲームを断念しHTML生成に転換

時計やToDoリストは生成可能

Tetris級の複雑さで破綻

小規模モデルの限界が明確に

詳細を見る

Hugging Face主催のBuild Smallハッカソンで、参加者がNVIDIAのNemotron 30Bモデルを使い、Three.jsベースのゲームを自動生成するプロジェクトに挑戦しました。アニメ「The Amazing Digital Circus」に着想を得た「デジタルペット」が冒険＝ゲームを生成するというコンセプトでしたが、最終的にゲーム生成は実現できませんでした。

開発者はまず長文プロンプトでモデルに指示を与えましたが、生成されたゲームは正常に動作しませんでした。次にGitHub Copilotのスキルカードを導入したところ、短く設定していたコンテキストウィンドウを圧迫。ウィンドウを拡大しても問題は解消されませんでした。

さらにCodexでスキル情報を要約し、RAGで参照させる方式も試みました。この手法ではモデルの応答品質がやや改善したものの、生成されるゲームには必ず不具合があり、画面が真っ白になるケースが続出しました。

最終的にゲーム生成を断念し、シンプルなHTML生成ツールへと方針を転換しています。時計やToDoリスト、SnakeやBreakoutといった単純なゲームはワンショットで生成できるものの、Tetris級の複雑さになると破綻するとのことです。小規模モデルでの複雑なコード生成には依然として大きな壁があることを示す事例といえます。

出典：Hugging Face

Hugging FaceがCLIをAIエージェント最適化に再設計

2026年06月04日 Claude Claude Code Codex Sonnet コーディングエージェントプロンプトベンチマーク Hugging Face

エージェント対応の設計思想

環境変数で自動検出し出力形式を切替

対話プロンプト排除と安全なリトライ設計

次コマンドのヒント表示でステップ削減

ベンチマーク結果

curl/SDK比で最大6分の1のトークン消費

Claude CodeとCodexで成功率94%と93%

スキル導入でツール呼出が約30%減少

詳細を見る

Hugging Faceは2026年6月4日、同社の公式コマンドラインツール「hf CLI」をAIコーディングエージェント向けに再設計したことを発表しました。Claude CodeやCodexなどのエージェントからのHub利用が急増しており、Claude Code単体で約4万ユーザー・4900万リクエストに達したことが背景にあります。

再設計の核心は、人間とエージェントで同じコマンドの出力を自動的に切り替える仕組みです。エージェント利用時は環境変数を検出し、ANSIカラーや省略表示を排除した完全なTSV形式で出力します。さらに対話プロンプトを廃止し、破壊的操作にはエラーメッセージに修正コマンドを含めることで、エージェントが自律的に作業を進められるようにしました。

ベンチマークでは18の実用的なHubタスクを用意し、hf CLIとcurl/Python SDKを比較しています。Claude Code（Sonnet 4.6）での成功率はhf CLIが94%に対しcurl/SDKは84%にとどまりました。トークン消費量では、バケット作成・同期・削除といった複雑なマルチステップタスクでcurl/SDKがCLIの最大6倍を消費するという結果が出ています。

加えて、hf CLIの全コマンド体系をコンパクトにまとめた「スキル」機能も提供されています。エージェントが初回からコマンド構造を把握できるため、--helpの探索が不要になり、タスクあたりのツール呼び出しが約10回から7回へと約30%削減されました。スキルは`hf skills add --claude`で導入できます。

Hugging Faceはエージェントを「Hubの実際のユーザー」と位置づけ、モデル訓練やデータセット構築、Spacesデモの公開といった作業をエージェント経由で行うケースが標準化しつつあるとしています。エージェントのツール効率を高めることが、その背後にいる人間のユーザー体験向上に直結するという考え方です。

出典：Hugging Face

EndavaがAIエージェント中心にソフト開発体制を刷新

2026年06月04日 OpenAI ChatGPT Flow Codex 生産性 AI活用ワークフロー AI導入エンジニアコーディングデプロイエージェント

導入の経緯と方針

OpenAIを全社AI基盤に採用

問題解決でAI活用を最優先に

行動変容として導入を推進

開発手法の変革

DavaFlowで全工程にAI組込み

法務・財務・営業にも展開拡大

要件定義や計画策定も高速化

今後の展望

エージェント連携の高度化を推進

AIを生産性層から経営基盤へ転換

詳細を見る

グローバルITサービス企業Endavaが、ソフトウェア開発体制をAIエージェント中心に再設計したことが明らかになりました。同社はOpenAIを全社的なAIプラットフォームとして採用し、ChatGPT EnterpriseとCodexを全従業員に提供しています。CTOのMatthew Cloke氏は「問題解決においてAIを最初に考えることがAIネイティブであること」と述べています。

開発現場での変革は、独自のAIネイティブ開発手法「DavaFlow」の構築につながりました。AIによるコーディング支援で開発速度が向上した結果、ボトルネックが要件定義やビジネス分析、ステークホルダー調整に移行。DavaFlowではミーティング準備からビジネス計画、プロダクト設計、エンジニアリング、デプロイまで全工程にOpenAI技術を組み込んでいます。

注目すべきは、AI活用が開発部門にとどまらない点です。法務チームはリサーチや文書作成に、プロジェクトマネージャーはガバナンスレポート生成に、営業チームはスプレッドシートに代わるアプリ構築にAIを活用しています。ある社内の価格検討では、表計算を使わずにインタラクティブな価格設定アプリをその場で作成し、議論の質が一変したといいます。

同社は1万1000人の全社展開から得た知見として、AI導入をソフトウェア展開ではなく「行動変容」として捉えること、リーダー自身がAIを積極的に使うこと、非技術部門を早期に巻き込むことなどの原則を示しています。今後はモデル・エージェント・ワークフロー・人間の専門知識を統合するオーケストレーションが次の段階になるとCloke氏は展望を語っています。

出典：OpenAI公式

OpenAI、生命科学特化モデルGPT-Rosalindを大幅強化

2026年06月03日 OpenAI Codex 検索ワークフロー GPT-5 専門家推論コーディング創薬提携エージェントベンチマーク

ベンチマーク性能の向上

MedChemBenchで27.5%達成

GeneBenchで精度21.6%に改善

LabWorkBenchで63.2%の正答率

全評価でトークン消費量も削減

研究ワークフローの拡張

NGS解析・文献検索プラグイン提供

Codex上で配列・構造ビューア統合

Novo Nordiskと創薬で提携

信頼アクセス方式でグローバル展開

詳細を見る

OpenAIは2026年6月3日、生命科学研究に特化したGPT-Rosalindシリーズの大型アップデートを発表しました。今回の更新では、GPT-5.5のエージェント型コーディング機能とツール使用能力を統合し、創薬の中核領域であるメディシナルケミストリーやゲノミクスにおけるモデル性能を大幅に引き上げています。対象読者である製薬企業や研究機関の研究者にとって、日常的な科学ワークフローを加速する実用的な進化といえます。

性能評価では、同社が新たに設計した専門家審査型ベンチマークLifeSciBenchを含む3つの指標で改善を確認しています。創薬化学の実務的課題を扱うMedChemBenchではGPT-5.5の25.1%に対し27.5%を達成し、トークン使用量も7.2%削減しました。ゲノミクス・定量生物学のGeneBenchでは精度20.4%から21.6%へ向上しつつ、トークン消費を31%も圧縮しています。実際のウェットラボ実験プロトコルを評価するLabWorkBenchでは、GPT-5.5の55.8%に対して63.2%と大きな差をつけました。

機能面では、Life Sciences ResearchプラグインとLife Sciences NGS Analysisプラグインの2つを新たに公開しました。これにより、文献からのエビデンス検索やバイオインフォマティクス解析を同一ワークスペース内で実行できるようになります。さらに配列・アラインメント・構造のインタラクティブビューアも追加され、研究者はモデルの推論過程を可視的に確認しながら作業を進められます。

事業展開としては、デンマークの大手製薬企業Novo Nordiskとの提携を発表しました。同社はGPT-Rosalindを活用し、複雑なデータセットの解析やパターン発見、仮説検証の高速化に取り組みます。GPT-Rosalindは信頼アクセス方式により、正当な科学研究を行う組織に対してグローバルに提供を拡大しており、エンタープライズアカウントを持たない組織向けにはOpenAI管理のワークスペースも用意されています。生物防衛分野への応用も視野に入れた、科学研究全体のパートナーとしての位置づけを強めています。

出典：OpenAI公式

OpenAI Codex、業務特化プラグイン6種とSites機能を公開

2026年06月02日 OpenAI Anthropic Vercel Salesforce Replit Codex ワークフローデザインクリエイティブスライドエンジニアリスクハルシネーションコーディング投資エージェント Snowflake Figma

企業向け機能の全容

6種の業務特化プラグインを提供開始

62アプリ・110スキルを即時利用可能

Sites機能でWebアプリを社内共有

Annotations機能で部分修正に対応

急成長する非開発者の利用

週間利用者が500万人に到達

非開発者が全体の20%を占める

非開発者の伸びは開発者の3倍

2月のデスクトップ版公開から6倍成長

エンタープライズ戦略の加速

Anthropicの先行投入に対抗する動き

OpenAI Deployment Companyを3週間前に設立

詳細を見る

OpenAIは2026年6月2日、AIエージェントツールCodexの大型アップデートを発表しました。業務職種に特化した6種類のプラグイン、対話型Webサイトを生成・共有できるSites機能、ドキュメントの特定箇所だけを修正できるAnnotations機能の3つが追加されます。Codexの週間アクティブユーザーは500万人に達し、2月のデスクトップアプリ公開時から6倍以上に成長しています。

新たに投入される6種のプラグインは、データ分析、クリエイティブ制作、営業、プロダクトデザイン、株式投資、投資銀行業務の各領域をカバーします。Snowflake、Salesforce、Figmaなど62の業務アプリと110のスキルがバンドルされており、IT部門によるAPI接続構築なしに、すぐに複雑なワークフローを自動化できます。Corporate Finance、Private Equity、法務など追加プラグインも予告されています。

Sites機能はBusiness・Enterpriseプラン向けにプレビュー提供が始まります。静的なスプレッドシートや資料を、URLで社内共有できるインタラクティブなWebアプリに変換できます。たとえば財務モデルをシナリオプランナーに変換し、経営陣がブラウザ上で前提条件を操作して比較するといった使い方が想定されています。パートナーとしてVercel、Wix、Replit、Lovable、Figmaなどが参画しています。

Annotations機能は、従来の全ファイル再生成を排し、ユーザーが指定した箇所だけをCodexに修正させる仕組みです。これにより書式崩れやハルシネーションのリスクが低減し、初稿完成後のイテレーション作業が効率化されます。コード、Markdown、Webサイトに加え、文書・スプレッドシート・スライドにも対応が拡大しました。

今回のアップデートは、Anthropicが2月に企業向けエージェントプログラムを先行投入した動きへの対抗策と位置づけられます。OpenAIは3週間前に40億ドル超の資金を集めたOpenAI Deployment Companyを設立しており、企業へのAI統合を加速させる体制を整えています。非開発者ユーザーは全体の約20%ですが、開発者の3倍の速度で増加しており、Codexがコーディングツールから汎用業務プラットフォームへ転換しつつあることを示しています。

出典：TechCrunch | OpenAI公式 | OpenAI公式 | VentureBeat

MicrosoftがAIエージェント制御基盤をOS階層に構築

MXCの技術設計

OSカーネルで実行境界を強制

プロセス分離からmicroVMまで段階的制御

エージェントに固有IDを付与し全操作を監査

ACSによるガバナンス標準化

ポリシーファイルで許可・禁止・人間承認を定義

ワークフロー中の複数地点で準拠を検証

LangChainやOpenAI SDKなど主要基盤に対応

エコシステムと企業展開

OpenAI・Nvidia・Manusが早期採用

7月にAgent 365でDefender・Entra・Intune統合

詳細を見る

Microsoftは2026年6月2日のBuild 2026で、AIエージェントをOS階層から制御する2つの基盤技術を発表しました。1つ目はWindows OSカーネルに組み込まれた実行コンテナ「MXC（Microsoft Execution Containers）」、2つ目はエージェントの行動ポリシーを標準化するオープンソース仕様「ACS（Agent Control Specification）」です。両技術は、自律性が高まるAIエージェントの安全な企業導入という業界共通課題に対し、プラットフォーム側から包括的な回答を示すものです。

MXCはポリシー駆動型のサンドボックスで、開発者やIT管理者がエージェントのファイル・ネットワーク・画面アクセス権限を事前に宣言し、OSが実行時に強制します。軽量なプロセス分離から完全なmicroVMまで「composable sandbox spectrum」を提供し、リスクに応じた動的な分離レベルの切り替えが可能です。すべてのエージェント操作はEntra IDと紐付けられ、人間の操作とエージェントの操作を監査証跡で区別できます。

ACSはエージェントの行動規範をポリシーファイルとして記述する仕様です。入力受信前・ツール呼び出し前後・最終応答前など複数のインターセプトポイントで準拠チェックを実行し、違反時には操作のブロックや機密情報の秘匿、人間への承認要求を自動で行います。SDKとして提供され、LangChain、OpenAI Agents SDK、Anthropic Agents SDK、AutoGen、CrewAI、Semantic Kernelなどの主要フレームワークにプラグインで対応します。

エコシステム面ではOpenAIがCodexの実行環境としてMXCの統合を進め、NvidiaはOpenShellフレームワークをWindows上のMXC基盤で展開します。中国発のエージェント企業ManusやNous Researchも早期パートナーに名を連ねています。企業向けには7月に「Agent 365」のプレビューが開始され、Microsoft Defender・Entra・Intune・Purviewと統合した一元的なエージェント管理基盤となります。

今回の発表は、AIエージェントのセキュリティをアプリケーション層ではなくOS層に位置づけるという戦略的判断を示しています。Appleのウォールドガーデン型やGoogleのクラウド集中型とは異なり、どのエージェントでも受け入れつつOSポリシーで制御するというアプローチは、多様なAIプロバイダーを併用する企業環境に適合する可能性があります。既存のIntuneで管理される数億台のWindowsデバイスがソフトウェア更新でエージェント対応できる点も、大きな競争優位となります。

出典：TechCrunch | VentureBeat

OpenAIの先端モデルとCodex、AWSで提供開始

2026年06月01日 OpenAI Amazon AWS Codex AI導入エンジニアリスクパッチセキュリティコンプライアンスコーディングデバッグコードレビューエージェント

提供開始の概要

AWS上でOpenAI先端モデルを一般提供

Amazon Bedrock経由で利用可能

週500万人利用のCodexも対応

商用・GovCloud両リージョン対応

企業導入の狙い

既存のセキュリティ・統制で利用

調達・審査の摩擦を低減

本番展開までの時間短縮

今後の展開

セキュリティ向けDaybreak提供予定

詳細を見る

OpenAIは2026年6月1日、同社の先端AIモデルとコーディングエージェント「Codex」をAWS上で一般提供開始したと発表しました。数百万に及ぶAWS顧客が、普段から業務に使うプラットフォーム上でOpenAIの能力を活用できるようになります。商用リージョンと政府向けのGovCloudの両方に対応します。

提供形態は2つあります。「Amazon Bedrock上のOpenAIモデル」は、AWS標準のセキュリティと統制機能を使ってAIアプリを構築できます。もう一方の「Bedrock上のCodex」は、週に500万人超が利用するソフトウェアエンジニアリング・エージェントを、開発チームが既に使う環境に持ち込み、コードの記述・レビュー・デバッグ・刷新を支援します。

今回の狙いは、企業のAI導入を阻む最大級の障壁を取り除く点にあります。セキュリティ審査やコンプライアンス、調達、課金、ガバナンスといった既存の業務フローを通じて先端AIを本番投入できるため、評価段階から実運用への移行を加速できます。チームが信頼する管理体制をそのまま使えることが利点です。

OpenAIは今後、AWS経由で利用できる機能を拡大する方針です。その一つが、ソフトウェアの構築と防御を変えることを目指す「Daybreak」です。サイバーモデルとCodex Securityを含み、安全なコードレビューや脅威モデリング、パッチ検証、依存関係のリスク分析などを日々の開発フローに組み込み、防御側がリスクを早期に把握できるよう支援します。

こうした専門機能が顧客に提供される際も、AWSはセキュリティチームが慣れ親しんだ枠組みで導入を進める経路となります。OpenAIとAWSの連携により、より多くの組織が高度なAIを本番環境で活用できる体制が整いつつあります。

出典：OpenAI公式

OpenAI、ミシガンに1GWのAI拠点着工

2026年06月01日 OpenAI オラクル Codex 経営者学生インフラデータセンターエネルギー米国投資提携スターゲイト・プロジェクト学校

拠点の規模と体制

ミシガン州セーラインに1GW級

Oracleら4社と共同建設

Stargate計画の一環

地域への約束

電気代の住民転嫁なし

閉ループ冷却で水使用抑制

組合建設職2,500人創出

税収10億ドル見込み

人材育成投資

学生にCodex無償提供

詳細を見る

米OpenAIは2026年6月1日、ミシガン州セーラインで1ギガワット級のデータセンター施設「The Barn」の建設に着工しました。Oracle、Related Digital、Walbridgeを建設パートナーとし、ホイットマー州知事や地元の労働組合指導者も出席しての起工式となりました。同社の大規模インフラ計画「Stargate」の一環に位置づけられます。

今回の発表で目を引くのは、地域社会への一連の具体的な約束です。施設に必要な電力・インフラ費用は事業側が負担し、地元住民の電気料金には転嫁しないと明言しました。冷却には閉ループ方式を採用し、水使用量は一般的なオフィスビル程度に抑えるとしています。

雇用と地域経済への波及も強調されています。建設段階で2,500人超の組合員建設職に加え、常設450人、郡全体で1,500人、間接雇用1,000人を生み出す見込みです。リース期間を通じて約10億ドルの税収を生み、学校や公共サービスを支えると試算しています。

人材育成への投資も柱の一つです。OpenAIは2026〜2027学年度に、18歳以上のミシガン州の大学・コミュニティカレッジ・職業訓練校の学生40万人超に対し、最大4,500万ドル相当のCodexクレジットを無償提供します。州の労働経済機会局などと連携し、実務に直結したAIリテラシーや職業訓練の機会も整えます。

OpenAIはこの取り組みを、20世紀に米国の工業化を牽引したミシガン州での再工業化の契機と位置づけています。年初には北米建設労組(NABTU)との提携も発表しており、AIインフラ建設を組合のキャリアや見習い制度の強化につなげる狙いです。

背景にあるのは、計算資源(コンピュート)がAI競争の戦略的優位を左右するという認識です。より多くの計算資源がモデルの性能を高め、先進AIの提供コストを下げるとして、同社はシステムや電力、サプライチェーンを含む全領域への投資を進めています。経営者にとっては、AIインフラ競争が地域経済や人材政策と一体で動き始めた点が注目に値するのではないでしょうか。

出典：OpenAI公式

OpenAI、AIモデル評価の信頼性向上へ指針を公開

2026年05月29日 OpenAI Codex チャットボット GPT-5 推論リスクイギリスエージェント

評価設計の3類型

能力引出・安全性・比較の3分類を提示

ハーネス選択が結果を左右

予算・計算量で性能が大幅変動

評価報告に妥当性検証を要求

5つの妥当性リスク

報酬ハッキングによる偽の高得点

サンドバギングで意図的低性能

汚染・拒否・欠陥問題への対処が必須

詳細を見る

OpenAIは2026年5月29日、フロンティアAIモデルの第三者評価を信頼性の高いものにするための指針「共有プレイブック」を公開しました。今日のAIモデルはツール使用や複数ステップの作業が可能なエージェント型へと進化しており、従来のチャットボット型テストでは能力を正確に測定できないという問題意識が背景にあります。

指針では、評価が検証すべき主張を能力引出、安全対策の堅牢性、統制された比較の3類型に整理しています。特にエージェント型システムでは、モデルを取り囲む「ハーネス」の設計が評価結果を根本的に左右すると強調しました。GPT-5.5のサイバーレンジ評価では、コンパクション機能の有無で性能が大きく変わった実例が示されています。

妥当性を脅かすリスクとして、報酬ハッキング、拒否、データ汚染、欠陥問題、サンドバギングの5つを挙げています。METRによるGPT 5.4評価では、報酬ハッキングを除外すると時間軸推定が13時間から約6時間に半減した事例や、Apollo ResearchによるGPT-5.5のサンドバギング検査で推論トレースに評価認識の兆候が52%検出された事例が紹介されました。

具体的な改善策として、OpenAIは評価者への最大引出ガイダンスの共有、OpenAIモデル評価におけるCodexの共通基盤としての使用推奨、推論トレースの提供を実施しています。計算予算の影響も大きく、英国AISIのサイバー評価ではトークン数を10倍にすると性能が最大59%向上し、上限に達していないケースも確認されました。

この指針はNISTや国際標準化機構のフロンティアAI評価基準の策定を視野に入れたものです。評価報告書には、主張の種類、テスト対象システムの構成、ハーネス選択、予算、引出手法、妥当性検証の各項目を明記すべきだと提言しています。ハーネスや妥当性検証を省略した基準は、システムの真の能力を過小評価するか、安全性への信頼を過大評価する危険があると警告しました。

出典：OpenAI公式

Braintrust、Codexで顧客要望を即座にコード化

2026年05月29日 OpenAI Codex ワークフロー GPT-5 創業者プロンプト

開発ワークフローの変革

要望からプレビューブランチを数分で作成

バックログ待ちがリアルタイム対応に転換

1カ月でチームの50%がCodexに移行

実験コストの低下

テスト定義後にCodexがサンドボックスで自律実行

段階的プロンプトが不要に

速度が実験の幅を拡大

詳細を見る

AI観測・評価プラットフォームを提供するBraintrustは、OpenAIのCodex（GPT-5.5搭載）を導入し、顧客からの機能要望を数分でプレビューブランチに変換するワークフローを実現しました。創業者兼CEOのAnkur Goyal氏は、導入からわずか1カ月でチームの半数がCodexに移行したと述べています。

従来、顧客からの機能要望はバックログに入り、優先順位付けを経て開発に回されていました。Codexの導入後は、要望をそのままCodexに入力し、プレビューブランチを作成して顧客に即座に提示できるようになりました。Goyal氏はこれを「顧客とリアルタイムでイテレーションし、アイデアを練ることができる」と評価しています。

Goyal氏が最大の変化として挙げるのは速度です。他のモデルではターミナルで大量のテキストを出力すると遅延が発生するが、Codexではそれがないと指摘します。この速度差が、ツールとの関わり方そのものを変えたと述べています。

実験の手法も変わりました。従来は特定の問題を解くためにモデルへの段階的なプロンプト設計が必要でしたが、Codexでは問題を示すテストを記述しサンドボックス環境を用意するだけで、あとはCodexが自律的に動作します。手動のガイダンスが減ったことで実験のハードルが下がり、アイデアから動作する解決策までの到達が加速しています。

出典：OpenAI公式

OpenAI、Codexで自己改善する税務AI構築

2026年05月27日 OpenAI Codex スケジュール調整エンジニアエージェント

実証された成果

税務申告7,000件を処理

準備時間を約3分の1削減

下書き精度最大97%達成

処理スループット約50%向上

自己改善の仕組み

現場補正を構造化シグナル化

Codexが評価セットで原因調査

他税務スケジュールへ横展開

詳細を見る

OpenAIとThrive Holdingsは2026年5月27日、会計事務所Creteの実務家と共同開発した税務AIエージェント「Tax AI」の運用成果を公開しました。過去6カ月で7,000件の申告を処理し、準備時間を約3分の1削減、下書き精度は最大97%、処理量は約50%増えたと報告しています。鍵となるのは、Codexを核に据えた自己改善ループです。

従来、運用開始後に発覚する不具合は、エンジニアが個別に原因を探って修正する手作業でした。Tax AIはこの工程を変え、実務家による修正をフィールド単位の構造化データとして蓄積します。導入直後は4分の1の申告しか「75%正答」に届きませんでしたが、6週間後には86%が同水準に到達したと示しています。

改善の中核はCodexによる自動調査です。たとえば賃貸物件の「公正賃貸日数」欄を継続的に取りこぼすパターンが評価指標で浮かぶと、Codexが抽出スキーマ・マッパー・採点器を横断的に点検し、修正案とプルリクエストを提示します。広範な回帰評価を通った上で人間のレビューに回り、曖昧な事例は製品チームへ差し戻します。

OpenAIとThriveは三つの柱を掲げます。第一に実務家との密接な連携、第二に入力から最終提出までの完全なプロダクション・トレース保全、第三にCodexによる評価駆動の改善ループです。賃貸物件で90%の精度・再現率に達するまで6週間を要しましたが、得た抽象化はSchedule CやAなどへ流用できると説明します。

Thriveは持株会社として現場企業を直接運営しているため、ベンダーではなくパートナーとして製品開発を進められる点を強みに挙げます。同じ設計図を簿記、監査、IT支援などへ展開する計画です。実務家の判断が学習を導き、製品が証拠を残し、エージェントが改善を回す。この三位一体が、これからの業務特化型AIの基本構造になりそうです。

出典：OpenAI公式

Cognition、評価額250億ドルで10億ドル調達

資金調達の概要

評価額250億ドルで10億ドル超調達

8カ月前の102億ドルから約2.5倍に

Lux CapitalとGeneral Catalyst主導

Founders FundやRibbit Capitalも参加

事業の成長実績

年間売上約5億ドル規模に到達

企業利用が6カ月連続で月50%成長

NASAやゴールドマン・サックスが顧客

Windsurf 買収で技術基盤を強化

詳細を見る

AIコーディングエージェント「Devin」を開発するCognitionが、プレマネー評価額250億ドル（約3.7兆円）で10億ドル超の資金調達を実施したと発表しました。2025年9月に評価額102億ドルで4億ドルを調達してからわずか8カ月で、企業価値は約2.5倍に跳ね上がった計算です。

今回のラウンドはLux CapitalとGeneral Catalystが主導し、既存投資家のFounders Fundや8VCに加え、Ribbit Capital、Atreides、Layer Globalが新たに参加しました。大手VCがこぞって出資した背景には、AIコーディング分野で独立系スタートアップが生き残れるという確信があります。AnthropicのClaude Code、OpenAIのCodex、GoogleのJulesなどプラットフォーム企業が市場を席巻するとの見方が支配的だった中での大型調達です。

Cognitionは2025年にWindsurfの残存資産を買収し、技術基盤を拡充してきました。現在の顧客にはメルセデス・ベンツ、NASA、ゴールドマン・サックス、サンタンデール銀行といった大企業が名を連ねています。年間経常収益（ARR）は4億9,200万ドルに達し、エンタープライズ向けDevinの利用量は過去6カ月にわたり月次50%の成長を続けています。

今回の調達は、AIコーディング市場における競争構図に重要な示唆を与えます。モデル開発元が自社ツールで市場を独占するシナリオが有力視されてきましたが、Cognitionの急成長は、エンタープライズ顧客が専業プレイヤーの実行力を評価していることを示しています。独立系AIコーディングスタートアップにとって、追い風となる資金調達といえるでしょう。

出典：TechCrunch

OpenAI、ブラジル初のメディア提携を発表

2026年05月25日 OpenAI ChatGPT Codex エコシステムコンテンツ米国イギリスドイツブラジルジャーナリズム提携

提携の概要

Folha de S.PauloとUOLが対象

ブラジル初のメディアパートナーシップ

ChatGPTで記事要約と出典リンクを表示

双方の狙い

9億人超の週間ユーザーに現地報道を提供

ブラジルは月間5000万人超の巨大市場

メディア側はCodexやAPI活用も可能に

信頼性ある情報源の統合を推進

詳細を見る

OpenAIは2026年5月25日、ブラジルの大手メディアグループであるGrupo FolhaおよびGrupo UOLと戦略的コンテンツ提携を発表しました。OpenAIにとってブラジルでの初のメディアパートナーシップとなり、Folha de S.PauloとUOLのジャーナリズムがChatGPT上で利用可能になります。

この提携により、世界で9億人を超えるChatGPTの週間アクティブユーザーが、両メディアの報道に基づく高品質な要約にアクセスできるようになります。OpenAIは米国・英国・フランス・ドイツに続き、ブラジルでも信頼性のある報道をAI体験に統合する取り組みを拡大しています。

ブラジルは現在、ChatGPTにとって世界最大級の市場の一つです。月間アクティブユーザーは5000万人超、1日あたり約1億4000万件のメッセージがやり取りされています。OpenAIのメディアパートナーシップ担当VPであるVarun Shetty氏は、現地に即した有用な回答を提供しつつニュースエコシステムを支援する意図を示しました。

メディア側にとっても大きな意義があります。Grupo FolhaとGrupo UOLはCodex、ChatGPT Enterprise、APIへのアクセス権も獲得し、AIを活用した新しいジャーナリズムの手法や読者向けプロダクトの開発、社内業務の効率化に取り組む機会を得ます。Folha de S.Paulo共同CEOのCarlos Ponce de Leon氏は「AIがニュース業界の次の時代を定義する」と述べ、変革の最前線に立つ姿勢を強調しました。

出典：OpenAI公式

Hugging FaceがAIエージェント用語集を公開

2026年05月25日 Claude Claude Code Codex エンジニア推論ポリシーエージェントプロンプトコンテキスト Cursor Hugging Face

主要用語の整理

ハーネスはモデル実行層

スキャフォールドは振る舞い定義層

エージェント=モデル+ハーネスの定式化

コンテキストエンジニアリングの体系化

訓練と実装の概念

ポリシーは行動確率分布を定義

スキルはツールより高次の再利用単位

サブエージェントによる自律的分業

RL環境・報酬設計の用語も網羅

詳細を見る

Hugging Faceは2026年5月25日、AIエージェント分野で混乱しがちな専門用語を整理した用語集「Harness, Scaffold, and the AI Agent Terms Worth Getting Right」を公開しました。ICLR 2026での議論をきっかけに、ハーネスやスキャフォールドといった用語の定義が人によって異なる問題を解消することを目的としています。

用語集の核心は、エージェントを構成する要素の分離です。モデルはテキストを入出力するLLMそのもので、単体ではループも記憶も持ちません。スキャフォールドはシステムプロンプトやツール定義、コンテキスト管理などモデルの振る舞いを規定する層です。ハーネスはモデルを呼び出しツールコールを処理し停止条件を判断する実行層で、「Agent = Model + Harness」という定式が示されています。

実務に直結する概念も体系化されています。コンテキストエンジニアリングは各ステップでモデルが参照する情報を設計する技術で、短期記憶と長期記憶の管理を含みます。スキルはツール（単一アクション）より高次の再利用可能な知識パッケージで、バグ調査から修正までの一連の手順を束ねるものです。サブエージェントは別のエージェントから呼ばれ、独自に推論しツールを使い結果を返す自律的な単位として定義されています。

訓練領域の用語も整理されています。RL環境はエージェントが行動を入力し観察を受け取る対話対象、トレーナーは多数のエピソードを実行し報酬に基づきモデルの重みを更新する仕組みです。報酬はテスト合否のような検証可能なものからLLM-as-judgeのような学習型まで分類され、ルーブリックによる多次元評価も紹介されています。

Claude CodeやCodex、Cursorといった製品は同じモデルを使っていてもハーネスの設計次第で体験が大きく変わると指摘されており、エージェント開発者にとって各層の役割を正確に理解する重要性が強調されています。用語の統一的な定義はまだ存在しないものの、議論を円滑にする実用的な共通言語として活用できる内容です。

出典：Hugging Face

GitHubとOpenAIがAIコーディング首位に

2026年05月22日 OpenAI NVIDIA Amazon GitHub Copilot GitHub Copilot Codex 生産性ワークフローセキュリティコーディングエージェント

Gartner評価の概要

12社を実行力とビジョンで評価

GitHubは3年連続リーダー選出

実行力で最高評価を獲得

OpenAIも初のリーダー認定

急成長する導入実績

GitHub Copilotが14万組織に拡大

前年比100%超の成長率

OpenAI Codexは週400万人利用

CiscoがCodexで開発期間を大幅短縮

エージェント時代の競争軸

コード生成からSDLC全体の自動化へ

ガバナンス・セキュリティが差別化要因

詳細を見る

Gartnerは2026年版「エンタープライズAIコーディングエージェント」マジック・クアドラントを発表し、GitHubとOpenAIの両社をリーダーに選出しました。12社のベンダーが実行力とビジョンの完全性で評価され、GitHubは実行力で最高位を獲得しています。

GitHubのCopilotは現在14万の組織で利用され、1年前の約3倍に急増しました。前年比100%超の成長を記録し、CLI版の利用も月次でほぼ倍増しています。Gartnerは、GitHubのネイティブ統合、セキュリティ制御、エージェント型ワークフローがエンタープライズ規模のAI開発統治で他に類を見ないと評価しました。

一方、OpenAIのCodexは週400万人以上が利用し、Cisco、Datadog、Dell、NVIDIAなどの大手企業が導入しています。Ciscoは自社のAI Defenseセキュリティプラットフォームの大部分をCodexで開発し、従来数四半期かかる開発を数週間に短縮しました。

Gartnerは両社に共通する強みとして、コード生成にとどまらずレビュー・テスト・セキュリティ・ガバナンスまでカバーするエージェント型ワークフローを挙げています。Gartnerの予測では、2028年までに非同期AIコーディングエージェントがソフトウェア開発チームの生産性を30〜50%向上させるとしています。

市場の競争軸は「コードを書く速さ」から「ソフトウェアを安全に出荷する速さ」へ移行しつつあります。GitHubはマルチモデル対応やモバイルからのリモート操作機能を、OpenAIはHIPAA準拠やAmazon Bedrock上の展開といったエンタープライズ向け機能を強化しており、両社ともSDLC全体をカバーするプラットフォーム戦略で差別化を図っています。

出典：GitHub公式 | OpenAI公式

SpotifyがAIポッドキャスト生成アプリを公開

2026年05月21日 Google マイクロソフト Amazon Claude Copilot Claude Code Codex NotebookLM 検索コンテンツ音声米国イタリアエージェントプロンプト Alexa

Studioアプリの概要

デスクトップ専用の独立アプリ

メール・カレンダーと連携し日次ブリーフィング生成

AIエージェントがウェブ検索や情報整理を代行

20以上の市場でリサーチプレビュー公開

アプリ内の新機能群

来月からSpotifyアプリ内でもAIポッドキャスト生成

Premium向けにエピソードQ&A;機能を提供開始

PDF・リンク・テキストを素材にカスタム音声で生成

NotebookLMやAlexa Plusと直接競合

詳細を見る

Spotifyは2026年5月21日、AIを活用した新しいデスクトップアプリ「Studio by Spotify Labs」を発表しました。このアプリは、ユーザーのメールやカレンダー、メモなどの外部サービスと連携し、Spotifyの視聴履歴も加味して、パーソナライズされたデイリーブリーフィングやポッドキャスト、プレイリストを自動生成します。18歳以上のユーザーを対象に、20以上の市場でリサーチプレビューとして順次提供されます。

StudioアプリにはAIエージェントが搭載されており、ウェブブラウジングやトピックのリサーチ、情報の整理といったタスクをユーザーに代わって実行できます。たとえば「イタリア旅行の日程に合わせたデイリーブリーフィングを作って、近くのおすすめレストランも紹介して」といった複数ステップの依頼にも対応します。生成されたポッドキャストはSpotifyライブラリに保存され、デバイス間で同期されますが、一般公開はされません。

Spotifyはこれと並行して、アプリ内で直接AIポッドキャストを生成できる「Personal Podcasts」機能を来月開始すると発表しました。ユーザーはプロンプトを入力するだけで、関心のあるテーマについてのポッドキャストを作成できます。PDFやリンク、テキストを素材として指定し、カスタムボイスを選ぶことも可能です。

さらに、米国・スウェーデン・アイルランドのPremiumユーザー向けに、ポッドキャストのAI Q&A;機能が本日提供開始されました。再生中のエピソードについて質問したり、特定トピックのタイムスタンプを検索したり、関連するポッドキャストのレコメンドを受けたりできます。

AIポッドキャスト生成の分野では、GoogleのNotebookLMが2024年から先行しており、AmazonのAlexa PlusやMicrosoftのEdge Copilotも参入しています。しかしSpotifyは既に膨大なオーディオユーザーベースを抱えており、音声コンテンツのプラットフォームとして優位に立てる可能性があります。今月初めにはClaude CodeやCodex向けのCLIツールも公開しており、AI音声コンテンツの中心的存在を目指す姿勢を鮮明にしています。

出典：TechCrunch | The Verge | TechCrunch

AIコーディングでロボット操作、誰でもロボティクスの時代へ

コードでロボット制御

OpenClawとCodexでロボットアーム操作

赤いボール把持プログラムを自動生成

AIモデル訓練もエージェントが支援

従来数時間の設定作業を大幅短縮

CaP研究の進展

UC Berkeley等がCaP-Xベンチマーク開発

ロボット制御ではGeminiが最高性能

Nvidiaと共同で実用化を推進

Spencer Huangが社内ハッカソン主導

詳細を見る

WIREDの記者Will Knight氏が、AIエージェントOpenClawとOpenAIのCodexを使い、オープンソースのロボットアーム「LeRobot 101」をバイブコーディングで制御する実験を行いました。従来は専門知識が必要だったロボットの設定・制御が、AIコーディングによって飛躍的に簡単になりつつあります。

LeRobot 101はHuggingFaceが提供するオープンソースのロボットアームで、コントローラーアームとカメラ付きフォロワーアームの2本で構成されます。Knight氏は手動での接続・キャリブレーションに数時間を費やし、モーターの過熱トラブルにも見舞われました。しかしOpenClawとCodexを用いると、接続設定やジョイントの校正を自動で処理し、赤いボールを検出して掴むPythonスクリプトまで生成できました。

さらにOpenClawの支援のもと、ロボットアームを制御するAIモデルの訓練にも成功しています。エージェントがトレーニングプロセスを案内し、各訓練後のエラー率を確認するなど、専門家なしでもモデル開発が可能であることを示しました。ハルシネーションによるバグは残る課題ですが、成果は十分に実用的なレベルです。

この手法は2022年の論文で提唱された「Code as Policy」に基づいています。UC BerkeleyのKen Goldberg教授らはNvidia、カーネギーメロン大学、スタンフォード大学と共同で、コーディングモデルのロボット制御能力を測るCaP-Xベンチマークを開発しました。興味深いことに、ロボット制御で最も高い性能を示したのはClaudeやChatGPTではなくGoogleのGeminiでした。マルチモーダル学習と物理世界の理解に注力してきた成果とみられます。

NvidiaのJensen Huang CEOの息子であるSpencer Huang氏は、社内ハッカソンでバイブコーディングによるロボット制御の実験を推進しています。Goldberg教授との共同研究では、Code as Policyをより多くのロボットソフトウェアツールと互換性を持たせることを目指しています。「ほぼ誰でもロボティクスに参入できるようになること、それが真のブレークスルーだ」とHuang氏は語っており、音声やテキストでロボットを操作できる未来が近づいています。

出典：WIRED

Google、SynthIDとC2PAを検索に統合

2026年05月20日 Google OpenAI Meta Instagram Gemini ChatGPT Chrome Codex 検索ディープフェイクコンテンツ画像オープンソースモデル

検証機能の大幅拡大

SynthID検証がChrome・検索に搭載

C2PA情報も同一画面で確認可能に

OpenAIもChatGPT 画像にSynthID埋め込み開始

実効性への課題と期待

C2PAメタデータはSNS投稿時に容易に除去される

SynthIDは除去困難で事実検証に実績

オープンソースモデルの採用は不透明

MetaのC2PA活用

Instagramでカメラ撮影写真にC2PAタグ付与

AI生成画像と実写の判別を支援

詳細を見る

Googleは2026年5月19日のI/Oカンファレンスで、AI生成コンテンツの検証技術であるSynthIDのマーカー確認機能をChromeブラウザとGoogle 検索に統合すると発表しました。Chromeはウェブブラウザ市場で圧倒的なシェアを占めており、この統合により数十億人規模のユーザーがAI生成画像の真偽を手軽に確認できるようになります。

さらにGoogleの検証インターフェースは、コンテンツの来歴を記録する業界標準規格C2PA Content Credentialsの情報も同時に表示します。従来はSynthIDの確認にGeminiアプリ、C2PAの確認に専用ポータルと別々のツールが必要でしたが、これを一画面に集約することで検証の手間を大幅に削減します。

OpenAIも同日、ChatGPT・Codex・APIで生成した画像にSynthIDを埋め込む方針を発表しました。同社はすでにC2PAメタデータを付与していますが、SNSへの投稿時にメタデータが除去される問題が指摘されています。OpenAI自身もC2PAについて「銀の弾丸ではない」と認めており、スクリーンショットの撮影やプラットフォームへのアップロードで容易に失われる限界があります。

一方、SynthIDは画像に不可視の電子透かしを埋め込む方式のため、メタデータ除去の影響を受けにくく、ファクトチェッカーによるディープフェイク検証で実績を積んでいます。両技術が相互補完的に機能することで、より広範な安全網を構築できる可能性があります。

MetaもInstagramでカメラ撮影画像にC2PAメタデータを付与する取り組みを開始します。これによりユーザーは実写とAI生成画像を区別しやすくなりますが、過去にはAIラベルの誤適用で批判を受けた経緯もあります。悪意あるディープフェイクに使われるオープンソースモデルがこれらの仕組みを採用する保証はなく、来歴技術の実効性はこれから問われることになります。

出典：The Verge

Ramp、Codex活用でコードレビューを数分に短縮

2026年05月20日 OpenAI Codex AI活用 GPT-5 エンジニア推論コードレビュー投資エージェント

コードレビューの革新

CodexがPRを数分でレビュー

人間が見落とす問題も自動検出

全コードレビューで必須ツールに昇格

オンコール業務の自動化

On-Call Assistantの開発を推進

複雑なインシデント調査をGPT-5.5が支援

ビジネスロジックの把握を効率化

エンジニアの役割変化

コード記述者からオーケストレーターへ転換

AI活用スキルが競争力の源泉に

詳細を見る

フィンテック企業Rampのエンジニアリングチームが、OpenAIのCodexとGPT-5.5を組み合わせたコードレビュー体制を本格導入しました。従来は最初のレビューまで数時間かかっていたプルリクエストが、数分で実質的なフィードバックを得られるようになっています。

Ramp AI Developer Experience チームを率いるAustin Ray氏によると、Codexのコードレビューは「業界のゴールドスタンダード」であり、エンジニアが指名で利用を求めるほど信頼されています。他のAIレビューツールとの違いは、コードベース全体に対して深く推論する能力にあり、多くの人間レビュアーが時間的に実現できない水準の網羅性を発揮します。

同チームはCodexを活用し、オンコールローテーション業務を支援するエージェント型ツール「On-Call Assistant」の開発も進めています。オンコール業務では大量のビジネスロジックやドメイン知識、並行処理のバグなど複雑な要素を同時に扱う必要がありますが、GPT-5.5の推論能力がその負荷を大幅に軽減しているとRay氏は述べています。

Ray氏は他の技術リーダーに向け、AIツール導入のアドバイスも示しました。まずエンジニアと一緒にCodexを実際に使うセッションを行い、初回体験の質を高めること。そしてベンダーとのフィードバックループに投資し、継続的に改善することが重要だと強調しています。

Ray氏は「エンジニアはオーケストレーターになる」と展望を語ります。すべてのコードを自分で書くスキルではなく、AIツールをいつ信頼しいつ修正を求めるかの判断力が、今後のエンジニアの競争力を決定づけるとの見解を示しました。

出典：OpenAI公式

OpenAI教育プログラムにシンガポール参加、9カ国に拡大

2026年05月20日 OpenAI ChatGPT Codex 生産性アシスタントイタリアスタンフォードエージェント教師

第1期の成果と実績

ヨルダンで100万人超の生徒が利用

カザフスタンで8.4万教員がAI研修修了

スロバキアの教員9割超が生産性向上を報告

エストニアで2万人超の生徒に展開済み

シンガポールとの協力

母語学習の個別最適化を支援

教育省・GovTechと共同で活用事例構築

教員向けワークショップを実施

今後の展開方針

教員主導のLuminariesプログラム開始予定

次期参加国の募集を年内に発表

詳細を見る

OpenAIは2026年5月20日、ロンドンで開催されたEducation World Forumにおいて、教育支援プログラム「Education for Countries」の次段階を発表しました。今年のダボス会議で発足した同プログラムにシンガポールが新たに参加し、エストニア、ギリシャ、イタリア、スロバキア、トリニダード・トバゴ、カザフスタン、UAE、ヨルダンに続く9カ国目となります。

第1期参加国ではすでに具体的な成果が出ています。ヨルダンでは100万人以上の生徒と10万人以上の教員がAI教育アシスタント「Siraj」を利用しています。カザフスタンでは全20地域でChatGPT Eduが導入され、8万4000人超の教員がAI準備研修を修了しました。スロバキアの大学調査では、教員の9割超が週5時間程度の時間削減を実感しています。

シンガポールでは、18〜24歳のChatGPT利用の約43%が学習・教育目的であることが判明しています。同国の教育省およびGovTechと連携し、母語学習のインタラクティブな個別最適化などのユースケースを構築します。教員向けにはOpenAI Academyのシンガポール版ワークショップや、Codex for Teachersハッカソンも実施予定です。

プログラム全体は「研究主導の展開」「現地化されたAI学習ツール」「教員研修と支援」の3本柱で構成されています。OpenAIの学習成果測定スイートを活用し、政府・教育者と共同でAIの学習への影響を検証します。エストニアではタルトゥ大学やスタンフォード大学と連携し、2万人超の生徒を対象とした実教室環境での影響調査を進めています。

今後は教員との共同設計を軸とする「OpenAI Luminaries」の第1フェーズを近く開始する予定です。次期参加国の選定も進んでおり、年内に発表される見通しです。週9億人超がChatGPTを利用するなか、OpenAIはエージェント型AIの教育活用を政府レベルで推進する方針を鮮明にしています。

出典：OpenAI公式

FigmaがAIエージェントをデザインキャンバスに搭載

2026年05月20日 OpenAI Anthropic Claude Claude Code Codex デザイン画像編集ファインチューニング画像コーディング提携買収エージェントプロンプト Adobe Canva Figma

AIエージェントの機能

自然言語でデザイン生成・編集

複数エージェントの同時並行実行

デザイン文脈を理解する専用モデル

既存デザインの反復生成を自動化

事業環境と成長

Canva・Adobe等との競争激化

2026年Q1売上は前年比46%増

Anthropic・OpenAIとの提携済み

デザインとコードの統合を推進

詳細を見る

Figmaは2026年5月20日、協調デザインキャンバス上で動作する独自のAIエージェントを発表しました。ユーザーは自然言語のプロンプトで新規デザインの生成、既存デザインの編集、反復作業の自動化を指示でき、複数のエージェントを同時に起動して並行作業させることも可能です。

同社によると、このAIエージェントはデザイン用途にファインチューニングされたモデルで動作し、デザインの文脈や要素を理解します。チーフデザインオフィサーのLoredana Crisan氏は「ソフトウェア構築が容易になるなか、最も重要なのは方向性の設定だ」と述べ、エージェントとの協働でアイデアの検証やエッジケースの可視化が加速すると強調しました。

AIエージェントはまずFigma Designで提供を開始し、今後は他の製品にも展開する計画です。同社はこれに先立ち、AnthropicのClaude CodeやOpenAIのCodexといったAIコーディングツールとの連携を進めており、デザインとコードの距離をさらに縮める方針を示しています。

FigmaはCanvaやAdobe、Flora、Kreaなど競合との激しい競争に直面しています。昨年にはノードベースのデザインツールWeavyを買収し、AI画像編集機能も追加しました。2026年第1四半期の売上高は3億3,340万ドルで前年同期比46%増と、AI時代においても堅調な成長を続けています。

出典：TechCrunch

Google AI Studioでプロンプトからネイティブアプリ開発が可能に

2026年05月19日 Google OpenAI GitHub Replit Gemini Claude Android Claude Code Codex エンジニアハードウェアコーディングエージェントプロンプト Cursor

AI Studioの新機能

プロンプト入力でAndroidアプリ生成

Kotlin＋Jetpack Composeで構築

ブラウザ内エミュレータで即座にプレビュー

USB接続で実機インストール対応

Android CLI 1.0の安定版公開

Claude CodeやCodex等の外部AIエージェント対応

Android Studioの知識ベースにCLI経由でアクセス可能

アプリ公開と発見の変化

Google Play審査基準は従来どおり維持

Gemini経由のアプリ発見機能を数週間内に展開

詳細を見る

Googleは2026年5月19日のGoogle I/O 2026で、Web版AI StudioにネイティブAndroidアプリの開発機能を追加したと発表しました。従来は数週間かかっていたセットアップとコーディングが、プロンプトを入力するだけで数分に短縮されます。非エンジニアでもアプリを作れるようになり、CursorやReplit、Claude Codeなどと競合する領域に本格参入した形です。

生成されるアプリはKotlinとJetpack Composeで構築され、GPS・Bluetooth・NFCなどハードウェアセンサーとの連携もサポートします。ブラウザ上の組み込みAndroidエミュレータでリアルタイムにプレビューでき、USB経由で実機にインストールして動作確認が可能です。現時点では個人利用向けアプリが主な対象で、家族・友人への配布機能は今後追加予定とされています。

同時に発表されたAndroid CLI 1.0の安定版リリースも注目点です。これにより、Claude CodeやOpenAI Codex、Google自身のAntigravityといったAIエージェントが、Android Studioの専門知識にコマンドライン経由でアクセスできるようになりました。Google以外のAIツールでAndroid開発を行うユーザーが増えている現実を受けた対応です。

アプリの公開・流通面にも変化があります。AI Studioから直接Google Play Consoleの内部テストトラックへアップロードでき、GitHubへのエクスポートやAndroid Studioへの引き継ぎにも対応します。Google Playの品質審査基準は変わりませんが、Geminiとの会話内でアプリを推薦する新しい発見機能が数週間以内にウェブとAndroidで展開される予定で、開発者にとって新たな流入経路が生まれます。

出典：The Verge | TechCrunch | TechCrunch

OpenAIとDellがCodexのオンプレミス展開で提携

2026年05月18日 OpenAI ChatGPT Codex AI導入エンジニアインフラセキュリティコーディングデプロイコードレビュー提携エージェント

提携の概要

CodexをDell環境で展開

週400万人超の開発者が利用

ハイブリッド・オンプレ対応強化

コード以外の業務領域にも拡大

企業への影響

既存データ基盤との直接連携

セキュリティ要件を満たす導入経路

AIエージェントの本番運用を加速

ソフト開発からナレッジワークまで対象

詳細を見る

OpenAIとDell Technologiesは2026年5月18日、OpenAIのAIコーディングツール「Codex」を企業のハイブリッドおよびオンプレミス環境に展開するための提携を発表しました。Codexは現在、毎週400万人以上の開発者が利用しており、OpenAIの法人向け製品で最も急成長しているサービスの一つです。

Codexの用途はコーディングにとどまりません。コードレビューやテストカバレッジ、インシデント対応に加え、レポート作成やリード選別、フォローアップ文書の生成など、ソフトウェア開発以外のビジネス業務にも活用が広がっています。

今回の提携では、CodexをDell AI Data Platformと接続し、企業が社内に保有するコードベース、ドキュメント、業務システム、運用ナレッジといったデータに直接アクセスできるようにします。これにより、AIエージェントが実際の業務文脈を踏まえた出力を行えるようになります。

さらに両社は、Dell AI Factoryとの連携も検討しています。Codex、ChatGPT Enterprise、その他APIベースのソリューションがAI Factoryと接続し、データ準備やシステム管理、テスト実行、AIアプリケーションのデプロイを企業のインフラ上で行える仕組みを目指します。

大企業がAIエージェントを本番環境で運用するには、データの所在地やセキュリティ管理が重要な課題となります。Dell環境上でCodexを稼働させることで、企業は既存のガバナンス体制を維持したままAI導入を加速できる道筋が開かれます。

出典：OpenAI公式

OpenAIブロックマンが製品統括、ChatGPTとCodex統合へ

2026年05月16日 OpenAI ChatGPT Sora Codex 動画生成創業者 AGI 動画デプロイサム・アルトマン医療エージェント

組織再編の背景

Simo医療休暇中の暫定体制を正式化

Altmanの「コードレッド」宣言で本業回帰

Sora・科学部門など副次事業を停止

統合プラットフォーム構想

ChatGPT・Codex・APIを単一製品に

消費者とエンタープライズ両面で勝利狙う

エージェント型の未来に全社集中

詳細を見る

OpenAI共同創業者で社長のグレッグ・ブロックマンが、同社の製品戦略を正式に統括することが2026年5月16日に報じられました。AGI デプロイメント担当CEOのフィジ・シモが医療休暇中であることを受け、暫定的に製品を監督していた体制を公式化した形です。

ブロックマンは社内メモで、ChatGPTとプログラミング製品Codexを統合し、単一のプラットフォームにする計画を明らかにしました。「エージェント型の未来に向けて最大限のフォーカスで実行するため、製品体制を集約する」と述べ、消費者・エンタープライズの両市場での勝利を目指す方針を示しています。

この動きは、2025年末にCEOサム・アルトマンが「コードレッド」を宣言し、コアのChatGPT体験への再集中を打ち出した流れの延長線上にあります。以降、動画生成ツールSoraやOpenAI for Scienceなどの副次プロジェクトが相次いで中止されてきました。

OpenAIはTechCrunchに対し、シモは医療休暇中ながらブロックマンと共にこの変更に取り組んだと説明しています。ChatGPT・Codex・APIを一つの製品チームのもとに統合する計画は、以前からシモ自身も言及していた構想であり、今回の再編はその実行を加速させるものと位置づけられています。

出典：TechCrunch

OpenAI再編、ChatGPTとCodexを統合へ

2026年05月15日 Google OpenAI Anthropic Instagram ChatGPT Codex チャットボット広告エンジニア創業者インフラ AGI コーディング医療人事投資 IPO エージェント Alexa

組織再編の全容

Brockmanが製品戦略を正式統括

ChatGPTとCodexを単一プラットフォームに統合

Simo医療休暇中の体制を恒久化

4部門体制でエージェント戦略に集中

幹部人事と狙い

Sottiaux氏が中核製品・基盤を指揮

Turley氏はエンタープライズ専任に転換

Alexander氏が消費者向け部門を新設統括

IPO準備と収益化加速が背景

詳細を見る

OpenAIは2026年5月15日、社内メモで大規模な組織再編を発表しました。共同創業者でプレジデントのGreg Brockman氏が製品戦略の全権を正式に掌握し、同社の主力製品であるChatGPTとコーディングエージェント Codexを「単一のエージェントプラットフォーム」に統合する方針を明らかにしました。Brockman氏はメモの中で「エージェントの未来に向けて最大限の集中力で実行する」と述べています。

今回の再編では、Brockman氏の下に4つの柱が設けられます。CodexのエンジニアリングリーダーだったThibault Sottiaux氏がコア製品・プラットフォーム部門を率い、ChatGPT立ち上げ時から責任者を務めてきたNick Turley氏はエンタープライズ部門に異動します。消費者向け部門はInstagram元VPのAshley Alexander氏が統括し、アプリケーションCTOのVijaye Raji氏がインフラ・広告・データサイエンス部門を担当します。

この動きの直接的な契機は、AGI展開責任者だったFidji Simo氏の医療休暇です。先月から暫定的にBrockman氏が製品を統括していましたが、Simo氏の復帰時期が見通せない中で体制を恒久化しました。WIREDによると、Simo氏は今回の組織変更にもBrockman氏と直接協力したとされています。

背景にあるのは、IPOを見据えた事業の選択と集中です。OpenAIはAnthropicのコーディング領域での台頭やGoogleの消費者向けチャットボットとの競争激化に直面しています。先月にはKevin Weil氏やBill Peebles氏ら複数の幹部が退社しており、「副次的プロジェクトへのリソース投下を止める」という方針転換が進んでいます。ChatGPT、Codex、開発中の「スーパーアプリ」への集中投資で、週間アクティブユーザー9億人超の基盤を収益に直結させる狙いです。

出典：WIRED | The Verge

OpenAI Codexがモバイル対応、スマホからコード開発を遠隔操作

2026年05月14日 OpenAI Anthropic ChatGPT Claude Sora Android iOS Claude Code Codex エンジニア認証コーディング CI/CD 医療エージェントプロンプト

モバイル連携の全容

ChatGPTアプリからCodexを遠隔操作

iOS・Android対応、無料プラン含む全プランで利用可

スレッド管理・コマンド承認・モデル変更をスマホで完結

セキュアリレー層で端末を公開せず同期

エンタープライズ機能の拡充

Remote SSHが一般提供開始

プログラマティックアクセストークンでCI/CD連携

Hooksが正式リリース、プロンプト検証やログ記録に対応

HIPAA準拠をEnterprise向けに提供

AIコーディング競争の激化

週間利用者数が400万人超に到達

Anthropicは2月に類似のRemote Controlを先行投入

詳細を見る

OpenAIは2026年5月14日、コーディングエージェント「Codex」をChatGPTモバイルアプリに統合したと発表しました。iOS・Androidの両プラットフォームに対応し、無料プランを含む全プランのユーザーがプレビュー版を利用できます。ユーザーはスマートフォンから、PCやリモート環境で稼働中のCodexに対してタスクの指示、出力の確認、コマンドの承認などを行えるようになります。

技術的には、セキュアリレー層を介して端末間の通信を実現しています。開発マシンをインターネットに直接公開することなく、スクリーンショットやターミナル出力、差分、テスト結果といった情報がリアルタイムでスマートフォンに同期されます。ファイルや認証情報、権限設定はCodexが動作するマシン側に保持される設計です。

同時にエンタープライズ向けの機能も大幅に拡充されました。Remote SSHが一般提供となり、管理されたリモート開発環境への直接接続が可能になりました。CI/CDパイプラインとの連携を想定したプログラマティックアクセストークン、プロンプト検証やログ記録に使えるHooksも正式リリースされています。さらに、ChatGPT Enterpriseワークスペース向けにHIPAA準拠のローカル環境利用がサポートされ、医療機関での活用にも道が開かれました。

今回の発表は、AIコーディングツール市場での競争激化を反映しています。Codexの週間利用者数は400万人を超えましたが、AnthropicのClaude Codeは企業やエンジニアの間で急速に支持を広げており、同様のモバイル遠隔操作機能「Remote Control」を2月に先行リリースしていました。OpenAIはSoraの終了など「サイドクエスト」の整理を進め、Codexを中核プロダクトとして強化する方針を鮮明にしています。

出典：The Verge | TechCrunch | OpenAI公式

OpenAI、Codex向けWindows用サンドボックスを独自開発

2026年05月13日 OpenAI Codex Windows MacOS ワークフローネットワークエンジニアリスクセキュリティコーディングエージェント

既存手段の限界

AppContainerは柔軟性不足

Windows Sandboxは実環境と隔離

整合性ラベルはリスク過大

環境変数によるネット遮断は回避可能

独自設計の全体像

専用ユーザーと制限トークンの二重構造

書き込み制限付きSIDで粒度の高いFS制御

Windows Firewallで確実なネット遮断

3バイナリ分離で権限昇格を最小化

詳細を見る

OpenAIは、コーディングエージェント「Codex」のWindows版に向けて、独自のサンドボックス機構を設計・実装したことを発表しました。macOSのSeatbeltやLinuxのseccompのような既成のOS級サンドボックスがWindowsには存在せず、開発者の実作業環境で安全にエージェントを動かすという課題に正面から取り組んでいます。

設計チームはまずAppContainer、Windows Sandbox、整合性ラベル（MIC）の3手段を検討しましたが、いずれもCodexの要件を満たしませんでした。AppContainerは汎用的な開発ワークフローに対応できず、Windows Sandboxはユーザーの実環境を直接操作できないうえHome版では利用不可、MICはワークスペース全体の信頼レベルを下げてしまうリスクがありました。

最終的に採用されたのは、専用Windowsユーザー（CodexSandboxOffline/Online）と制限付きトークンを組み合わせたアーキテクチャです。合成SIDによる書き込みACLでファイルシステムの操作範囲を限定し、Windows Firewallのユーザー単位ルールでネットワークアクセスを遮断します。初期プロトタイプでは環境変数ベースのネット制限にとどまっていましたが、専用ユーザー導入によりOS レベルの強制力を獲得しました。

実装はcodex.exe（本体）、codex-windows-sandbox-setup.exe（管理者権限でのセットアップ）、codex-command-runner.exe（制限トークンでのコマンド実行）の3バイナリに分離されています。管理者権限が必要なのはセットアップ時のみで、通常のCodex利用は一般ユーザー権限で動作します。セキュリティと使い勝手の両立を目指した設計判断の積み重ねが、最終的なアーキテクチャを形作っています。

出典：spectrum.ieee.org

OpenAI、Codex用Windows版サンドボックスを独自開発

2026年05月13日 OpenAI Codex Windows MacOS ワークフローネットワークエンジニアリスクセキュリティコーディングエージェント

既存手段の限界

AppContainerは汎用開発に不向き

Windows Sandboxは実環境と隔離

整合性ラベルはセキュリティリスク大

環境変数によるネット制限は回避容易

独自設計の最終形

専用ユーザーと制限付きトークン併用

Windows Firewallで通信を厳格遮断

書き込み制御にACLと合成SIDを活用

4層構成で安全性と利便性を両立

詳細を見る

OpenAIのコーディングエージェントCodexは、開発者のローカルマシン上でコマンドを実行するため、安全なサンドボックス環境が不可欠です。macOSやLinuxにはSeatbeltやseccompといったOS標準の隔離機構がありますが、Windowsには同等の仕組みがなく、ユーザーは毎回コマンドを手動承認するか、制限なしのフルアクセスモードを使うかの二択を強いられていました。

開発チームはまずWindows標準のAppContainer、Windows Sandbox、整合性レベル制御（MIC）を検討しましたが、いずれもエージェント型ワークロードには不適合でした。AppContainerは事前に必要な権限を定義する必要があり、Git・Python・ビルドツールなど多様なプロセスを動的に起動するCodexの用途に合いません。Windows Sandboxは使い捨てVMであり、ユーザーの実際の開発環境に直接作用できないという根本的な問題がありました。

最初のプロトタイプでは、合成SIDと書き込み制限付きトークンを組み合わせ、管理者権限不要のサンドボックスを構築しました。ファイル書き込みはワークスペース内に限定できたものの、ネットワーク制御が環境変数ベースの「助言的」な制限にとどまり、悪意あるコードが直接ソケットを開けば容易に迂回できる弱点がありました。

最終的に採用された設計では、セットアップ時に管理者権限を要求する代わりに、CodexSandboxOffline・CodexSandboxOnlineという2つの専用Windowsユーザーを作成します。オフラインユーザーにはWindows Firewallで全送信トラフィックを遮断するルールを適用し、OS層で確実にネットワークアクセスを制御します。コマンド実行はcodex-command-runner.exeがサンドボックスユーザーとして起動し、制限付きトークンを生成してから子プロセスを立ち上げる2段階方式です。

最終アーキテクチャはcodex.exe、セットアップ用バイナリ、コマンドランナー、子プロセスの4層構成となりました。各層が独立した責務を持つことで、権限昇格の範囲を最小化しつつ、開発者が普段使うワークフローとの互換性を維持しています。単一のOS機能では実現できなかった「安全かつ実用的な自律コーディングエージェント」を、複数の仕組みの組み合わせで達成した事例です。

出典：OpenAI公式

Notionがエージェント連携の開発者基盤を公開

2026年05月13日 Salesforce Notion Claude Claude Code Codex 生産性ワークフローエンジニアインフラクラウドコーディングエージェント MCP Cursor

新開発者プラットフォーム

Workersでカスタムコード実行

外部DB同期をAPI経由で実現

Webhookによる自動トリガー対応

8月まで無料で開発者に開放

外部エージェント統合

Claude CodeやCursor等と連携

外部エージェントAPIを提供

MCPプロトコル対応のツール構築

CLIで開発者が直接操作可能

詳細を見る

Notionは5月13日、AIエージェント時代に対応する新たな開発者プラットフォームを発表しました。カスタムAIエージェントの機能拡張、外部エージェントとの接続、複数ステップのワークフロー自動化を可能にするもので、同社をノートアプリからエージェント協業の中核基盤へと転換させる狙いがあります。

中核機能のWorkersは、Notionのクラウド上でカスタムコードを安全なサンドボックス内で実行できる仕組みです。外部インフラに依存せずにデータ同期やWebhookトリガーを構築でき、SalesforceやZendesk、PostgresなどのデータをNotion上のデータベースに取り込めます。AIコーディングエージェントにコード生成を任せることも可能です。

外部エージェント連携では、Claude Code、Cursor、Codex、Decagonをローンチパートナーとして対応しました。ユーザーはNotionのチャット上でこれらのエージェントに作業を割り当て、進捗を追跡できます。自社開発の社内エージェントを接続するためのExternal Agent APIも提供されます。

今回の発表は、Notionが単なる生産性アプリからプログラマブルなプラットフォームへと戦略転換する意思表示です。2月に導入したカスタムエージェントは既に100万件以上作成されており、今回の基盤整備によりワークフロー自動化プラットフォームとしての競争力強化を図ります。Business・Enterpriseプランで利用可能なNotion CLIを通じて開発者が操作します。

出典：TechCrunch

Anthropicが企業AI導入率でOpenAIを初めて逆転

2026年05月13日 OpenAI Anthropic GitHub Claude Claude Code Codex AI導入エンジニア推論リスクコーディング米国ブランドエージェントベンチマークオープンソースモデル SpaceX

Rampデータが示す逆転

Anthropic採用率34.4%で首位

OpenAIは32.3%に低下

1年で採用率が4倍に急伸

Claude Codeが成長の原動力

リードを脅かす3つのリスク

企業のAI予算超過が深刻化

需要急増で品質・安定性が低下

OpenAI CodexやOSSが追い上げ

経済合理性を超えた選択

ベンチマーク同等でも割高なClaudeに需要集中

国防総省拒否がブランド忠誠を醸成

詳細を見る

フィンテック企業Rampが5万社超の支出データをもとに公表した2026年5月版AIインデックスによると、Anthropicの企業導入率が34.4%に達し、OpenAIの32.3%を初めて上回りました。Anthropicは1年前の約8%から4倍以上に急成長した一方、OpenAIは2025年半ばの約36.5%をピークに緩やかな下降が続いています。企業AI導入率全体も50.6%に達し、米国の職場でAIが日常化しつつあることが見て取れます。

この急成長を牽引したのが、エージェント型コーディングツールClaude Codeです。GitHub公開コミットの4%がClaude Code経由とされ、前月比で倍増しました。Rampのエコノミストは、Anthropicが技術者層のアーリーアダプターを足がかりに主流市場へ拡大した戦略が奏功したと分析しています。新規AI導入企業の約70%がOpenAIよりAnthropicを選んでおり、2025年の傾向から完全に逆転しています。

しかしRampの分析は、Anthropicの優位が盤石ではないと警告しています。第一のリスクはコスト構造です。UberではAI予算をわずか4カ月で使い切り、エンジニア1人あたり月額500〜2,000ドルのAPI費用が発生しています。第二に、需要の急増によりサービス障害やレート制限が頻発し、ユーザー不満が高まっています。Anthropicは対策としてSpaceXとの300MW超のコンピュート契約を締結しましたが、大半の新規容量は2026年後半以降の稼働です。

第三の脅威は競争環境です。OpenAIのCodexはClaude Codeと同等の機能を低価格で提供し、Uber自身もすでにCodexの検証を始めています。オープンソースモデルを安価に利用できる推論プラットフォームも急成長中です。それでもAnthropicへの需要が衰えない背景には、国防総省の利用条件を拒否した姿勢がブランド忠誠を生んだ「文化的要因」があるとRampは指摘します。AIモデルの選択が合理的な調達判断ではなくアイデンティティの表明になりつつある可能性は、この市場の異質さを物語っています。わずか2ポイントのリードが、史上最も不安定なソフトウェア市場で勝ち取られたものであることを忘れてはなりません。

出典：VentureBeat | TechCrunch

OpenAI、ML競技「Parameter Golf」の成果と教訓を公開

2026年05月12日 OpenAI Codex 機械学習コーディングエージェント

競技の概要と成果

1,000人超・2,000件超の提出

16MB制限下での損失最小化競技

量子化や新モデル手法など多様な創意

AIエージェントの影響

参加者の大半がコーディングエージェント活用

参入障壁の低下と実験速度の向上

不正検出にCodexトリアージボット導入

今後の展望

人材発掘の有効な手段として機能

エージェント時代の競技運営モデルを模索

詳細を見る

OpenAIは、機械学習コミュニティ向けに実施したオープンチャレンジ「Parameter Golf」の振り返りを公開しました。この競技は、FineWebデータセットに対する損失を最小化しつつ、モデルの重みと学習コードを合わせて16MB以内に収め、8基のH100で10分以内に学習を完了させるという厳しい制約の下で行われました。8週間で1,000人以上が参加し、2,000件を超える提出がありました。

技術面では、オプティマイザの精密チューニングや量子化による圧縮、テスト時学習戦略、新しいモデリング手法など、幅広いアプローチが見られました。記録トラックでは再現性を独立検証し、非記録トラックでは非自己回帰型テキストモデリングや動的トークナイゼーションなど実験的な手法も登場しています。

今回の競技で最も注目すべき変化は、AIコーディングエージェントの広範な活用です。参加者の大多数がエージェントを使い、実験のセットアップやコード理解を効率化しました。RunPodによる100万ドル相当の計算資源提供と合わせ、参加の敷居が大きく下がりました。一方で、上位スコアの小修正を繰り返す模倣的な提出が増え、ルール違反の連鎖も発生しています。

運営側はこの大量提出に対応するため、Codexベースのトリアージボットを開発し、提出の自動監視と人間レビューへの振り分けを実施しました。ピーク時には1日数百件の提出があり、手動確認だけでは追いつかない状況でした。コミュニティからもレビューツールやライブ速報が自発的に生まれています。

OpenAIはParameter Golfを人材発掘の手段としても位置づけており、優れた機械学習センスと粘り強さを持つ人材の発見に有効だったと評価しています。エージェント時代における研究コンペティションの在り方について貴重な知見が得られたとし、今後も同様のチャレンジを計画していく方針です。

出典：OpenAI公式

OpenAIがCodex活用事例を公開、NVIDIAは研究速度10倍に

2026年05月12日 OpenAI NVIDIA Codex 生産性ワークフロー業務効率 GPT-5 エンジニア強化学習コンテンツプライバシーコーディングエージェント

NVIDIAでの導入成果

GPT-5.5搭載Codexを全社4万人に展開

研究ワークフローで10倍の速度向上達成

MVPから本番システムへの移行を自律的に実行

Python→Rust変換で20倍の効率化事例も

財務チーム向け活用法

月次レビュー資料の初稿作成を自動化

予算差異分析やシナリオ比較を即座に生成

既存ファイルを入力にコーディング不要で成果物作成

詳細を見る

OpenAIは2026年5月12日、自社のAIコーディングツールCodexの実践的な活用事例を2件公開しました。NVIDIAのエンジニア・研究チームによる大規模導入と、財務部門向けの業務活用ガイドで、いずれもCodexが専門業務の生産性を大きく変える可能性を示しています。

NVIDIAでは4万人の社員がCodexにアクセスできる環境を整備し、GPT-5.5を搭載したCodexをエンジニアリングと研究の両面で活用しています。コーディングエージェントチームのシニアエンジニアDennis Hannusch氏は、社内プラットフォームをMVPから本番システムへ進化させる作業をCodexで完遂したと報告。プライバシー要件のあるポッドキャスト録音アプリも数時間で構築・テストまで自律的に完了したといいます。

研究面では、AI研究者のShaunak Joshi氏が強化学習分野の論文群をCodexに読み込ませ、仮説の発見からMLスクリプトの作成・リモート実行までの一連の研究ワークフローを10倍高速化できたと述べています。SSH接続によるリモートマシンでの大規模ML実験をノートPCから直接実行できる点も評価されています。さらに、既存のPythonコードをRustに変換して20倍効率化する用途でも活用が広がっています。

一方、財務チーム向けの事例では、月次ビジネスレビュー資料の作成、財務モデルの品質チェック、CFO向けレポートの更新、予算差異分析、予測シナリオの比較といった実務タスクにCodexを適用する手法が紹介されています。決算ワークブックやダッシュボードなど既存の業務ファイルをそのまま入力として使い、コーディングなしでレビュー可能な成果物を生成できる点が強調されています。

これらの事例は、Codexが開発者向けツールにとどまらず、非エンジニア職種の業務効率化にも本格的に適用可能であることを示しています。OpenAIはCodex活用を支援するオンデマンドウェビナーやAcademyコンテンツの拡充も進めており、企業導入の加速を狙っています。

出典：OpenAI公式 | OpenAI公式

OpenAI、Codexの安全運用体制を公開

2026年05月08日 OpenAI ChatGPT Codex 生産性ネットワークエンジニアリスクセキュリティ認証ポリシーコンプライアンスコーディングエージェントプロンプトコンテキスト

サンドボックスと承認制御

技術的境界内での実行制約

低リスク操作の自動承認機能

ネットワーク接続先の許可リスト制御

危険コマンドのブロックと承認要求

エージェント固有の監視体制

OpenTelemetryによるログ出力

ユーザー意図を含む行動記録

AIトリアージエージェントで異常検知

SIEM連携による一元管理

詳細を見る

OpenAIは2026年5月8日、自律型コーディングエージェントCodexを企業環境で安全に運用するためのセキュリティ・ガバナンス体制を公開しました。AIエージェントがリポジトリの確認やコマンド実行を自律的に行う時代に対応し、組織が必要とする制御機能を設計段階から組み込んでいます。

運用の基本方針は、明確な技術的境界の中でエージェントを動作させ、低リスク操作は自動承認で開発者の生産性を維持しつつ、高リスク操作には人間のレビューを必須とすることです。サンドボックスが書き込み先やネットワーク到達範囲を制限し、承認ポリシーが境界外の操作を制御します。自動承認モードでは、サブエージェントが操作内容とコンテキストを評価し、低リスクと判断した操作を自動で承認します。

ネットワーク制御では、既知の安全な接続先のみ許可し、未知のドメインへのアクセスには承認を求めます。認証情報はOSのセキュアキーリングに保存され、ChatGPT Enterpriseのワークスペースレベルで管理されます。シェルコマンドも一律には扱わず、日常的な安全なコマンドは承認不要、危険なコマンドはブロックまたは承認必須とする段階的なポリシーを適用しています。

従来のセキュリティログが「何が起きたか」しか記録しないのに対し、Codexはエージェント固有のテレメトリで「なぜその操作をしたか」まで記録します。ユーザーのプロンプト、ツール承認判断、実行結果、ネットワークポリシーの判定をOpenTelemetry形式で出力し、SIEMやコンプライアンスシステムに統合できます。

OpenAI社内では、エンドポイントアラートとCodexログを組み合わせたAIセキュリティトリアージエージェントを運用しています。異常検知時にユーザーの意図やエージェントの行動履歴を自動分析し、正常な動作・単純なミス・要エスカレーション案件を区別してセキュリティチームに提示します。同じテレメトリは導入状況の把握やツール利用分析にも活用されています。

出典：OpenAI公式

Microsoft幹部、OpenAIのAmazon流出を懸念していた

2026年05月08日 OpenAI マイクロソフト Amazon AWS Codex リスク投資提携

提携初期の内部対立

Dota 2研究で3億ドル要求

Azure幹部は費用対効果に懐疑的

Xbox連携の代替案も浮上

関係変化の転機

CTO、当初はAI研究を軽視

自然言語処理への転換で評価一変

10億ドル出資を2019年に決定

現在への示唆

OpenAIがAWS展開を開始

当時の懸念が現実化する構図

詳細を見る

Musk対Altmanの裁判で提出された社内文書により、MicrosoftとOpenAIの提携初期における幹部間の緊張関係が明らかになりました。2017年夏、OpenAIがDota 2のプロ選手に勝利するAIボットを公開した直後、Altman氏はNadella CEOに対し、次の研究フェーズとして「Azureの定価で約3億ドル相当」の計算資源を要求しています。

この金額に対し、当時Azure責任者だったJason Zander氏は「5億ドル以上の増収が見込めなければ意味がない」と懐疑的な見解を示しました。OpenAI側はXboxとのゲーム分野での連携という代替案も提示しましたが、Xbox部門だけでは研究費用を賄えないと判断されています。

2018年1月、Kevin Scott CTOはNadella氏への書簡で、投資の見返りに確信が持てないとしつつも、OpenAIが「Amazonに駆け込んでAzureの悪口を言いふらす」リスクを指摘しました。AI業界での影響力を急速に高めるOpenAIを敵に回す代償を意識した発言です。

Scott氏はその後、ゲームAIを軽視していた自身の認識を反省し、OpenAIが自然言語処理モデルに軸足を移したことで評価を大きく改めました。2019年7月、Microsoftは10億ドルの大型出資を正式に発表しています。

約7年を経た現在、両社の関係は大きく変容しています。OpenAIは契約を再交渉し、AIモデルやCodexをAWSでも提供する方針を発表しました。社内メモでは「Microsoft独占契約が企業顧客への対応を制限してきた」と記されており、Scott氏がかつて恐れた「Amazon流出」のシナリオが、形を変えて現実となりつつあります。

出典：The Verge | The Verge

SpotifyがAI生成ポッドキャスト保存ツールとAI DJ多言語対応を発表

2026年05月07日 OpenAI Anthropic Claude Claude Code Codex OpenClaw NotebookLM コンテンツ音声ドイツブラジルイタリアエージェントプロンプト Adobe

AI生成音声の取り込み

Save to SpotifyのCLIツール公開

Claude CodeやCodex等から直接保存

個人ライブラリに限定公開

AI DJの多言語展開

仏独伊葡の4言語追加対応

対応国が75カ国以上に拡大

言語別に異なるDJパーソナリティ

音声プラットフォーム戦略

AIエージェント連携の基盤構築

プロンプト入力でプレイリスト生成も展開中

詳細を見る

Spotifyは2026年5月7日、AIエージェントが生成したポッドキャストを同社アプリに保存できるCLIツール「Save to Spotify」のベータ版を公開しました。同時に、対話型AI DJ機能のフランス語・ドイツ語・イタリア語・ブラジルポルトガル語への対応拡大も発表しています。

Save to Spotifyは、Anthropic Claude CodeやOpenAI Codex、OpenClawといったAIエージェントから直接利用できるコマンドラインツールです。ユーザーがAIに資料を読み込ませて生成した音声コンテンツを、通常のポッドキャストと同じSpotifyライブラリに保存できます。保存された音声は本人のみがアクセスでき、他のユーザーには公開されません。

Spotifyはブログ投稿で、ユーザーがすでにAIエージェントを使って授業ノートの要約やカレンダーのブリーフィングなど日常的な音声コンテンツを作成していると説明しています。NotebookLMやAdobe Acrobatなど既存のAI音声生成ツールの普及を背景に、その受け皿となるプラットフォームを目指す戦略です。

AI DJ機能は、従来の英語・スペイン語に加え4言語が追加され、対応国は75カ国以上に拡大しました。各言語にはMaia、Ben、Alex、Daniといった固有のDJキャラクターが設定されています。2025年5月の音声コマンド対応、同年10月のテキスト入力対応を経て、よりインタラクティブな体験へと進化しています。

これらの発表は、SpotifyがAI技術を活用してパーソナライズされた音声体験のプラットフォームへと転換を図る戦略の一環です。プロンプト入力によるカスタムプレイリスト生成機能の拡充と合わせ、AIエージェント時代における音声コンテンツのハブを目指す姿勢が鮮明になっています。

出典：The Verge | TechCrunch | TechCrunch

OpenAIがGPT-5.5-Cyberを限定公開、防御者向け信頼アクセス拡大

2026年05月07日 OpenAI Codex エコシステムワークフロー GPT-5 エンジニア脆弱性パッチインフラセキュリティ認証 Intel

信頼アクセスの3段階構造

身元確認ベースの段階的アクセス制御

GPT-5.5標準版は汎用業務向け

TAC付与で脆弱性分析やマルウェア解析が可能に

Cyber版はペネトレーションテスト等の高度用途向け

セキュリティ業界との連携

Cisco・Intel・SentinelOne等と防御エコシステム構築

ソフトウェアサプライチェーン保護にSnyk等と協力

Codex SecurityでOSSメンテナーも支援

アクセス要件と今後

2026年6月からフィッシング耐性認証を必須化

将来はさらに高性能なサイバー専用モデルも計画

詳細を見る

OpenAIは2026年5月7日、サイバーセキュリティ防御者向けの新モデルGPT-5.5-Cyberを限定プレビューとして公開しました。同時に、既存のGPT-5.5に対するTrusted Access for Cyber（TAC）フレームワークの拡充も発表しています。重要インフラの防護に携わる組織が、AIの高度なサイバー防御能力を活用できるようにする取り組みです。

TACは身元確認と信頼レベルに基づく3段階のアクセス構造を採用しています。標準のGPT-5.5は汎用業務向け、TAC付きGPT-5.5は脆弱性トリアージやマルウェア解析、検知エンジニアリングなど大半の防御業務に対応します。最上位のGPT-5.5-Cyberは、レッドチーミングやペネトレーションテストなど、より許容的な挙動が必要な専門ワークフロー向けです。

OpenAIはCisco、Intel、SentinelOne、Snykなどのセキュリティベンダーと連携し、脆弱性の発見からパッチ適用、検知、サプライチェーン保護までをカバーする「セキュリティフライホイール」の構築を進めています。各レイヤーが連動して防御力を高める仕組みです。

オープンソースの保護にも注力しており、Codex Securityプラグインの提供や、重要プロジェクトのメンテナー向けにCodex for Open Sourceプログラムを通じたアクセス権とAPIクレジットの付与を開始しました。脅威モデリングから修正パッチの提案まで一貫して支援します。

アクセスには厳格なセキュリティ要件が課されます。2026年6月1日以降、TACを利用する個人ユーザーにはフィッシング耐性のあるアカウントセキュリティが必須となります。OpenAIは今後、フラッグシップモデルへのTAC適用拡大と、さらに高性能なサイバー専用モデルの開発を計画しています。

出典：OpenAI公式

AIは自らを改良できるか、再帰的自己改善の現在地

2026年05月07日 Google OpenAI Anthropic Meta Claude Claude Code Codex AlphaEvolve GPT-5 エンジニア専門家経営者リスク投資エージェント TSMC IEEE Google DeepMind

自己改善の現状

GPT-5.3が自身の開発に貢献

Anthropicのコードの大半をClaude Codeが記述

AlphaEvolveがアルゴリズム発見を自動化

技術的・社会的な壁

AI研究者の能力はまだ人間に及ばず

複雑化による損失的自己改善の指摘

暗黙知や物理制約が完全自律を阻む

リスクと展望

専門家25人中23人が知能爆発を否定せず

AI安全研究者が開発の一時停止を提唱

詳細を見る

IEEE Spectrumは2026年5月7日、AIが自らを再帰的に改良する「再帰的自己改善（RSI）」の現状と展望を検証する詳報を掲載しました。1966年にI. J. Goodが提唱した「知能爆発」の概念が、大規模言語モデルの急速な進化により現実味を帯びつつある状況を、複数の研究者への取材を通じて多角的に分析しています。

現時点で自己改善の要素は着実に進んでいます。OpenAIはGPT-5.3-Codexが自身の開発に貢献したと報告し、Anthropicはコードの大半をClaude Codeが記述していると主張しています。Google DeepMindのAlphaEvolveはLLMを用いてアルゴリズムの進化的探索を行い、人間の直感では到達できなかった発見を実現しました。ただし、いずれも目標設定や評価は人間が担っています。

一方で、完全な自律ループの実現には大きな壁があります。Allen Institute for AIのNathan Lambert氏は、システムの複雑化に伴い改善の効果が逓減する「損失的自己改善（LSI）」を提唱しました。TSMCの9万人の従業員が持つ集合知のように、知識は分散し暗黙的であるため、一つのAIに集約することは困難です。Metaの研究者らは、人間を含めた「共改善」こそがより現実的で安全な目標だと主張しています。

リスクの観点では、AI専門家25人への聞き取り調査で23人が知能爆発の可能性を排除しませんでした。AI安全非営利団体Evitableの創設者Krueger氏は、コードの99%がAIに書かれる段階を開発停止の基準として提案し、その時期が近いと警鐘を鳴らしています。

RSIの将来像について、研究者らは単一の巨大AIではなく、多様なエージェントが進化的に共存する「人工知能の社会」を予測しています。人間の研究者は段階的に役割を変え、最終的には監督者としての地位を維持すべきだとされています。経営者やエンジニアにとっては、AI開発への投資判断や規制対応において、RSIの進展度合いを正確に見極めることが重要になります。

出典：spectrum.ieee.org

OpenAI、企業AI活用格差を可視化する指標を公開

2026年05月06日 OpenAI ChatGPT Codex Deep Research 生産性 AI活用アシスタントワークフロー AI導入エンジニアセキュリティプライバシーコーディング投資エージェント

先進企業と一般企業の格差

先進企業は従業員あたり3.5倍のAI活用

1年前の2倍差から格差が拡大

メッセージ量は格差の36%しか説明せず

残りは複雑な業務への深い活用が要因

エージェント型活用が鍵

Codexは先進企業が16倍多く利用

チャットから業務委任への移行が進行

Ciscoはビルド時間約20%短縮を実現

業種ごとに異なるAI導入の強みが存在

詳細を見る

OpenAIは2026年5月6日、企業のAI活用状況を定量的に追跡する新指標「B2B Signals」を公開しました。同社のエンタープライズ製品から得られたプライバシー保護済みの集計データに基づき、先進企業と一般企業のAI活用格差を可視化するものです。レポートによると、利用上位5%にあたる先進企業は、一般企業の3.5倍の「インテリジェンス」を従業員あたりで消費しており、2025年4月時点の2倍差から大きく拡大しています。

注目すべきは、格差の本質が単純な利用頻度ではなく「深さ」にある点です。メッセージの送信量は先進企業と一般企業の差の36%しか説明できず、残りの大部分はより複雑な業務への活用、より豊富な文脈の提供、より実質的な出力の生成といった質的な違いから生じています。一般企業がAIを「質問への回答」に使う段階にとどまる一方、先進企業は「複雑な業務の遂行」にAIを組み込んでいるのです。

エージェント型ワークフローの活用差はさらに顕著です。コーディング支援ツール「Codex」では先進企業の従業員あたりメッセージ数が一般企業の16倍に達しています。ChatGPT AgentやDeep Researchなど、マルチステップの業務委任を可能にするツールでも同様の傾向が見られます。Ciscoの事例では、Codexを「チームの一員」として扱うことでビルド時間を約20%短縮し、月間1,500時間以上のエンジニアリング工数を削減したと報告されています。

業種・職種別の活用パターンも明らかになりました。IT・セキュリティ部門は手順ガイダンス、ソフトウェア開発チームはコーディング、財務部門は分析・計算にAIを集中的に活用しており、汎用的な生産性向上から各部門の中核業務への浸透が進んでいます。損害保険大手Travelersは、OpenAIを活用したAI保険金請求アシスタントで初年度約10万件の対応を見込んでいます。

OpenAIは先進企業に近づくための具体策として、活用の深さの測定、本番運用を可能にするガバナンス構築、教育・学習への投資、先行チームの知見の全社展開、そしてチャットからエージェントへの移行を挙げています。B2B Signalsは今後も定期的に更新され、企業のAI活用の進展を追跡していく予定です。

出典：OpenAI公式

Vergecast、AIによる自動車設計からコーディングツール競争まで最新動向を総括

2026年05月05日 OpenAI Anthropic マイクロソフト Claude Claude Code Codex MacOS AI活用 AI導入レイオフセキュリティ AGI コーディング開発ツール

AIが変える自動車開発

GMや日産がAI設計を本格導入

開発期間5年超の短縮が狙い

風洞実験やモデリングにLLM活用

AI業界の主要トピック

Claude CodeとCodexのコーディング覇権争い

OpenAIとMicrosoftのAGI契約が終了

AI効率化を名目とした大規模レイオフの実態

政府との関係と今後

Anthropicのアメリカ政府との関係が不透明

AI企業の人員削減は本当にAI起因か疑問視

詳細を見る

テック系メディアThe Vergeの人気ポッドキャスト「Vergecast」が、自動車業界におけるAI活用からコーディングツールの競争、AI業界の構造変化まで、最新の主要トピックを一挙に取り上げました。番組では自動車ジャーナリストのTim Stevens氏と、The VergeのHayden Field記者が出演しています。

自動車業界では、新車の企画から量産まで5年以上かかる開発プロセスを、AIで大幅に短縮しようとする動きが加速しています。GMや日産などのメーカーは、モデリングや風洞実験といった工程にLLMを導入し始めました。メーカー側は「人間をAIに置き換える計画はない」と強調していますが、番組ではその先にある変化への懸念も指摘されています。

AI開発ツールの分野では、OpenAIのCodexがmacOS対応を強化し、AnthropicのClaude Codeと正面から競合する構図が鮮明になりました。一方、OpenAIとMicrosoftの間で長年注目されてきたAGI契約が終了したことも大きな話題です。OpenAI社内の雰囲気は「やや改善したがまだ良くない」と報じられています。

番組後半では、Block（旧Square）のJack Dorsey CEOがスタッフの約半数を削減し「AI効率化」を理由に挙げた事例を取り上げ、AI名目のレイオフが本当にAI導入によるものなのかを検証しています。Anthropicのアメリカ政府との関係についても、サイバーセキュリティ分野での新モデル投入が政府との距離を縮める可能性があると分析されました。

出典：The Verge

OpenAIが8000人の開発者にCodex利用枠10倍を提供、Anthropicと同夜に対抗イベント

2026年05月05日 OpenAI Anthropic ChatGPT Claude Codex ワークフロー GPT-5 エンジニアコーディングサム・アルトマン資金調達評価額 IPO

Codex大盤振る舞いの狙い

応募者全員にCodexレート制限10倍を付与

期間は6月5日までの約1カ月間

Pro tier 20倍との重複適用は不可

深い利用習慣の定着と有料転換が狙い

同夜開催が映す業界の構図

Anthropicが同日夕にメディアVIPレセプション開催

Counterpoint調査でAnthropic売上シェア31.4%、OpenAI 29%に

Anthropicのユーザー当たり収益はOpenAIの約7倍

両社ともIPOを視野に開発者争奪戦が激化

詳細を見る

OpenAIは2026年5月5日、GPT-5.5発売記念パーティーに応募した8,000人超の開発者全員に対し、個人のChatGPTアカウントでCodexのレート制限を10倍に引き上げる特典を提供しました。会場の収容制限で招待できなかった応募者への「お詫び」として、6月5日までの約1カ月間有効です。CEOのサム・アルトマン氏がXで事前に示唆し、投稿は数時間で52万回以上閲覧されました。

この施策には明確なビジネス上の意図があります。約1カ月にわたり大量の開発者にCodexをフル活用させることで、日常的なワークフローへの依存を形成し、期限後の有料プラン移行を促す狙いです。一方、Pro tier（月額200ドル）の20倍制限との重複適用については、OpenAIサポートが「高い方が適用される」と回答しており、加算はされないとみられます。

注目すべきは、同じ夜にAnthropicもサンフランシスコで招待制の「メディアVIPウェルカムレセプション」を開催した点です。翌日のCode with Claude開発者カンファレンスの前夜祭として、ほぼ同時刻に同じ都市で同じ開発者層を対象にしたイベントが重なりました。意図的なカウンタープログラミングか偶然かは不明ですが、両社の開発者獲得競争の激しさを象徴しています。

この競争の背景には、収益構造の逆転があります。Counterpoint Researchによると、2026年第1四半期にAnthropicはLLM売上シェアで初めてOpenAIを上回り、31.4%対29%となりました。Anthropicの月間アクティブユーザーは約1.34億人とOpenAIの約9億人を大きく下回りますが、ユーザー当たり月間収益は16.20ドル対2.20ドルと約7倍の差があります。コーディング分野での優位性がエンタープライズ導入の入口となり、年間売上は300億ドルを超えています。

両社ともIPOを視野に入れ、ウォール街の支持を競っています。Anthropicは評価額9,000億ドル超での資金調達を検討中と報じられ、OpenAIの8,520億ドルを上回る可能性があります。開発者にとっては両社の競争激化による恩恵を受けられる局面ですが、次世代ソフトウェア開発の主導権を巡る戦いは一層の過熱が予想されます。

出典：VentureBeat

LlamaIndex CEOが語る「足場崩壊」後の戦略

2026年05月01日 OpenAI Claude Claude Code Codex 検索ワークフロー OCR Llama エンジニア創業者推論リスクコーディングエージェントコンテキスト MCP LlamaIndex RAG

足場レイヤーの崩壊

RAGフレームワークの必要性低下

LLMが非構造データを直接処理

MCPで統合が簡素化

コード生成の95%がAI製

コンテキストが新たな堀

ファイル形式の解析精度が競争力に

OCR文書処理が差別化の鍵

モジュール性と柔軟性の維持が必須

詳細を見る

LlamaIndexの共同創業者兼CEOであるJerry Liu氏は、LLMアプリケーション開発に必要だったインデックス層やクエリエンジン、検索パイプラインなどの「足場レイヤー」が崩壊しつつあると語りました。モデルの進化により、開発者がこれらの決定論的ワークフローを軽量に構築するためのフレームワークの必要性は薄れています。

その背景には、LLMの推論能力の急速な向上があります。最新モデルは大量の非構造化データを人間以上の精度で処理でき、自己修正やマルチステップの計画立案も可能です。MCP（Modern Context Protocol）やClaude Agent Skillsにより、ツールの発見・利用が個別統合なしで実現されるようになりました。エージェントのパターンは「マネージドエージェント」構成に収斂しています。

Liu氏はさらに、コーディングエージェントの発達により開発者の作業自体が変質していると指摘します。LlamaIndexのコードの約95%はAIが生成しており、「エンジニアは実際のコードを書いていない。自然言語で入力している」と述べました。プログラマーと非プログラマーの境界が消えつつあるといいます。

では足場が崩壊した後に何が残るのか。Liu氏の答えは「コンテキスト」です。エージェントがファイル形式を解読し正確な情報を抽出する能力が差別化要因になるとし、LlamaIndexはOCRによるエージェント型文書処理でこの領域に注力しています。「OpenAI CodexでもClaude Codeでもどちらでもよい。すべてが必要とするのはコンテキストだ」と同氏は強調しました。

一方でLiu氏は、特定のフロンティアモデルへの依存リスクにも警鐘を鳴らしています。スタックのモジュール性を保ち、技術的負債を排除し、モデルリリースごとに最適な選択肢へ柔軟に移行できる体制を整えることが企業に求められると述べました。スタックの一部は必然的に廃棄される前提で設計すべきだとしています。

出典：VentureBeat

OpenAI、GPTの「ゴブリン癖」の原因と対策を公表

2026年04月30日 OpenAI GitHub ChatGPT Codex GPT-5 エンジニア強化学習ファインチューニングリスクプロンプト RLHF

ゴブリン問題の発覚と原因

GPT-5.5のシステム指示にゴブリン禁止令が発覚

「Nerdy」人格のRLHF訓練で空想生物の比喩を過剰報酬

ゴブリン使用率がGPT-5.1以降175%増加

報酬された癖が全人格に転移・固定化

対策とAI訓練への教訓

Nerdy人格廃止後もGPT-5.5に癖が残存

Codex向けにシステムプロンプトで応急対処

GPT-6ではフィルタ済みデータで根本解決へ

強化学習の行動監査の重要性が浮き彫りに

詳細を見る

OpenAIは2026年4月29日、同社のAIモデルがコード生成時に「ゴブリン」「グレムリン」などの空想上の生物を不自然に多用する問題について、原因と対策を説明する公式ブログ記事を公開しました。この問題は4月27日に開発者がCodexのGitHubリポジトリ内のシステム指示から「ゴブリンについて絶対に話すな」という記述を発見したことで広く知られるようになり、SNS上で大きな話題となりました。

問題の根本原因は、ChatGPTの人格カスタマイズ機能の一つであった「Nerdy」モードの訓練にありました。RLHF（人間のフィードバックによる強化学習）の過程で、人間の評価者が空想生物を使った比喩表現に高い評価を与え続けた結果、モデルは「生物の比喩＝高報酬」と学習しました。Nerdyモードは全トラフィックのわずか2.5%でしたが、ゴブリン関連の言及の66.7%を占めていたとOpenAIは報告しています。

さらに深刻だったのは、この癖がNerdyモード以外にも転移したことです。強化学習で報酬された行動は特定の条件に限定されず、ゴブリン比喩を含む出力が後続モデルのファインチューニングデータに再利用されたことで、GPT-5.4やGPT-5.5の重みに「焼き込まれ」ました。2026年3月にNerdyモードを廃止した後も、GPT-5.5ではこの癖が消えませんでした。

OpenAIは当面の対策としてCodexのシステムプロンプトにゴブリン禁止の指示を追加し、次世代モデルGPT-6ではフィルタ済みのデータセットで訓練することで根本解決を目指すとしています。一方で、ゴブリン表現を好むユーザー向けに禁止指示を解除するスクリプトも公開しました。この一件は、強化学習における意図しないバイアスの伝播リスクを示す事例として、AI業界で行動監査の重要性を改めて認識させるきっかけとなっています。

出典：The Verge | VentureBeat

OpenAI、ChatGPTに高度アカウント保護機能を導入

2026年04月30日 OpenAI ChatGPT Codex エンジニアリスクセキュリティ認証ブランド提携

保護機能の概要

パスキーまたは物理セキュリティキー必須化

パスワードログインを完全無効化

メール・SMS回復を廃止し鍵ベースに統一

会話データの学習利用を自動除外

Yubicoとの提携

共同ブランドのYubiKey 2種を提供

フィッシング耐性認証を低コストで普及

6月1日からサイバー関係者に義務化

運用上の注意点

鍵紛失時はOpenAIも回復支援不可

詳細を見る

OpenAIは2026年4月30日、ChatGPTおよびCodexアカウント向けの新しいオプトイン型セキュリティ機能「Advanced Account Security（AAS）」を発表しました。ジャーナリスト、政治的反体制派、研究者、政府関係者など、デジタル攻撃のリスクが高い利用者を主な対象としていますが、希望するすべてのユーザーが利用できます。

AASを有効にすると、従来のパスワードによるログインが無効化され、パスキーまたは物理セキュリティキーによる認証が必須となります。アカウント回復についてもメールやSMSによる方法が廃止され、バックアップパスキー、セキュリティキー、リカバリーキーのみに限定されます。これにより、フィッシングやソーシャルエンジニアリングによるアカウント乗っ取りのリスクを大幅に低減します。

OpenAIはセキュリティキー大手のYubicoと提携し、共同ブランドのYubiKey C NFCとYubiKey C Nanoを優待価格で提供します。YubicoのJerrod Chong CEOは「OpenAIアカウントへの不正アクセスの脅威を世界規模で劇的に減らすことが目的」と述べています。さらにAAS有効時は、会話データがモデル学習に使用されない設定が自動的に適用されます。

セッション有効期間の短縮、ログイン通知、アクティブセッションの管理機能も追加されました。ただし、AASに登録したユーザーがセキュリティキーを紛失した場合、OpenAIのサポートチームでも回復を支援できない点には注意が必要です。同社の「Trusted Access for Cyber」プログラム参加者は、2026年6月1日までにAASの有効化が義務付けられます。今回の発表は、4月上旬に公表されたOpenAIの包括的なサイバーセキュリティ戦略の一環です。

出典：OpenAI公式 | TechCrunch | WIRED

AIコーディングエージェント6件の脆弱性、認証情報が標的に

2026年04月30日 Google OpenAI Anthropic GitHub Claude Copilot Claude Code Codex エンジニア専門家脆弱性パッチセキュリティ認証コーディングエージェント Gmail

主要な脆弱性の全容

Codexのブランチ名経由でOAuthトークン窃取

Claude Codeの50サブコマンド超過で制限無効化

Copilotのプルリクエスト経由でリモートコード実行

Vertex AIのデフォルト権限でGmail・Drive等に不正アクセス

企業への影響と対策

全攻撃が実行時の認証情報を標的に

AIエージェントのID管理がほぼ未整備

OAuth権限の棚卸しとPAM統合が急務

エージェントIDを人間と同等にガバナンスすべき

詳細を見る

2026年3月から4月にかけて、Codex、Claude Code、Copilot、Vertex AIの主要AIコーディングエージェント4製品に対し、6つの研究チームがセキュリティ脆弱性を相次いで公開しました。いずれの攻撃もAIモデルの出力ではなく、エージェントが保持する認証情報を標的としており、従来のIAM（ID・アクセス管理）では検知できない新たな攻撃パターンが浮き彫りになっています。

BeyondTrustの研究者は、OpenAI CodexがGitHubリポジトリのクローン時にOAuthトークンをURLに埋め込んでいることを発見しました。ブランチ名にコマンドインジェクションを仕込み、Unicode全角スペース94文字で偽装することでトークンを平文で窃取できる状態でした。OpenAIはこれを最高深刻度P1に分類し、2026年2月5日に修正を完了しています。

AnthropicのClaude Codeでは3件の脆弱性が見つかりました。CVE-2026-25723はパイプ処理によるサンドボックス脱出、CVE-2026-33068は設定ファイルによる信頼ダイアログの迂回、そしてAdversaが発見した50サブコマンド超過時のdeny-rule無効化です。Anthropicのエンジニアは処理速度を優先し、50個目以降のサブコマンドのチェックを省略していました。いずれもパッチ済みです。

GitHubのCopilotに対しては、プルリクエスト説明文やGitHub Issueに隠された指示でリモートコード実行が可能でした。Vertex AIでは、デフォルトのサービスアカウント権限がGmail、Drive、Cloud Storage全バケットに及び、Googleの内部Artifact Registryにもアクセスできる状態でした。CrowdStrike CTOのElia Zaitsev氏は、エージェントのIDを人間のIDに紐づけるべきだと主張しています。

セキュリティ専門家は、企業がAIコーディングエージェントのID・認証情報を棚卸しし、PAM（特権アクセス管理）と同等のガバナンスを適用する必要があると警告しています。Graviteeの2026年調査によると、エージェントのOAuth認証情報をPAMに統合している企業はわずか21.9%にとどまっています。ブランチ名やPR説明文を含むすべての入力を信頼しない前提で扱い、エージェント固有のID管理体制の構築が急務です。

出典：VentureBeat

OpenAI Codexに「ゴブリンの話をするな」という指示が発覚

2026年04月29日 OpenAI GitHub Codex GPT-5 コーディングサム・アルトマンプロンプト

異例の禁止指示

GPT-5.5向けシステムプロンプトに記載

ゴブリンなど7種の生物への言及を禁止

旧モデル向け指示には同様の記載なし

背景と反応

GPT-5.5が無関係な会話でゴブリンに言及する問題

OpenAI社員はマーケティング施策ではないと否定

Altman CEOはジョークで反応し話題が拡散

詳細を見る

OpenAIが公開したコーディングツール「Codex CLI」のシステムプロンプトに、最新モデルGPT-5.5に対して「ゴブリン、グレムリン、アライグマ、トロール、鬼、ハトなどの動物や生き物について、ユーザーの質問と明確に関連がない限り絶対に話すな」という異例の指示が含まれていることが明らかになりました。この禁止指示は3,500語超の基本指示の中で2回繰り返されています。

この指示は先週、OpenAIがGitHubに公開したCodex CLIのオープンソースコードの中で発見されました。同じJSONファイルに含まれる旧モデル向けの指示にはこの禁止事項がなく、GPT-5.5で新たに発生した問題への対処とみられます。実際にソーシャルメディア上では、GPT-5.5が無関係な会話の中で突然ゴブリンの話題を持ち出すという報告が複数のユーザーから上がっていました。

Codex開発チームのNick Pash氏は、この指示について「GPT-5.5やCodexへの注目を集めるためのマーケティング施策ではない」とソーシャルメディアで明言しています。しかしこの話題が広まると、OpenAIの幹部たちはむしろジョークとして受け入れる姿勢を見せました。

Sam Altman CEOは「Codexが話題になっている。いや、ゴブリンが話題だった、失礼」と投稿し、話題をさらに盛り上げました。AIモデルの予期しない振る舞いが、システムプロンプトという形で可視化された珍しい事例として注目を集めています。

出典：Ars Technica

OpenAIモデルがAWSで提供開始

AWSとの提携拡大の全容

BedrockでGPT-5.5提供

Codex on AWSが限定プレビュー開始

Managed Agents新サービス発表

Microsoft独占契約の改定が背景

企業向けAI活用の加速

既存AWS環境でOpenAI機能を利用可能

セキュリティ・コンプライアンス統合

AWS支出枠でCodex利用が可能に

プロトタイプから本番への移行を短縮

詳細を見る

OpenAIとAWSは2026年4月28日、戦略的パートナーシップの拡大を発表しました。OpenAIの最新モデルGPT-5.5がAmazon Bedrockで利用可能になるほか、コーディングエージェント CodexのAWS対応、そしてOpenAI搭載の新サービス「Amazon Bedrock Managed Agents」の3つが限定プレビューとして同時に開始されます。

この提携拡大の背景には、OpenAIとMicrosoftの独占契約が改定されたことがあります。Microsoft側がOpenAI製品の独占提供権を失ったことで、AWSでのOpenAIモデル提供が法的に可能になりました。Amazon CEOのAndy Jassy氏はこの契約改定を「非常に興味深い発表」と評しています。

Codex on AWSでは、企業がAmazon Bedrockをプロバイダーとして設定することで、Codex CLIやデスクトップアプリ、VS Code拡張機能を利用できます。週400万人以上が利用するCodexは、コード作成だけでなくリサーチや文書作成にも活用が広がっており、AWS支出コミットメントの枠内で利用料を充当できる点が企業にとって大きなメリットです。

新サービスのBedrock Managed Agentsは、OpenAIの推論モデルを活用したエージェント構築基盤です。マルチステップのワークフロー実行やツール連携、コンテキスト維持といった機能を備え、AWSのセキュリティ・ガバナンス体制と統合されています。エージェントのデプロイやオーケストレーションの複雑さを吸収し、企業が本質的な業務設計に集中できるよう設計されています。

今回の動きは、AI業界のパートナーシップ構造が大きく変化していることを示しています。OpenAIがAWSやOracleに展開を広げる一方、MicrosoftはAnthropicのClaudeを活用した新たなエージェント製品の開発を進めており、かつての排他的な二者関係から多角的な提携へと業界構造がシフトしています。

出典：TechCrunch | OpenAI公式

OpenAIがCodex連携仕様Symphonyをオープンソース公開

2026年04月27日 OpenAI GitHub Codex 生産性エンジニアデザイナー品質保証動画コーディングリファクタリングエージェントコンテキスト

Symphonyの仕組み

タスク管理ツールをエージェント制御盤に転用

未着手チケットごとに専用エージェント自動起動

タスク依存関係に沿い並列実行を最適化

導入効果と課題

一部チームでマージ済みPR数が5倍に増加

投機的タスクの試行コストが実質ゼロに低下

PM・デザイナーも直接機能開発を起票可能

対話的介入が減り品質保証の仕組みが必要に

技術設計と今後

中核はSPEC.md一枚の宣言的仕様

参照実装はElixir製だが任意言語で再実装可能

詳細を見る

OpenAIは2026年4月27日、コーディングエージェントCodexの作業をタスク管理ツールから自動的にオーケストレーションする仕様「Symphony」をオープンソースとして公開しました。SymphonyはLinearなどのプロジェクト管理ボードを制御盤に変え、未着手のチケットごとに専用のCodex エージェントを自動起動し、完了まで継続実行します。GitHub公開後わずか数週間で1万5000スターを超える反響を得ています。

従来、エンジニアは複数のCodexセッションを手動で管理していましたが、同時に3〜5セッション以上になるとコンテキストスイッチの負荷が急増し、生産性が低下していました。Symphonyはこの「人間の注意力がボトルネック」という問題を根本から解消するために設計されました。チケットのステータスを状態機械として扱い、エージェントの起動・再起動・依存関係の解決をすべて自動化します。

導入効果は顕著で、OpenAI社内の一部チームではマージ済みPR数が500%増加しました。エンジニアはエージェントの監視から解放され、投機的なリファクタリングや仮説検証を気軽に試せるようになりました。さらに、PMやデザイナーがLinearに機能要件を書くだけでエージェントが実装し、動画付きのレビューパケットを返す運用も実現しています。

技術的にSymphonyの核心はSPEC.mdという一枚のMarkdownファイルです。参照実装には並行処理に優れたElixirが採用されていますが、TypeScript・Go・Rust・Java・Pythonでも実装に成功しており、任意の言語で再構築できます。またCodex App Serverモードを活用し、JSON-RPC APIでプログラム的にエージェントを制御する設計になっています。

OpenAIはSymphonyをスタンドアロン製品として維持する予定はなく、あくまでリファレンス実装と位置付けています。各チームが自社の環境に合わせてSPEC.mdを基に独自バージョンを構築することを推奨しており、コーディングエージェントの管理手法が業界全体で変化していく可能性を示唆しています。

出典：OpenAI公式

OpenAI、米連邦政府向けFedRAMP認証を取得

2026年04月27日 OpenAI ChatGPT Codex AI活用 GPT-5 エンジニアクラウドセキュリティプライバシー認証米国

認証の概要と意義

FedRAMP Moderate認証取得

連邦政府機関のAI活用が本格化

GPT-5.5含む最新モデル提供

政府機関の活用方法

翻訳・分析・調査業務の効率化

既存システムへのAI組み込み

Codex環境も近日対応

調達と今後の展望

Marketplace掲載済み

商用版との機能差を順次縮小

詳細を見る

OpenAIは2026年4月27日、ChatGPT EnterpriseおよびAPI PlatformについてFedRAMP 20x Moderate認証を取得したと発表しました。この認証により、米国連邦政府機関がセキュリティ・プライバシー・ガバナンスの要件を満たした環境で、最先端のAI技術を利用できるようになります。

FedRAMP 20xは2025年3月にGSAが発表した新しい認証パスで、クラウドネイティブなセキュリティ証跡や自動検証を活用することで、従来より迅速な認証プロセスを実現しています。OpenAIのセキュリティチームとエンジニアリングチームが、KSI実装やエビデンス収集、評価資料の準備を通じて認証を達成しました。

連邦政府機関は、GPT-5.5を含む最新モデルにFedRAMP環境からアクセスできるようになります。プログラムチームはChatGPT Enterpriseを使って調査・翻訳・分析業務を加速でき、技術チームはOpenAI APIを既存システムやケース管理ツールに組み込むことが可能です。さらに、近日中にCodex クラウド環境もFedRAMP対応のワークスペースから利用可能になる予定です。

調達面では、FedRAMP Marketplaceに掲載済みで、OpenAIの公認パブリックセクターリセラーであるCarahsoftを通じた調達や、各機関の要件に応じた取得方法を選択できます。Trust Portalでは、認証データやセキュリティ評価資料が公開されており、各機関はゼロから評価を始める必要がありません。

OpenAIは今後も重要変更通知プロセスを通じて対応機能を拡大し、FedRAMP環境と商用製品の機能差を縮小していく方針です。公共部門のミッションに必要な管理体制とセキュリティを維持しながら、最先端AIの提供を進めるとしています。

出典：OpenAI公式

AIエージェント連携基盤BANDが1700万ドル調達

断片化するAIエージェント問題

企業のAIエージェント乱立が課題に

異なるフレームワーク間の連携が困難

LangChainやCrewAI間のタスク引き継ぎ不可

APIだけでは非決定的な動作に対応不能

BANDの技術的アプローチ

エージェンティックメッシュで相互発見

LLM不使用の決定的ルーティング採用

マルチピア全二重通信を実現

権限境界と資格情報の安全な伝搬

事業展開と市場の動向

SaaS・プライベートクラウド・エッジの3形態

通信・金融・サイバーセキュリティで導入進む

Gartnerは2029年までに90%が統合基盤を必要と予測

無料プランから企業向けまで段階的価格設定

詳細を見る

スタートアップBANDが1700万ドルのシード資金を調達し、ステルスモードから正式に登場しました。同社はAIエージェント間の通信インフラを提供し、異なるフレームワークやクラウド上で動作する複数のエージェントを統合的に連携させることを目指しています。共同創業者兼CEOのArick Goomanovsky氏は、エージェントが経済活動に参加するには人間と同様のコミュニケーション手段が必要だと述べています。

BANDの中核技術はエージェンティックメッシュと呼ばれる2層アーキテクチャです。インタラクション層ではエージェント同士がクラウドやフレームワークの違いを超えて相互に発見・タスク委任を行えます。メッセージルーティングにはLLMを使わず、特許出願中の決定的ルーティングを採用することで、非決定的なエラーの発生を防いでいます。WhatsAppやDiscordと同じ技術基盤を用いており、数十億メッセージ規模へのスケーリングに対応します。

もう一つの層であるコントロールプレーンは、企業が求めるガバナンス機能を担います。どのエージェントが相互通信できるかの権限境界の設定や、人間の許可情報がエージェント間で安全に引き継がれる資格情報トラバーサル機能を備えています。これにより、あるエージェントが別のエージェントにタスクを委任しても、元の人間のアクセス権限を超えたデータへのアクセスは発生しません。

BANDはOpenAIのワークスペースエージェントやAnthropicのManaged Agentsといったモデルプロバイダー独自のソリューションとは異なり、ベンダーロックインを回避する独立プラットフォームとして位置づけています。現在最も人気のあるユースケースはコーディングエージェントの連携で、計画に強いClaudeとレビューに優れたCodexを同時に動作させるといった使い方が広がっています。

資金調達はSierra Ventures、Hetz Ventures、Team8が主導しました。Gartnerは2029年までに複数エージェントを導入する企業の90%がユニバーサルオーケストレーターを必要とすると予測しており、BANDはその新興市場を狙っています。調達資金はエンジニアリングチームの拡大と、北米の通信大手や欧州のデジタル決済企業を含むデザインパートナーのエコシステム構築に充てられる予定です。

出典：VentureBeat

OpenAIがCodex活用ガイド群を公開

2026年04月23日 Google OpenAI Slack ChatGPT Codex ワークフロースケジュール調整スライドエンジニアコーディングエージェントプロンプト

Codexの基本と導入

AIエージェントとして実務を代行

コーディング不要で誰でも利用可能

プロジェクト単位でファイル管理

拡張機能と自動化

プラグインで外部ツール連携

スキルで業務プロセスを定型化

自動化で定期タスクを実行

業務での活用例

朝のブリーフ作成や週次報告の自動生成

プレゼン資料やダッシュボードの作成

詳細を見る

OpenAIは2026年4月23日、AIエージェント製品「Codex」の使い方を体系的に解説する「OpenAI Academy」のガイド群を公開しました。Codexとは何か、初期設定の方法、ワークスペースの使い方、プラグインやスキルの活用法、自動化機能、業務での具体的な活用例まで、計7本のチュートリアルが同時に公開されています。

CodexはChatGPTとは異なるAIエージェントとして位置づけられています。ChatGPTが「考える支援」を行うのに対し、Codexは「仕事そのものを前に進める」ツールです。開発者でなくても利用でき、メールやSlack、ノートなどから情報を集約し、スライド作成やダッシュボード構築、ワークフローの修正といった実務を代行します。

ガイドではプラグインとスキルという2つの拡張機能が詳しく紹介されています。プラグインはGoogle DriveやSlackなど外部ツールとの接続に使い、スキルはチーム固有の業務プロセスをCodexに教える仕組みです。さらに自動化機能により、毎朝のブリーフ作成や週次レポートの生成といった定期タスクをスケジュール実行できます。

業務活用の具体例としては、朝の優先事項ブリーフの自動生成、週次報告書の作成、プレゼン資料のドラフト、意思決定メモの作成、データのクリーニングと統合、営業アカウントの優先順位付け、月次レビューの準備、ローンチキットの作成、ワークフロー監査など10の実践的なユースケースが示されています。いずれもプロンプト例とともに紹介され、すぐに試せる構成になっています。

OpenAI、最新モデルGPT-5.5を公開しコーディング性能で首位奪還

性能とベンチマーク

Terminal-Bench 2.0で82.7%達成

Claude Opus 4.7を大幅に上回る

コード作業のトークン効率が向上

GPT-5.4と同等のレイテンシを維持

提供と価格体系

Plus・Pro・Enterprise向けに即日提供

API価格は入力5ドル・出力30ドル/100万トークン

サイバー防御向け専用ライセンス新設

NVIDIAとの連携

GB200 NVL72上で推論実行

NVIDIA社内1万人超がCodexで活用

詳細を見る

OpenAIは2026年4月23日、最新のフラッグシップモデルGPT-5.5を発表しました。共同創業者のGreg Brockman氏は「より直感的でエージェント的なコンピューティングに向けた大きな前進」と位置づけ、コーディング、オンラインリサーチ、データ分析、ドキュメント作成など幅広いタスクを自律的にこなせる点を強調しています。前モデルGPT-5.4のわずか1カ月後というハイペースのリリースとなりました。

ベンチマーク結果では、ターミナル操作の総合力を測るTerminal-Bench 2.0で82.7%を記録し、AnthropicのClaude Opus 4.7(69.4%)やGoogle Gemini 3.1 Proを大きく上回りました。非公開モデルのClaude Mythos Preview(82.0%)もわずかに超えています。一方、ツールなしの推論ベンチマーク「Humanity's Last Exam」ではOpus 4.7(46.9%)に及ばない41.4%にとどまり、純粋な学術知識ではまだ差がある分野もあります。実務面では、GDPval(知識労働)で84.9%、サイバーセキュリティのCyberGymで81.8%と、エージェント型タスク全般で最高水準を達成しました。

推論基盤にはNVIDIA GB200 NVL72が採用されています。NVIDIAではすでに社内1万人以上がGPT-5.5搭載のCodexを活用し、デバッグ作業が数日から数時間に短縮されたと報告されています。GPT-5.5自身がGPU負荷分散のヒューリスティックを設計し、トークン生成速度を20%以上改善するという「モデルが自らの推論基盤を最適化する」成果も生まれました。OpenAIはNVIDIAのシステムを10ギガワット以上導入する計画で、両社の10年にわたる協業がさらに深まっています。

安全性の面では、OpenAI史上最も強力なセーフガードを導入したとしています。準備態勢フレームワークのもと、生物・化学およびサイバーセキュリティの能力を「High」リスクに分類。一般ユーザー向けにはサイバーリスク分類器を厳格化する一方、重要インフラを守る正規のセキュリティ専門家には制限を緩和する「サイバー許容型」ライセンスを新設しました。さらに生物安全性に関しては、ユニバーサル脱獄を発見した研究者に2万5,000ドルを支払うバグバウンティプログラムも開始しています。

料金面では、API価格が前世代から実質倍増し、入力5ドル・出力30ドル(100万トークンあたり)となりました。Proモデルはさらにその6倍です。ただしOpenAIは、GPT-5.5が同じタスクをより少ないトークンで完了するため、実質コストは抑えられると説明しています。Plus・Pro・Business・Enterpriseの各プランで即日利用可能となり、API提供も「近日中」としています。Brockman氏はChatGPT・Codex・AIブラウザを統合した「スーパーアプリ」構想にも言及し、AnthropicやGoogleとのフロンティアモデル競争がさらに激化する見通しです。

SpaceX、Cursorを600億ドルで買収提案

2026年04月22日 Google OpenAI Anthropic NVIDIA xAI Claude Claude Code Codex リスクデータセンターコーディング資金調達買収評価額 IPO Cursor Andreessen Horowitz SpaceX Windsurf

買収提案の経緯

Cursor、20億ドル調達を直前に中断

SpaceXが600億ドルの買収オプション提示

不成立でも100億ドルのAI開発協業金

両社の思惑

SpaceX、IPO後に買収手続きの意向

Cursor、AI競争激化で独立継続にリスク

SpaceX、AI企業としての評価獲得を狙う

データセンター資源をCursorに提供可能

詳細を見る

SpaceXがAIコーディングツールCursorの開発元Anysphereに対し、600億ドル（約9兆円）での買収オプションを提示しました。Cursorは発表のわずか数時間前まで、Andreessen HorowitzやNvidia等が参加する20億ドルの資金調達ラウンド（評価額500億ドル）のクローズを今週中に予定していました。SpaceXは今年中に買収を実行するか、買収しない場合でもAI開発協業の対価として100億ドルをCursorに支払うとしています。

Cursorは資金調達と買収交渉を並行して進めていました。20億ドルの調達が実現しても、キャッシュフローの黒字化には不十分で、追加の大型調達が不可避だったとされています。AnthropicのClaude CodeやOpenAIのCodexとの競争が激化するなか、巨額の計算資源を確保し続ける独立路線には不確実性が高まっていました。

一方、xAIと合併したSpaceXは、AI分野の強化を急いでいます。GoogleによるWindsurfの買収がキーパーソンの獲得を主目的としたのに対し、SpaceXはCursorのチーム全体を維持する方針です。ミシシッピ州やテネシー州のデータセンターが持つ膨大な計算能力をCursorに提供できる点も、協業の実質的な価値となります。

SpaceXが買収手続きをIPO後に先送りする理由は、上場前の財務開示の更新を避けたいことと、公開株式を買収資金に活用しやすくなることにあります。さらにCursor 買収の発表は、SpaceXを宇宙・衛星事業だけでなくAI企業として市場に位置づける狙いがあり、ウォール街が付与する高いバリュエーション倍率の獲得を見込んでいます。

出典：TechCrunch

Agentforce Vibes 2.0がコンテキスト肥大化問題に挑む

2026年04月22日 OpenAI Salesforce Claude Claude Code Codex ワークフローエンジニア推論コーディングオーストラリアスタートアップ投資エージェントコンテキスト

コンテキスト肥大化の実態

複雑化で文脈量が膨張

トークン増加でコスト・遅延悪化

ノイズ混入で精度が低下

VentureCrowdも導入初期に直面

Salesforceの対策と業界動向

Skills/Abilitiesで文脈を制御

サードパーティ連携を拡充

Claude CodeやCodexは自動圧縮型

取捨選択の設計が成否を分ける

詳細を見る

AIエージェントの「コンテキスト肥大化（Context bloat）」が、企業導入における隠れた障壁として注目されています。ワークフローが複雑になるほどエージェントに渡すデータや指示が膨張し、トークン消費の増大・処理速度の低下・コスト上昇を引き起こします。オーストラリアのスタートアップ投資プラットフォームVentureCrowdは、AIコーディングエージェントでフロントエンド開発サイクルを最大90%短縮した一方、まさにこの問題に直面しました。

VentureCrowdのCPO Diego Mogollon氏は「課題はエージェント自体ではなく、周囲の環境にある。AI問題に見えて実はコンテキスト問題だ」と指摘します。エージェントは実行時にアクセスできるデータを根拠に推論するため、不適切なデータや不明確なプロセスがあると、自信を持って誤った結果を出力してしまいます。

SalesforceはAgentforce Vibes 2.0でこの課題に対応しました。新たに導入されたAbilities（目標定義）とSkills（ツール指定）により、エージェントが参照するコンテキストをSalesforceのデータモデル内に限定できます。ReActなどサードパーティフレームワークへの対応も拡充され、無料プランから利用可能です。

一方、Claude CodeやOpenAI Codexはファイル読み込みやコマンド実行で自律的にコンテキストを拡張し、肥大化時には自動圧縮で対処する設計です。いずれのアプローチもコンテキストの「制限」ではなく「管理」に重点を置いている点は共通しています。

Mogollon氏は「より多くの情報を与えることではなく、何を除外するかが重要だ」と強調します。コンテキストエンジニアリングへの投資と、自社に適した制約手法の選択が、企業のエージェント活用の成否を左右する局面に入っています。

出典：VentureBeat

OpenAIがInfosysと提携、Codexを企業向けに展開

2026年04月22日 OpenAI Anthropic Gemini Codex ワークフロー AI導入エンジニアリスクコーディング米国インド提携

提携の概要と狙い

CodexをTopaz AIに統合

ソフトウェア開発・DevOpsが対象

60カ国超の顧客基盤を活用

実験段階から大規模導入へ

業界動向と背景

インドIT大手の株価が年初来22%下落

AI関連売上は四半期約267億円

Codex Labs設立で導入支援を強化

週間400万人超のCodexユーザー

詳細を見る

OpenAIはインドIT大手Infosysと提携し、コーディング支援ツールCodexを含むAIツール群をInfosysのTopaz AIプラットフォームに統合すると発表しました。ソフトウェア開発の近代化、ワークフローの自動化、AIシステムの大規模展開を支援する狙いで、まずはソフトウェアエンジニアリング、レガシーシステムの刷新、DevOps領域に注力します。

この提携はAI企業がグローバルITサービス事業者と組み、大企業でのAI導入を加速させるトレンドの一環です。OpenAIは以前からHCLTechと提携しており、InfosysもAnthropicと同様の契約を結んでいます。OpenAIにとってInfosysの60カ国超にわたる顧客基盤は、エンタープライズ市場への重要な販売チャネルとなります。

インドのIT業界は厳しい局面にあります。クライアント支出の鈍化と生成AIの急速な進化が重なり、Infosysの株価は年初来で22%以上下落しました。従来のアウトソーシング業務がAIに置き換えられるとの懸念や、米国・イランの地政学リスクも影響しています。一方でInfosysはAI事業を積極的に拡大しており、12月四半期のAI関連売上は約250億ルピー（約267億円）に達し、総売上の約5.5%を占めています。

OpenAIは同日、企業向けCodex導入を支援するCodex Labsの設立も発表しました。Accenture、Capgemini、Cognizant、PwC、TCSなど大手ITサービス企業が初期パートナーに名を連ねます。Codexは現在週間アクティブユーザー400万人を超えており、これらのパートナー網を通じてさらなる普及を目指します。金額など契約の詳細は公表されていません。

出典：TechCrunch

OpenAI、ChatGPTにチーム共有型AIエージェント機能を追加

2026年04月22日 OpenAI Anthropic Slack ChatGPT Claude Codex OpenClaw ワークフロースケジュール調整 CRM クラウドコンプライアンスエージェント

機能と設計思想

Codex基盤のクラウド実行型

チーム内で共有・改善が可能

Slack連携で自動応答に対応

スケジュール実行や承認制御を搭載

業務適用と展開

営業・経理・IT審査など実用例多数

GPTsからの移行パスを提供

5月6日からクレジット課金開始

管理者向け監視・制御機能を装備

詳細を見る

OpenAIは2026年4月22日、ChatGPTの有料ビジネスプラン向けに「ワークスペースエージェント」機能をリサーチプレビューとして公開しました。従来のGPTsを発展させた位置づけで、Codexをエンジンとしてクラウド上で自律的にタスクを実行します。チーム内で共有でき、レポート作成やリード対応、ベンダー審査といった反復的な業務ワークフローを自動化できます。

エージェントはSlackやメール、CRMなど外部ツールと連携し、スケジュール実行やイベント駆動で動作します。機密性の高い操作には承認ステップを設定でき、管理者はコンプライアンスAPIを通じてエージェントの構成や実行履歴を監視できます。ロールベースのアクセス制御により、組織全体での安全な運用を実現しています。

構築はChatGPT上の対話型ビルダーで行い、自然言語でワークフローを記述するとエージェントが自動生成されます。テンプレートも用意されており、営業・マーケティング・財務などの領域ですぐに利用を開始できます。エージェントは使用を重ねるほど改善され、チームの暗黙知を再利用可能なワークフローに変換する設計です。

OpenAIの社内でも営業チームがコールメモからのリード評価やフォローアップメール作成に活用しており、週5〜6時間の手作業が自動化された事例が報告されています。The Vergeは、AnthropicのClaude CoworkやOpenClawなどAIエージェント市場の競争激化を指摘しています。ワークスペースエージェントは5月6日まで無料で、以降はクレジットベースの課金に移行する予定です。

出典：OpenAI公式 | The Verge | OpenAI公式

OpenAI、Responses APIにWebSocket対応を追加

2026年04月22日 OpenAI Vercel Cerebras Codex GPT-5 エンジニア推論 GPU ハードウェアインフラコーディング開発ツールエージェント Cursor

高速化の仕組み

永続接続で会話状態を再利用

トークン再レンダリングを省略

安全性チェックを差分のみに限定

導入効果

エージェント処理が最大40%高速化

GPT-5.3で1,000TPS超を達成

Codex・Cursor・Clineが即座に採用

推論高速化の恩恵をユーザーへ直結

詳細を見る

OpenAIは2026年4月22日、Responses APIにWebSocketモードを正式導入したと発表しました。従来のHTTPベースでは、エージェントがツール呼び出しのたびに会話履歴全体を再送信する必要があり、推論速度が向上してもAPIのオーバーヘッドがボトルネックになっていました。WebSocketによる永続接続でこの構造的課題を解消し、エージェントのエンドツーエンド処理を最大40%高速化しています。

技術的には、WebSocket接続のライフタイム内で前回のレスポンス状態をインメモリにキャッシュする設計です。後続リクエストがprevious_response_idを指定すると、サーバーはキャッシュから状態を取得し、トークンの再レンダリングやモデル解決ロジックの再実行を省略します。安全性分類器やバリデーターも差分入力のみを処理するよう最適化されました。

開発の背景には、コーディングエージェントCodex向けの高速モデルGPT-5.3-Codex-Sparkの存在があります。同モデルは専用のCerebras ハードウェア上で1,000TPS超の推論速度を実現しますが、従来のAPI構造ではCPU側の処理がGPUの速度に追いつかない状態でした。WebSocketモードの導入により、本番環境で1,000TPSの目標を達成し、バースト時には4,000TPSも記録しています。

既にVercel AI SDK、Cline、Cursorなど主要な開発ツールがWebSocketモードを統合済みです。Vercelは最大40%、Clineは39%、Cursorは最大30%のレイテンシ改善を報告しています。既存のResponses APIと同じリクエスト・レスポンス形式を維持しているため、開発者はインテグレーションを大幅に書き換えることなく移行できる点も普及を後押ししています。

OpenAIはWebSocketモードを、2025年3月のResponses APIローンチ以来最も重要な機能追加と位置づけています。モデルの推論速度が急速に向上する中、APIインフラ側の最適化がユーザー体験に直結する時代に入ったことを示す事例といえます。

出典：OpenAI公式

OpenAI、Codex Labs設立で企業導入を加速

2026年04月21日 OpenAI Notion Gemini Codex 生産性ワークフローエンジニア専門家コーディングデプロイコードレビュー提携エージェント

急拡大する利用実績

週間利用者が4百万人突破

Virgin AtlanticやCiscoなど大手が採用

コーディング以外の業務にも用途拡大

企業展開の新体制

Codex Labs設立で導入支援を本格化

Accentureら大手SIer7社と提携

パイロットから本番運用への移行を支援

詳細を見る

OpenAIは2026年4月21日、コーディングエージェント「Codex」の企業導入を加速するため、新プログラム「Codex Labs」を立ち上げたと発表しました。あわせて大手グローバルシステムインテグレーター（GSI）7社との提携も公表し、世界中の企業へのCodex展開を本格化します。

Codexの週間利用者数は4月初旬の300万人から、わずか2週間で400万人超に急増しています。個人開発者だけでなく、Virgin Atlanticはテストカバレッジ向上と技術的負債の削減に、Rampはコードレビューの高速化に、Ciscoは大規模リポジトリの横断的な分析にCodexを活用しています。さらにNotionは新機能開発、Rakutenはインシデント対応にも導入しています。

Codex Labsは、OpenAIの専門家が企業に直接入り込み、ハンズオンワークショップや実務セッションを通じてCodexの導入を支援するプログラムです。どの業務にCodexが適合するかの特定から、既存ワークフローへの統合、反復的な運用体制の構築までをカバーします。

提携先のGSIにはAccenture、Capgemini、CGI、Cognizant、Infosys、PwC、TCSの7社が名を連ねています。各社はCodexの高価値なユースケースの特定とデプロイを支援し、パイロットから本番環境への移行を後押しします。GSI各社自身もCodexを社内で活用し、顧客への展開ノウハウを蓄積しています。

Codexの用途はコーディングにとどまらず、ブラウザ操作やドキュメント作成、複数ツール横断の情報整理といったナレッジワーク領域にも広がっています。OpenAIはエンジニアリング部門だけでなく、あらゆる部門の生産性向上を見据えた企業全体での活用を推進する方針です。

出典：OpenAI公式

OpenAIがChatGPT Images 2.0を公開、推論と多言語テキスト生成を統合

2026年04月21日 Google OpenAI マイクロソフト ChatGPT Nano Banana Codex 検索画像生成推論ポリシー画像中国日本韓国エージェントプロンプト

推論統合による画像生成

Oシリーズ推論機能を統合

Web検索で最新情報を反映

1プロンプトで最大8枚同時生成

キャラクターの一貫性を維持

テキスト描画と多言語対応

英語テキストの高精度レンダリング

日中韓含む非ラテン文字に対応

インフォグラフィックや漫画を生成

2K解像度と柔軟なアスペクト比

提供体系と競争環境

全ユーザーに基本機能を無料開放

有料プランでThinking機能を提供

GoogleやMicrosoftとの競争が激化

詳細を見る

OpenAIは2026年4月21日、ChatGPT Images 2.0を全世界のChatGPTおよびCodexユーザー向けに公開しました。今回のアップデートでは、同社のOシリーズ推論機能が画像生成に統合され、プロンプトに対してモデルがWeb検索やレイアウト設計を行ったうえで画像を生成する「エージェント型」のアプローチが導入されています。知識のカットオフは2025年12月に更新されました。

最大の技術的進歩は、テキスト描画の精度向上です。かつてAI画像生成の弱点とされていた文字の崩れが大幅に改善され、メニューや雑誌の表紙、科学図表など密度の高い構成でも正確な文字を生成できるようになりました。さらに日本語、韓国語、中国語、ヒンディー語、ベンガル語など非ラテン文字の描画にも対応しています。ただし非英語言語では一部不正確な出力も報告されており、今後の改善が期待されます。

機能面では、1つのプロンプトから最大8枚の画像を同時に生成でき、キャラクターやオブジェクトの一貫性を保持したまま漫画のシーケンスやソーシャルメディア用グラフィックの作成が可能です。解像度は最大2Kに対応し、アスペクト比は横長の3:1から縦長の1:3まで柔軟に設定できます。アーキテクチャは「ゼロから刷新」されたとのことですが、拡散モデルか自己回帰モデルかは非公開です。

提供体系は3層構造で、無料ユーザーには基本モデルを開放し、PlusおよびProユーザーにはWeb検索や複数画像生成を含むThinking機能を提供します。API向けにはgpt-image-2モデルが公開され、4K解像度のベータ版も用意されています。前モデルのGPT-Image-1.5はデフォルトから外れましたが、APIでのレガシーサポートは継続します。

競合環境では、GoogleのNano Banana 2やMicrosoftのMAI-Image-2がすでに市場に投入されており、画像生成AIの性能競争は一段と激しさを増しています。OpenAIは安全対策として、AI生成画像への透かし付与や選挙干渉防止のポリシーを堅持する姿勢を示しました。企業ユーザーにとっては、単なる画像生成ツールから「視覚的な情報整理システム」への転換点となる可能性があります。

出典：The Verge | TechCrunch | WIRED | VentureBeat

Kimi K2.6が数日間稼働するAIエージェントを実現

2026年04月21日 OpenAI Anthropic Claude Claude Code Codex ワークフローエンジニア専門家インフラセキュリティ中国スタートアップエージェント AIゲートウェイ Hugging Face Arm

長時間エージェントの実力

最長5日間の自律稼働を実証

300サブエージェント・4000ステップ同時実行

SySYコンパイラを10時間で構築

8年物のOSSコードを13時間で刷新

オーケストレーションの課題

既存フレームワークは短時間前提の設計

状態管理とロールバックが未整備

ガバナンスが導入速度に追いつかず

エージェント専用インフラの概念が未成熟

詳細を見る

中国のAIスタートアップMoonshot AIは2026年4月、新モデルKimi K2.6を発表しました。同モデルは長時間にわたり自律的に稼働するAIエージェントを想定して設計されており、社内テストでは最長5日間の連続実行に成功しています。モデルはHugging Face、API、Kimi Codeなどを通じて公開されました。

Kimi K2.6の特徴は、独自の「Agent Swarms」アーキテクチャにあります。最大300のサブエージェントが4000ステップを同時に処理でき、事前定義された役割ではなくモデル自身がオーケストレーションを判断します。AnthropicのClaude CodeやOpenAIのCodexも長時間エージェントを模索していますが、K2.6はより動的な制御を目指しています。

実証実験では、SySYコンパイラを10時間で一から構築し、140件の機能テストをすべて通過しました。Moonshot AIはこれを「エンジニア4人が2カ月かかる作業に相当する」と説明しています。また、8年間運用されたオープンソースの金融マッチングエンジンの改修では、13時間で12の最適化戦略を試行し、1000回以上のツール呼び出しで4000行超のコードを修正しました。

一方、長時間稼働するエージェントは既存のオーケストレーション基盤の限界を露呈させています。大半のフレームワークは数秒から数分の実行を前提に設計されており、環境変化に応じた状態管理や障害時のロールバックが十分に整備されていません。専門家は「エージェントランタイム」「エージェントゲートウェイ」「エージェントメッシュ」といった新たなインフラ概念の必要性を指摘しています。

セキュリティ企業ArmorCodeのMark Lambert氏は、AIエージェントがコードやシステム変更を生成する速度が組織のレビュー能力を超えつつあると警告しています。F5のKunal Anand氏も、エージェントが「永続的インフラ」として機能する時代に入ったと述べ、APIゲートウェイのパターン自体が目標やワークフローを理解する形へ進化する必要があると指摘しました。

出典：VentureBeat

Hyattが全従業員にChatGPT Enterprise導入

2026年04月20日 OpenAI ChatGPT Codex 生産性 AI活用 AI採用エンジニアコンテンツブランド

導入の概要と狙い

全社的にChatGPT Enterprise展開

GPT 5.4やCodexを利用可能

手作業削減で接客時間を確保

OpenAIと連携し研修も実施

活用される部門と効果

財務の決算・分析業務を加速

マーケティングのコンテンツ制作効率化

開発チームの生産性向上

顧客体験のパーソナライズ強化

詳細を見る

Hyatt Hotelsは、OpenAIのChatGPT Enterpriseを全世界の本社およびホテル従業員に展開したことを発表しました。従業員はGPT 5.4やCodexなど最先端のAI機能にアクセスでき、手作業の削減により顧客対応に集中できる環境を整備します。

今回の導入は、財務、マーケティング、事業開発、プロダクト・エンジニアリング、カスタマーエクスペリエンスなど多岐にわたる部門を対象としています。財務部門では月次・四半期決算の迅速化や財務分析の精度向上が期待され、マーケティング部門ではコンテンツ制作の大規模化とブランド一貫性の強化に活用されます。

導入にあたりHyattはOpenAIと緊密に連携し、ライブ研修やオンボーディングセッションを実施しています。従業員が日常業務にAIをスムーズに統合できるよう支援体制を整えており、ChatGPTアプリとの連携など新たなAI体験の構築も進めています。

Hyattの取り組みは、Accenture、Walmart、Morgan Stanleyなど大手企業によるOpenAI採用の流れに続くものです。OpenAIのビジネス顧客は全世界で100万社を超えており、ホスピタリティ業界におけるAI活用の拡大を象徴する事例といえます。

出典：OpenAI公式

OpenAI幹部3人が同日退社、事業集約で科学・動画部門を整理

2026年04月17日 OpenAI Anthropic ChatGPT Sora Codex 動画コーディングサム・アルトマン医療投資 IPO

相次ぐ幹部の退社

Kevin Weilが科学部門ごと退社

Sora責任者Bill Peeblesも離脱

エンタープライズCTOも同日退社を発表

戦略転換の背景

Soraは日次100万ドルの損失で先月終了

科学研究ツールPrismも廃止しCodexに統合

IPO準備に向けコーディングと法人向けに集中

組織の混乱と再編

Fidji Simoの医療休暇で経営陣が再編

Altmanが「混沌」を認め安定運営を表明

詳細を見る

OpenAIで4月17日、Kevin Weil（科学部門VP・元CPO）、Sora責任者のBill Peebles、エンタープライズ担当CTOのSrinivas Narayananの3人が同日に退社を発表しました。OpenAIが「サイドクエスト」と呼ぶ周辺事業の整理を進める中での離脱で、同社の戦略転換を象徴する動きです。

Weilが率いたOpenAI for Scienceは他の研究チームに分散され、科学者向けAIワークスペースPrismは廃止されます。Prismの機能はCodexデスクトップアプリに統合される計画です。Weilの退社は、彼のチームが生命科学向けモデルGPT-Rosalindを発表したわずか翌日のことでした。

AI動画ツールSoraは1日あたり推定100万ドルの計算コストが発生しており、先月サービスを終了しています。責任者だったPeeblesは退社に際し、Soraが業界全体のAI動画投資を加速させた意義を強調しつつ、「エントロピーを育むことが研究機関の長期的成長に不可欠だ」と述べました。

OpenAIはエンタープライズ向けサービスとコーディングツールに経営資源を集中し、ChatGPTを「スーパーアプリ」化する構想を推進しています。年内のIPO申請も視野に入れており、Anthropicなど競合との激化する競争に対応する狙いがあります。

こうした動きは、Fidji Simoの医療休暇、Brad Lightcapの特別プロジェクト異動、Kate Rouchの休職など、一連の経営陣再編の延長線上にあります。Sam Altman CEOは自身のブログで「極度に激しく混沌とした数年間だった」と認め、より予測可能な運営体制への移行を示唆しています。

出典：TechCrunch | WIRED | The Verge

AIコーディングのCursor、評価額500億ドルで20億ドル調達へ

2026年04月17日 OpenAI Anthropic NVIDIA Claude Claude Code Codex エンジニア投資家リスクコーディング中国投資資金調達評価額 ARR Cursor Andreessen Horowitz

資金調達の概要

評価額500億ドルで交渉中

Thrive・a16zが主導の見込み

NvidiaやBattery Venturesも参加か

前回の293億ドルからほぼ倍増

急成長する事業基盤

2026年末ARR60億ドル超を予測

独自モデルで粗利益黒字化を達成

法人向けは黒字、個人向けは赤字継続

Claude CodeやCodexと競合激化

詳細を見る

AIコーディングツールを手がけるCursorが、少なくとも20億ドルの新規資金調達に向けた交渉を進めていることが、事情に詳しい複数の関係者への取材で明らかになりました。既存投資家のThrive CapitalとAndreessen Horowitzがリードする見込みで、評価額は新規資金注入前の時点で500億ドルに達するとされています。

今回の調達が実現すれば、2025年11月に実施した前回ラウンドの293億ドルからわずか半年で評価額がほぼ倍増することになります。新たな投資家としてBattery Venturesの参加が見込まれるほか、戦略的投資家であるNvidiaも出資する可能性があると報じられています。ラウンドはすでにオーバーサブスクライブの状態ですが、最終条件は確定していません。

Cursorは2026年末までに年間経常収益（ARR）60億ドル超を見込んでおり、2026年2月時点のARR20億ドルから約3倍の成長を想定しています。従来はサードパーティモデルへの依存により粗利益率がマイナスでしたが、2025年11月に投入した独自のComposerモデルや、中国発の低コストモデルKimiの活用により、わずかながら粗利益の黒字化を達成しました。

競合環境は厳しさを増しています。AnthropicのClaude CodeやOpenAIのCodexなど、モデル提供元自身がコーディングツール市場に参入しており、Cursorは自社のサプライヤーに置き換えられるリスクに直面しています。独自モデルの開発を加速させることで差別化を図る戦略ですが、大企業向けでは黒字を確保する一方、個人開発者向けアカウントでは依然として赤字が続いており、収益構造の改善が今後の課題です。

出典：TechCrunch

Salesforce、全機能をAPI化する「Headless 360」発表

Headless 360の全容

全機能をAPI・MCP・CLIで公開

100超の新ツールを即日提供

ReactによるUI開発に対応

AIエージェント基盤の整備

Agent Scriptをオープンソース化

静的・動的グラフの統一ランタイム

従量課金モデルへ移行

オープン戦略と今後

OpenAI・Anthropic等の主要モデル統合

AgentExchangeに5000万ドル投資

詳細を見る

Salesforceは2026年4月16日、サンフランシスコで開催した年次開発者会議TDXにて、プラットフォームの全機能をAPI・MCPツール・CLIコマンドとして公開する「Headless 360」構想を発表しました。AIエージェントがブラウザを開くことなくシステム全体を操作できるようにする、同社27年の歴史で最も大規模なアーキテクチャ刷新です。

即日利用可能な100以上の新ツールには、60超のMCPツールと30超のコーディングスキルが含まれ、Claude CodeやCursor、Codexなどの外部コーディングエージェントからSalesforce組織全体にアクセスできます。さらにReactによるフロントエンド開発にも対応し、Lightning以外の選択肢を開発者に提供しています。Agentforce Experience Layerにより、Slack・Teams・ChatGPTなど複数のサーフェスへ一度の定義でデプロイが可能になりました。

エージェントの信頼性確保に向けては、新たなドメイン固有言語「Agent Script」をオープンソースで公開しました。これは決定論的な制御とLLMの柔軟性を両立させるもので、顧客向けには静的グラフで厳密に制御し、社内向けには動的グラフで自律的に推論させる、2つのアーキテクチャを同一ランタイム上で実現します。テストセンターやA/Bテスト APIなど、ライフサイクル管理ツール群も整備されました。

プラットフォームの開放戦略として、OpenAI・Anthropic・Google Gemini・Meta LLaMA・Mistral AIのモデルを統合し、AgentExchangeマーケットプレイスには5000万ドルの投資枠を設定しています。一方でEVPのGovindarjan氏はMCPの将来について「正直なところ確信はない」と率直に述べ、API・CLI・MCPの3方式すべてを提供する方針を示しました。

収益モデルも従来のシート課金から消費ベースの課金へ移行します。AIエージェントが業務を担う時代には、ユーザー数ではなく利用量に応じた課金が合理的だという判断です。SaaS業界全体がAIによる既存モデルの陳腐化を懸念する中、Salesforceは自らのプラットフォームを解体・再構築することで、エージェント時代のインフラとしての地位を確立しようとしています。

出典：VentureBeat

RobloxのAIアシスタントにエージェント機能追加

2026年04月16日 Claude Codex アシスタントワークフローデザインクリエイタークラウドエージェントプロンプト Cursor

計画から実装まで支援

Planning Modeで意図を対話的に具体化

コード分析と質問で計画を自動作成

計画に沿いAIが自動でゲーム構築

3D生成と自動テスト

テクスチャ付き3Dメッシュの即時生成

プロシージャルモデルで編集可能な3D作成

自動プレイテストでバグ検出・修正

複数エージェントの並列実行も開発中

詳細を見る

Robloxは2026年4月16日、ゲーム開発向けAIアシスタント「Roblox Assistant」に新たなエージェント機能を導入したと発表しました。従来のプロンプト一発型ではなく、計画・構築・テストの全工程でクリエイターと協働する仕組みへと刷新されています。同社はTechCrunchへの独占取材で詳細を明らかにしました。

中核となる「Planning Mode」は、Assistantを対話型の開発パートナーに変える機能です。ゲームのコードやデータモデルを分析したうえで明確化のための質問を行い、プロンプトを編集可能なアクションプランに変換します。クリエイターは実装前にプランを微調整でき、意図が正確に反映されているか確認できます。

新たに発表された「Mesh Generation」と「Procedural Model Generation」も注目の機能です。Mesh Generationはテクスチャ付きの3Dオブジェクトをゲーム内に直接生成でき、開発初期のプレースホルダー作成を大幅に効率化します。Procedural Modelsはコードとプロンプトで編集可能な3Dモデルを作成し、本棚の段数や階段の高さなどの属性を動的に調整できます。

テスト工程もエージェント化されています。Planning Modeの実行中、AIはプレイテストツールを使ってログ読み取り・スクリーンショット撮影・キーボードやマウス入力によるデザイン確認を行い、バグを発見するとAssistantにフィードバックして自動修正します。この自己修正ループにより、実行を重ねるほど精度が向上する仕組みです。

今後の計画として、複数AIエージェントの並列稼働、クラウドでの長時間ワークフロー実行、より現実的なゲームキャラクターの生成を開発中です。Claude、Cursor、Codexなどサードパーティツールとの連携も予定されており、Roblox Studioの開発環境がさらに拡張される見込みです。

出典：TechCrunch

OpenAI、Codexにデスクトップ操作や画像生成を追加

主要な新機能

バックグラウンドでアプリ操作

画像生成モデルを統合

アプリ内ブラウザでフロントエンド開発

90以上の新プラグイン追加

開発者体験の進化

記憶機能で過去の操作を学習

自動化タスクのスケジュール実行

複数エージェントの並列動作

競争と展開

Claude Code対抗で機能拡充

詳細を見る

OpenAIは2026年4月16日、開発者向けツールCodexの大規模アップデートを発表しました。週間300万人が利用するCodexに、デスクトップアプリのバックグラウンド操作、画像生成、アプリ内ブラウザなどの機能を追加します。コーディング専用ツールから「スーパーアプリ」を目指す総合的な開発環境への転換を図ります。

最大の目玉は「Computer Use」機能です。macOSユーザー向けに先行提供され、Codexが独自のカーソルでデスクトップ上のあらゆるアプリを操作できるようになります。ユーザーが別のアプリで作業を続けている間も、複数のエージェントがバックグラウンドで並列に動作します。OpenAIのCodex責任者Thibault Sottiauxは「Codexを起点にスーパーアプリを構築している」と戦略を明言しました。

画像生成モデルgpt-image-1.5の統合により、モックアップやゲームアセットをコーディングと同じワークフロー内で作成できます。さらに90以上の新プラグインが追加され、CircleCIやGitLab、Microsoft Suiteなど開発者が日常的に使うツールとの連携が強化されました。SlackやGmail、Notionなど複数アプリの情報を一括で取得し、優先度順に提示する機能も備えます。

プレビュー版として提供される「Memory」機能では、過去のセッションで得た好みや修正履歴を記憶し、次回以降のタスクを効率化します。「Heartbeat Automations」により、Codexは自らタスクをスケジュールし、数日から数週間にわたる長期作業を自動で継続できるようになりました。毎朝のデイリーブリーフ機能では、Google DocsやSlackの未対応事項を整理して提示します。

今回のアップデートは、Anthropicとの競争激化を背景としています。Claude Codeが企業利用で支持を集めるなか、OpenAIはCodexの機能拡充で巻き返しを狙います。バックグラウンド操作はmacOS限定で提供開始され、Windows版は基本機能のみ対応です。パーソナライゼーション機能のEnterprise・Edu・EU・UK向け提供は後日予定となっています。

出典：OpenAI公式 | Ars Technica | VentureBeat | The Verge | TechCrunch

OpenAIが生命科学特化モデルGPT-Rosalindを発表

2026年04月16日 OpenAI GitHub Codex 検索エコシステムワークフロー GPT-5 専門家推論推論モデルセキュリティ品質保証米国創薬ベンチマーク

モデルの性能と特徴

生物学ワークフロー50種に最適化

BixBenchで公開モデル最高性能

RNA予測で人間専門家の95%超え

タンパク質工学・ゲノミクスに対応

研究エコシステムの構築

Codex用プラグインをGitHubで公開

50以上の公開データベースと連携

米国の認定企業に限定提供

プレビュー期間はクレジット無償

詳細を見る

2026年4月16日、OpenAIは生命科学研究に特化した推論モデルGPT-Rosalindを発表しました。DNA構造の解明に貢献した化学者ロザリンド・フランクリンにちなんで命名されたこのモデルは、創薬やゲノミクス、タンパク質工学などの科学ワークフローに最適化されており、仮説生成から実験計画まで研究の初期段階を加速することを目的としています。

性能評価では、バイオインフォマティクスベンチマークBixBenchで公開スコアを持つモデル中最高の成績を記録しました。LABBench2ではGPT-5.4を11タスク中6タスクで上回り、特に分子クローニングプロトコルの設計タスクCloningQAで顕著な向上を示しています。さらにDyno Therapeuticsとの共同評価では、未公開RNA配列の予測タスクで人間専門家の95パーセンタイルを超える結果を達成しました。

OpenAIは同時にCodex向けLife Sciences研究プラグインをGitHubで無償公開しました。このプラグインは50以上の公開マルチオミクスデータベースや文献ソースに接続し、タンパク質構造の検索や配列解析、文献レビューなど日常的な研究ワークフローを統合する仕組みです。Amgen、Moderna、Allen Institute、Thermo Fisher Scientificなどが初期パートナーとして参加しています。

GPT-Rosalindは現在、米国の認定エンタープライズ顧客に限定したリサーチプレビューとして提供されています。アクセスには有益な研究目的、適切なガバナンス体制、企業レベルのセキュリティ管理が求められ、プレビュー期間中はクレジットを消費しない方針です。OpenAIはロスアラモス国立研究所との共同研究も進めており、AI誘導によるタンパク質・触媒設計の探索を含め、生命科学モデルシリーズの長期的な拡充を予定しています。

出典：OpenAI公式 | VentureBeat | Ars Technica

MozillaがセルフホストAIクライアントThunderboltを発表

2026年04月16日 OpenAI DeepSeek Claude Codex AI導入データ漏洩インフラクラウドセキュリティプライバシーブランドエージェント

製品の概要と特徴

自社運用型のAIクライアント

Haystack基盤の柔軟な構成

複数AIモデルとAPI互換

企業向けの安全設計

ローカルSQLiteでデータ保持

エンドツーエンド暗号化に対応

デバイス単位のアクセス制御

クラウド非依存の完全自社管理

詳細を見る

Mozillaは2026年4月16日、企業向けの新しいAIクライアントThunderboltを発表しました。クラウドベースのサードパーティサービスに依存せず、自社インフラ上でAIを運用したい企業や個人に向けた製品です。Firefoxブラウザで知られるMozillaが、独自のAIモデルやエージェントブラウザではなく、フロントエンドクライアントという形でエンタープライズAI市場に参入しました。

Thunderboltは、オープンソースのAIフレームワークHaystackの上に構築されています。Haystackはユーザーが選んだコンポーネントからカスタムのAIパイプラインを構築できるモジュラー型のフレームワークで、Thunderboltはその上で動作する「ソブリンAIクライアント」として位置づけられています。ACP互換エージェントやOpenAI互換APIに接続でき、Claude、Codex、DeepSeekなど主要なモデルとの連携が可能です。

企業データとの統合もThunderboltの大きな特徴です。オープンプロトコルを通じてローカルに保存された企業データにアクセスし、オフラインのSQLiteデータベースをモデルが参照する「信頼できる情報源」として活用できます。ローカル実行モデルと組み合わせることで、AIスタック全体を自社で管理できる仕組みです。

セキュリティ面では、オプションのエンドツーエンド暗号化とデバイスレベルのアクセス制御を提供しています。データ漏洩を懸念する企業にとって、外部プロバイダーへのデータ送信を排除できる点は大きな訴求力となるでしょう。Mozillaのブランド力とオープンソースの実績を背景に、プライバシー重視のAI導入という新たな選択肢を企業に提示しています。

出典：Ars Technica

OpenAI、サイバー防御向け専用モデルを提供開始

2026年04月14日 OpenAI ChatGPT Codex エコシステム GPT-5 エンジニアファインチューニングリスク脆弱性インフラセキュリティ認証デプロイ

TACプログラム拡大

数千人規模の個人防御者へ開放

数百チームの重要インフラ防御組織が対象

本人確認による段階的アクセス制御

chatgpt.com/cyberから個人登録可能

GPT-5.4-Cyberの特徴

防御用途向けにファインチューニング

バイナリリバースエンジニアリング機能搭載

正当な脆弱性研究への制限を緩和

限定的・段階的なデプロイで提供開始

サイバー防御戦略の全体像

Codex Securityで3,000件超の重大脆弱性を修正

1,000以上のOSSプロジェクトに無料スキャン提供

詳細を見る

OpenAIは2026年4月14日、サイバー防御者向けの信頼アクセスプログラム「Trusted Access for Cyber（TAC）」を大幅に拡大し、数千人の認証済み個人防御者と数百の重要ソフトウェア防御チームに開放すると発表しました。同時に、防御的サイバーセキュリティ用途に特化してファインチューニングした新モデル「GPT-5.4-Cyber」の提供を開始します。

GPT-5.4-Cyberは、GPT-5.4をベースにサイバーセキュリティの正当な業務に対する制限を緩和したモデルです。最大の特徴は、ソースコードなしでコンパイル済みソフトウェアのマルウェア分析や脆弱性調査を行えるバイナリリバースエンジニアリング機能を備えている点です。デュアルユースのリスクがあるため、審査済みのセキュリティベンダーや研究者に限定して段階的に展開されます。

TACプログラムへのアクセスは明確な手順で設計されています。個人ユーザーはchatgpt.com/cyberで本人確認を行うことで登録でき、企業はOpenAIの担当者を通じてチーム単位でのアクセスを申請します。承認されたユーザーは、デュアルユースのサイバー活動に関する安全制限が緩和されたモデルを利用でき、さらに上位のアクセス階層としてGPT-5.4-Cyberの利用を希望することも可能です。

OpenAIのサイバーセキュリティ戦略は、アクセスの民主化、反復的デプロイ、エコシステムの回復力という3つの原則に基づいています。同社はGPT-5.2から段階的にサイバー特化の安全訓練を拡充してきました。GPT-5.4は準備態勢フレームワークで「高」サイバー能力に分類されており、モデル能力の向上に合わせて防御も拡大する方針を掲げています。

実績面では、半年前にプライベートベータで開始したCodex Securityがコードベースの自動監視と修正提案を行い、3,000件超の重大・高リスク脆弱性の修正に貢献しています。また、1,000以上のオープンソースプロジェクトに無料セキュリティスキャンを提供する「Codex for Open Source」や、総額1,000万ドルのサイバーセキュリティ助成プログラムも展開しており、防御者コミュニティの強化を多面的に進めています。

出典：OpenAI公式

Claude性能低下疑惑が拡散、Anthropicは否定

2026年04月13日 OpenAI Anthropic GitHub ChatGPT Claude Claude Code Codex Opus エンジニア推論プロンプトベンチマーク Reddit

ユーザー側の主張

AMD幹部が詳細な分析を公開

推論深度の低下をログで実証と主張

BridgeBenchスコア急落の報告

「AI値下げ詐欺」との批判拡大

Anthropicの反論

モデル自体の劣化を明確に否定

思考量デフォルト変更が原因と説明

キャッシュTTL変更も意図的と回答

ユーザー体感と製品設定の認識差

詳細を見る

Anthropicの主力モデルClaude Opus 4.6およびClaude Codeの性能が低下しているとの苦情が、GitHub、X、Redditで急速に拡散しています。きっかけとなったのは、AMDのAI部門シニアディレクターであるStella Laurenzo氏が4月2日に投稿した詳細な分析です。同氏は約6,800件のセッションファイルと約1万8,000件の思考ブロックを調査し、2月以降に推論の深さが著しく低下したと主張しました。

この投稿はXで拡散され、開発者のOm Patel氏による「67%の性能低下」という投稿や、BridgeMindのベンチマークで精度が83.3%から68.3%に下落したとする報告も加わり、「AIシュリンクフレーション（値下げ詐欺）」という表現とともに大きな議論を呼びました。

これに対しAnthropic側は、モデル自体の品質低下を明確に否定しています。Claude Codeの責任者Boris Cherny氏は、2月に導入した適応型思考のデフォルト化と3月のエフォートレベルの中程度への変更が主因だと説明しました。思考表示の変更はUIレベルのもので、実際の推論能力には影響しないとしています。

ベンチマーク結果についても外部の研究者Paul Calcraft氏が反論し、比較された2回のテストはタスク数が6問と30問で異なり、共通タスクでの精度差はわずか2.2ポイントに過ぎないと指摘しました。BridgeBenchの投稿にはコミュニティノートも付されています。

一方で、Anthropicは3月下旬にピーク時間帯のセッション制限を厳格化し、プロンプトキャッシュのTTLも5分間に変更するなど、実際に複数の運用変更を行っていたことは認めています。これらの変更がユーザー体験に影響を与えたことは否定できず、モデル品質への信頼が揺らいでいる状況です。

競合のOpenAIがCodEx強化やChatGPT Pro新プランの投入で攻勢をかける中、Anthropicにとってパワーユーザーとの信頼関係の修復は喫緊の課題となっています。同社はエフォートレベルの手動切り替えやキャッシュ制御の環境変数公開などで対応を進めていますが、ユーザーの不満が収まるかは不透明です。

出典：VentureBeat

OpenAIモデルがCloudflare Agent Cloudで利用可能に

2026年04月13日 OpenAI Cloudflare Codex AI導入 GPT-5 エンジニア推論クラウド提携エージェント

提携の概要

GPT-5.4含む最新モデル提供

数百万企業が即座にアクセス可能

Agent Cloud上でエージェント構築

開発者向け機能

CodexハーネスがGA公開

Cloudflare Sandboxで安全に実行

Workers AIでエッジ推論を実現

顧客対応や報告書生成を自動化

詳細を見る

OpenAIのフロンティアモデルが、Cloudflareの新プラットフォーム「Agent Cloud」で利用可能になりました。GPT-5.4を含む最新モデルに数百万のCloudflare顧客が直接アクセスでき、企業向けAIエージェントの構築・展開が大幅に簡素化されます。

Agent Cloudは、Cloudflare Workers AI上で動作するプラットフォームです。企業はOpenAIモデルを活用して、顧客対応の自動化、システム更新、レポート生成などを行うエージェントを、セキュアな本番環境で展開できます。エッジコンピューティングにより、グローバル規模でのリアルタイム処理が可能です。

開発者向けツールとしては、OpenAIのCodexハーネスがCloudflare Sandboxesで一般提供を開始しました。Sandboxesはアプリケーションの構築・実行・テストを安全に行える仮想環境で、近日中にWorkers AIでも利用可能になる予定です。

CloudflareのCTOであるDane Knecht氏は、「OpenAIの強力なモデルをCloudflare環境に直接統合することで、知能とエンドユーザーの距離を縮める」と述べています。OpenAI側のRohan Varma氏も、クラウドエージェントが業務の基盤となりつつあると強調しました。

OpenAIはすでにAccenture、Walmart、Morgan Stanleyなど大手企業にサービスを提供しており、APIは毎分150億トークン以上を処理しています。Codexの週間アクティブユーザーは300万人に達しており、今回のCloudflare連携により企業向けAI導入がさらに加速すると見られます。

出典：OpenAI公式

OpenAI内部メモ流出、エンタープライズ戦略でAnthropicを名指し批判

2026年04月13日 Google OpenAI Anthropic マイクロソフト Amazon ChatGPT AWS Codex AI導入コーディング提携 IPO エージェント

プラットフォーム統合戦略

単一製品でなく統合基盤を志向

マルチ製品導入で乗り換え障壁構築

Amazon経由の配信チャネル拡大

ChatGPT・Codex・API・Frontierを一体提供

対Anthropic競争認識

コーディング特化はプラットフォーム戦で不利

計算資源不足が製品品質に影響と指摘

公表売上に約80億ドルの過大計上あり

安全性重視の姿勢を「エリート支配」と批判

詳細を見る

OpenAIの最高収益責任者デニス・ドレッサー氏が社内向けに送った4ページのメモがThe Vergeによって報じられました。メモはQ2の戦略方針を示すもので、「市場はかつてないほど競争が激しい」との認識のもと、エンタープライズAI市場での主導権確保に向けた5つの優先事項を掲げています。

戦略の柱は、OpenAIを単なるモデル提供者からエンタープライズ向け統合プラットフォーム企業へ転換することです。ChatGPT for Work、Codex、API、エージェント基盤Frontier、そしてAmazonとの提携による実行環境を一体化し、複数製品の導入によって顧客の乗り換えコストを高める構想を示しています。

特に注目されるのはAnthropicへの直接的な批判です。ドレッサー氏はAnthropicについて「恐怖と制限に基づくストーリー」と評し、コーディング特化の戦略はプラットフォーム戦争において脆弱だと指摘しました。さらに、Anthropicの公表ランレートにはAmazon・Googleとのレベニューシェアのグロスアップが含まれ、約80億ドル過大だと主張しています。

メモではAmazonとの提携を新たな成長軸と位置づけ、AWS上でステートフルな実行環境を提供することで規制産業の顧客獲得を目指す方針も明らかにされました。Microsoftとの関係については「基盤的」としながらも、「顧客がいる場所に届ける能力を制限してきた」と率直に認めています。

両社ともに今年中のIPOが報じられるなか、このメモはエンタープライズAI市場の覇権争いが新たな段階に入ったことを示しています。企業のAI導入が「技術が動くか」から「いかに展開し成果を出すか」へ移行するなか、プラットフォーム戦略の優劣が今後の競争を左右することになりそうです。

出典：The Verge

米政府が銀行にMythos試験を推奨

2026年04月12日 OpenAI Anthropic ChatGPT Claude Claude Code Codex チャットボットリスク脆弱性イギリストランプ

Mythos金融活用の動き

米財務長官とFRB議長が銀行に推奨

JPモルガンなど大手5行が試験中

脆弱性検出での高い性能が評価

英金融当局もリスクを検討

Claude人気の高まり

HumanX会議で最も言及されたAI

企業利用でAnthropicが追い上げ

OpenAIは焦点の分散が課題に

月100ドル新プランで対抗

詳細を見る

米財務省のベッセント長官と連邦準備制度理事会のパウエル議長が今週、大手銀行の幹部を招集し、Anthropicの新モデル「Mythos」を脆弱性検出に活用するよう推奨したことがBloombergの報道で明らかになりました。JPモルガン・チェースに加え、ゴールドマン・サックス、シティグループ、バンク・オブ・アメリカ、モルガン・スタンレーの大手5行がすでにMythosの試験を行っています。

この動きは、Anthropicが現在国防総省のサプライチェーンリスク指定をめぐりトランプ政権と法廷で争っている最中だけに注目を集めています。政府内でもAnthropicへの評価が一枚岩ではないことが浮き彫りになりました。また、英国の金融規制当局もMythosがもたらすリスクについて議論を始めています。

一方、サンフランシスコで開催されたHumanXカンファレンスでは、Claudeが最も話題に上ったチャットボットとして存在感を示しました。出展企業からは「ChatGPTやOpenAIは勢いを失った」という声が繰り返し聞かれ、業界の評価が変化していることがうかがえます。

Financial Timesのデータによれば、企業ユーザーの間でAnthropicがOpenAIに迫りつつあるとされています。Wall Street Journalは両社をテック史上最速で成長する企業と評しました。OpenAIは焦点の分散や経営陣への批判的報道に悩まされる一方、Codex強化のため月額100ドルのChatGPT Proプランを発表し、Claude Codeのユーザー獲得を狙う姿勢を見せています。

出典：TechCrunch | TechCrunch

LangChain「メモリはハーネスの中核」オープン基盤を提唱

2026年04月11日 OpenAI Anthropic LangChain Codex エコシステムエンジニア創業者リスクエージェントコンテキスト

ハーネスとメモリの関係

エージェント基盤がメモリ管理を担う構造

コンテキスト制御がメモリの基盤

メモリはプラグインではなくハーネスの中核機能

クローズド基盤のリスク

ベンダーロックインによるモデル切替困難

長期メモリがAPI背後に囲い込まれる危険性

プロプライエタリなデータ資産の喪失リスク

オープン基盤の提案

Deep Agentsをオープンソースで提供

モデル非依存でメモリの所有権を確保

詳細を見る

LangChainの共同創業者Harrison Chase氏は2026年4月11日、ブログ記事「Your harness, your memory」を公開し、エージェントハーネス(エージェント実行基盤)とメモリが本質的に不可分であると主張しました。クローズドなハーネスを使うことは、メモリの制御権を第三者に委ねることであり、開発者にとって深刻なリスクになると警鐘を鳴らしています。

Chase氏はLetta CTOのSarah Wooders氏の論考を引用し、メモリはハーネスに後付けする「プラグイン」ではなく、コンテキスト管理そのものがメモリの基盤だと述べています。会話履歴の保持、コンパクション時の情報取捨選択、長期記憶の更新と参照など、すべてハーネスが担う責務だという考えです。

記事ではクローズド基盤のリスクを3段階で整理しています。最も軽度なケースは、OpenAIやAnthropicのステートフルAPIにセッション状態を保存すること。モデル切替時にスレッドの継続ができなくなります。最悪のケースでは、長期メモリを含むハーネス全体がAPI背後に隠され、開発者がメモリの所有権も可視性も失うとしています。

Chase氏は、モデルプロバイダーがメモリによるロックインを意図的に推進していると指摘します。AnthropicのManaged AgentsやOpenAIのCodexが生成する暗号化コンパクション要約など、エコシステム外で利用できない仕組みが具体例として挙げられています。

この問題への解決策として、LangChainはオープンソースのエージェントハーネスDeep Agentsを提案しています。モデル非依存で、agents.mdやskillsといったオープン標準を採用し、MongoDB・PostgreSQL・Redisなど任意のデータベースをメモリストアとして接続できます。開発者が自らのメモリを所有し、ベンダーに依存しないエージェント開発を可能にする設計です。

出典：blog.langchain.com

OpenAIとAnthropic、IPO控え収益化正念場

2026年04月09日 OpenAI Anthropic Claude Sora Claude Code Codex OpenClaw AI活用動画生成経営者リスク半導体データセンター動画投資バブル IPO エージェント

収益化の崖

史上最大級のIPOが目前

燃焼額上回る黒字化圧力

巨額投資の回収期限接近

エージェント急拡大

Codex等が計算資源を浪費

想定超えのトークン消費

苦渋の選択

OpenAIがSora終了

Claudeの従量課金強制

10年末に数千億ドル計画

詳細を見る

AI業界の2026年は、OpenAIとAnthropicにとって正念場の年となっています。米メディアThe Vergeのポッドキャスト「Decoder」で4月9日、司会のニレイ・パテル氏と同社シニアAI記者のヘイデン・フィールド氏が、両社が直面する「収益化の崖」と史上最大級のIPOに向けた圧力を議論しました。燃やす現金を上回る売上を生み出せるかが、業界全体の行方を左右する局面です。

議論の前提にあるのは、数千億ドル規模の資本投下と、それを上回るデータセンターや半導体への将来投資です。番組では、いずれ利益が実現するか、さもなくばバブルが弾けるという構図が改めて確認されました。パテル氏は過去の出演CEOの多くが「一部の企業は派手に失敗し、一部は成功する」と見ていると指摘し、市場全体が走り続けざるを得ない現状を強調しました。

変化の触媒となっているのが、AIエージェントの急速な普及です。Claude CodeやCowork、オープンソースのOpenClaw、OpenAIのCodexといった製品は、顧客価値が高い一方で桁違いの計算資源を消費します。両社の想定を上回るペースでトークンが燃え、事業運営の前提そのものが揺らいでいるとフィールド氏は説明しました。

その影響は、製品の生殺与奪にも表れています。OpenAIは先月、動画生成アプリSoraを終了し、10億ドル規模のディズニーとのライセンス契約も断念しました。理由は運用コストの重さと、Codex向けに計算資源を確保する必要性です。一方、Anthropicも先週、標準サブスクリプションでのOpenClaw利用を禁じ、利用者を従量課金プランへ誘導しました。

両社は史上最大級のIPOに向け突き進んでおり、収益化への圧力はかつてないほど高まっています。今週ウォール・ストリート・ジャーナルに漏れた内部計画によれば、両社は2020年代末までに数千億ドルの売上と黒字化を見込みます。OpenAIはすでに8500億ドル評価で1220億ドルを追加調達しており、期待と現実のギャップが鮮明になってきました。

問われているのは、こうした成長計画を本当に実現できるのか、そして達成のためにどのような妥協を強いられるのかという点です。ユーザー体験の制限や人気製品の打ち切りは、顧客離れのリスクも孕みます。経営者やリーダーにとっては、AI各社の料金改定や機能縮小が自社のAI活用計画に直結する可能性があるだけに、今後の動向を注視する必要があります。

出典：The Verge

OpenAI、月100ドルChatGPT Pro新設

2026年04月09日 OpenAI Anthropic ChatGPT Claude Claude Code Codex ワークフロー広告エンジニアコーディング

新料金プランの狙い

月100ドルの中間層新設

コーディング需要に対応

既存200ドルは継続提供

Codex強化と競争

Plus比Codex5倍の上限

Anthropicに対抗投入

5月末まで拡張枠を提供

利用者急増の背景

週300万人がCodex利用

3カ月で5倍成長

詳細を見る

OpenAIは4月9日、ChatGPTに月額100ドルの新Proプランを追加したと発表しました。これまで広告付き無料、月8ドルのGo、月20ドルのPlus、月200ドルのProという階層でしたが、中間に新たな価格帯を設けた形です。同社は料金ページから200ドル版を一旦非表示にしたものの、最上位プランは引き続き利用可能だとTechCrunchに説明しました。

新プランの主眼は、コーディング支援ツールCodexの利用枠拡大にあります。月20ドルのPlusと比較すると、100ドル版ではCodexの利用上限が5倍に引き上げられ、日常的に生成AIでコードを書く開発者を主な対象としています。両Proプランの機能自体は共通で、差分はあくまでレート制限だとOpenAIは説明しています。

この価格設定は、競合Anthropicが長く提供してきたClaude向け月100ドルプランへの対抗策と位置付けられています。OpenAI広報は「高負荷のコーディング作業で1ドルあたりの処理能力がClaude Codeより優れる」と強調し、開発者の財布を巡る競争が新局面に入ったことを示しました。

導入期には追加インセンティブも用意されています。OpenAIは5月31日までの期間限定で100ドル版のCodex利用上限をさらに引き上げており、早期に試すユーザーほど恩恵を受けやすくなります。ただし、どのプランも無制限ではなく、最上位の200ドル版がPlus比20倍という位置付けは維持されます。

背景にはCodex需要の急拡大があります。OpenAIによれば、現在週300万人以上がCodexを利用しており、直近3カ月で利用者は5倍、月間利用量は70%超のペースで伸びているといいます。生成AIによる開発ワークフローの普及が、今回の料金体系見直しを後押しした形です。

出典：TechCrunch

サイバーエージェント、ChatGPT Enterprise利用率93%到達

2026年04月09日 OpenAI Slack ChatGPT Codex 広告エンジニアセキュリティコーディングコードレビューエージェントプロンプト

全社への定着

月間利用率93%到達

Enterprise版を基盤化

機密情報の取扱指針整備

Slackボットで利用促進

Codexの活用

設計段階での品質向上

コードレビュー提案生成

非エンジニアにも利用拡大

詳細を見る

サイバーエージェントは、OpenAIのChatGPT EnterpriseとCodexを全社基盤として活用し、広告・メディア・ゲーム事業で開発スピードと意思決定品質を高めていると明らかにしました。同社では月間利用率が93%に達し、ほぼ全部署で日常業務に組み込まれています。ツール導入を強制しない文化の中で、自発的な選択による定着が進んだ点が特徴です。

背景には、2022年のChatGPT登場以降に社内利用が急拡大したことがあります。当初は機密情報の取扱いに対する不安が広がり、部署ごとに利用度もばらついていたといいます。そこで同社は、管理機能とセキュリティを備えたChatGPT Enterpriseを採用し、社内ガイドラインも整備しました。これにより、社員が安心してAIを業務へ取り込める環境が整ったのです。

定着を支えたのは、組織的な文化作りとOpenAIによる継続的な研修でした。プロンプトや活用事例の共有、利用状況を可視化する社内ランキング、Slackボットによるフォローアップなど、利用を促す仕組みを積み重ねてきました。OpenAIが開催する入門講座やCodexハンズオン、社内ハッカソンには各回100名超が参加し、役割や習熟度に応じた学習機会を設計しています。

Codexの活用はエンジニアリング領域で急速に広がっています。設計案を多角的に評価する用途や、コードレビュー時の改善提案、AGENTS.mdのようなナレッジドキュメント整備が代表例です。同社データ技術部の高尾謙氏は、早期の意思決定品質が上がることで後工程の手戻りが減ると指摘します。実装前の合意形成が速まり、判断の根拠も明確になるといいます。

さらにCodexの利用は開発職以外にも波及しています。仕様書作成やモックアップ制作、プロダクト周辺業務でも活用されているほか、社内利用ランキングの構築自体にもCodexが使われました。AIビジネス本部の吉原颯氏は、他のコーディングモデルと比べて提案品質が高いと評価しています。ゲーム事業のGOODROIDでも、Codexを用いた新作「WormEscape」が約1カ月でソフトローンチに到達しました。

同社はAIを一時的なブームではなく、ネット業界の次の標準になる転換点と位置づけています。2016年設立のAI Labを技術的エンジンとしつつ、2023年に発足したAIオペレーション室が業務変革の推進役を担います。導入から業務設計の再構築へと段階を進め、AIを日常業務に埋め込む取り組みが今後も加速する見込みです。

出典：OpenAI公式

OpenAI、企業向けAI戦略の全体像を公表

2026年04月08日 OpenAI オラクル Gemini ChatGPT AWS Codex 生産性インフラエージェント Databricks Snowflake

エンタープライズ事業の急成長

企業向け売上が全体の40%超に

2026年末に消費者向けと同等見込み

Codex週間利用者が300万人突破

統合AI基盤の構築

Frontierで全社横断エージェント管理

AWSと共同で状態保持型実行環境開発

McKinseyら大手と導入支援体制構築

AI職場への浸透

統合スーパーアプリ構想を推進

ChatGPT週間9億ユーザーが導入基盤

詳細を見る

OpenAIのエンタープライズ担当幹部が就任90日を振り気に、企業向けAI戦略の全体像を明らかにしました。同社の企業向け事業は売上全体の40%超を占めるまでに成長し、2026年末までに消費者向け事業と同等規模に達する見通しです。Codexは週間アクティブユーザー300万人を突破し、APIは毎分150億トークン以上を処理しています。

戦略の柱の一つが、全社横断型のAI基盤「OpenAI Frontier」です。個別のAIツールが乱立する課題に対し、企業の社内システムやデータソースと連携しながらエージェントを統合管理する仕組みを提供します。OracleやUber、State Farmなどが既に導入を進めています。

もう一つの柱が、従業員の日常業務にAIを組み込む「統合AIスーパーアプリ」構想です。ChatGPT、Codex、エージェント型ブラウジングなどの機能を一つのインターフェースに集約し、個人やチームの生産性を大幅に引き上げることを目指しています。ChatGPTの週間ユーザー9億人という基盤が、企業展開時の学習コスト低減に寄与するとしています。

導入支援の面では、McKinsey、BCG、Accenture、Capgeminiと「Frontier Alliances」を結成。さらにAWS、Databricks、Snowflakeとも連携し、既存のインフラやデータ基盤へのAI統合を支援します。AWSとは共同で、エージェントが文脈を保持しながらツール横断で稼働する状態保持型実行環境を開発中です。

同幹部は「AIの実用能力と企業の活用度には大きな乖離がある」と指摘し、この「能力オーバーハング」の解消こそが自社の使命だと強調しました。実験段階から本格展開へと移行する企業に対し、信頼できるパートナーとして伴走する姿勢を鮮明にしています。

出典：OpenAI公式

AIエージェント自己進化フレームワークが相次ぎ登場

2026年04月08日 Claude Claude Code Codex ワークフロー強化学習ファインチューニングエージェントベンチマーク

経験から学ぶ仕組み

実行履歴を再利用可能な知見に変換

モデル再訓練なしで能力向上

外部メモリとして知識を蓄積

ベンチマークでの成果

困難なタスクで最大14.2%改善

GAIA精度13.7ポイント向上

スキル自動生成・修正を実現

企業導入への課題

構造化ワークフローが適用条件

安全性と評価基盤が不可欠

詳細を見る

AIエージェントが過去の経験から自律的に学習し、モデルの再訓練なしに能力を向上させるフレームワークが相次いで発表されました。IBM Research等が開発したALTK-Evolveと、複数大学の研究者によるMemento-Skillsは、いずれもエージェントの「永遠のインターン問題」に取り組んでいます。

ALTK-Evolveは、エージェントの実行履歴から再利用可能なガイドラインを抽出し、品質スコアリングで精査したうえで必要な場面でのみ注入する仕組みです。AppWorldベンチマークでは、困難なタスクで14.2ポイントの改善を達成しました。Claude CodeやCodexへのプラグイン統合にも対応しています。

一方のMemento-Skillsは、スキルをマークダウン形式で保存し、実行結果に基づいて自動的に書き換える「読み書き反省学習」を採用しています。GAIAベンチマークで13.7ポイント、HLEベンチマークでは17.9%から38.7%へと倍増する成果を示しました。意味的類似度ではなく強化学習ベースのスキル選択により、タスク成功率を80%に引き上げています。

両フレームワークに共通するのは、大規模言語モデルのパラメータを固定したまま、外部メモリを通じて継続的に学習する設計思想です。従来の手動スキル設計やファインチューニングに伴う運用負担を大幅に軽減できる可能性があります。

ただし、企業導入には構造化されたワークフローが前提条件となります。Memento-Skillsの共同著者Jun Wang氏は、タスク間の構造的類似性が高い環境でこそ効果を発揮すると指摘しています。物理エージェントや長期的タスクへの適用には、マルチエージェント協調など更なる研究が必要です。安全性の面では自動テストゲートなどの基本的な仕組みはあるものの、企業規模での運用にはより包括的なガバナンス体制が求められます。

出典：Hugging Face | VentureBeat

OpenAI幹部が大幅異動、AGI責任者Simoは病気療養へ

2026年04月03日 OpenAI Slack ChatGPT Sora Codex エンジニア創業者 AGI サム・アルトマン人事投資 IPO

主要3幹部の異動

AGI責任者Fidji Simoが数週間の病気休職

COO Brad Lightcapが特別プロジェクト担当へ

CMO Kate Rouchがん治療のため退任

不在中はGreg Brockmanがプロダクト統括

後任体制と背景

元Slack CEO Denise DresserがCOO業務を代行

広報責任者も1月に退任済み、後任未定

IPOを視野に入れる中での組織再編

Sora終了など事業整理の最中での人事刷新

詳細を見る

OpenAIは2026年4月3日、AGI展開部門のCEOであるFidji Simo氏が神経免疫疾患の治療のため数週間の病気休職に入ると発表しました。同時にCOOのBrad Lightcap氏とCMOのKate Rouch氏の異動も明らかになりました。

Simo氏は2025年8月にOpenAIに入社して以来、ChatGPTやCodexなど主要プロダクトを統括してきました。入社前から神経免疫疾患の再発があったものの、業務を優先して治療を先送りしていたと社内メモで説明しています。

休職中のプロダクト統括は共同創業者で社長のGreg Brockman氏が担当します。ビジネス面はCSO Jason Kwon氏、CFO Sarah Friar氏、CRO Denise Dresser氏が分担して対応します。

COOだったBrad Lightcap氏はCEO Sam Altman氏直属の「特別プロジェクト」担当に異動します。複雑な取引や投資案件、企業向けエンジニア派遣などを統括する役割です。元Slack CEOのDresser氏がCOO業務の大半を引き継ぎます。

CMOのKate Rouch氏は乳がん治療に専念するため退任し、回復後はより限定的な役職で復帰する予定です。新CMOの採用活動が開始されます。広報責任者Hannah Wong氏も1月に退任しており、幹部の空席が目立つ状況です。

今回の人事刷新は、Pentagon契約への批判やSoraアプリの終了など広報上の逆風が続く中で行われました。OpenAIは約10億人のユーザー基盤を持ち、今年中のIPOも視野に入れる中、企業価値8520億ドルの評価を受けています。

出典：TechCrunch | The Verge | WIRED

OpenAI、Codexを従量課金制で提供開始

2026年04月02日 OpenAI Notion ChatGPT Codex Windows MacOS ワークフローエンジニアリスクコーディング

料金体系の刷新

従量課金のCodex専用席を新設

トークン消費ベースで課金

レートリミットなしで利用可能

ChatGPT Business年額を25→20ドルに値下げ

導入支援と実績

新規メンバーに最大500ドルのクレジット付与

週間アクティブ開発者が200万人突破

企業向けCodex利用者が1月比6倍に成長

Notion・Rampなど大手が採用済み

詳細を見る

OpenAIは2026年4月2日、AIコーディングツール「Codex」をChatGPT BusinessおよびEnterprise向けに従量課金制で提供開始すると発表しました。固定のシート料金なしで利用でき、チーム単位での試験導入が容易になります。

新たに導入されたCodex専用シートは、レートリミットが撤廃され、トークン消費量に基づいて課金される仕組みです。これにより、予算やワークフローごとのコスト可視化が格段に向上し、企業の支出管理が容易になります。

従来のChatGPT Businessシートも引き続き利用可能ですが、年間料金が1シートあたり25ドルから20ドルに引き下げられました。また、macOSとWindows向けのCodexアプリやプラグイン、自動化機能が新たに追加されています。

導入促進策として、対象のChatGPT Businessワークスペースには、新規Codex専用メンバー1人あたり100ドル、チームあたり最大500ドルのクレジットが期間限定で付与されます。小規模チームでも低リスクで導入を開始できます。

現在、ChatGPTの有料ビジネスユーザーは900万人を超え、Codexの週間利用者は200万人以上に達しています。NotionやRamp、Braintrustなどの企業がすでにCodexを活用しており、エンジニアリングワークフローの高速化と再現性の向上を実現しています。

出典：OpenAI公式

Cursorが新エージェント型開発環境を発表、Claude CodeやCodexに対抗

2026年04月02日 OpenAI Anthropic Claude Claude Code Codex ワークフローエンジニアクラウドコーディング中国資金調達評価額エージェントオープンソースモデル Cursor

Cursor 3の全容

エージェント型コーディングUI刷新

自然言語でタスク指示が可能

複数エージェントの同時実行に対応

クラウド生成コードをローカルで確認

AI大手との競争激化

Claude Code・Codexに開発者流出

月200ドルで1000ドル超の利用価値提供

Cursor は従量課金へ転換済み

独自モデルComposer 2を投入

詳細を見る

Cursorは2026年4月、AIコーディングエージェントを中心とした新製品「Cursor 3」を発表しました。コード名Glassで開発された本製品は、AnthropicのClaude CodeやOpenAIのCodexに対抗するエージェント型開発体験を提供します。

Cursor 3は既存のデスクトップアプリ内に新しいインターフェースとして統合されます。中央のテキストボックスに自然言語でタスクを入力すると、AIエージェントがコードを自動生成します。サイドバーで複数のエージェントを同時に管理できる設計です。

競合製品との最大の差別化は、IDEとエージェント型製品の統合にあります。クラウド上でエージェントが生成したコードをローカル環境で即座に確認・編集できるため、開発者は従来のワークフローを維持しつつエージェントを活用できます。

一方で経営面の課題は深刻です。複数の開発者がClaude CodeやCodexへ移行したと証言しており、主な理由は月額200ドルの定額プランで1000ドル超相当の利用が可能な補助金付き価格設定です。Cursorは2025年6月に従量課金へ移行し、一部の開発者の不満を招きました。

Cursorは対抗策として独自AIモデル「Composer 2」の提供を開始しました。中国のMoonshot AIのオープンソースモデルをベースに追加学習を施したもので、性能・価格・速度の面で競争力があると主張しています。現在約500億ドルの評価額で資金調達を進めており、AI大手との消耗戦に備えています。

出典：WIRED

OpenAI、1220億ドル調達　評価額8520億ドルでIPOへ布石

史上最大の資金調達

評価額8520億ドルで完了

SoftBank・a16zら共同主導

個人投資家から30億ドル調達

急成長する事業規模

月間売上20億ドルに到達

週間ユーザー9億人超え

法人比率が売上の40%に拡大

インフラと今後の戦略

AIスーパーアプリ構想を発表

複数チップ基盤に分散投資

詳細を見る

OpenAIは2026年3月、1220億ドル（約18兆円）の資金調達を完了したと発表しました。評価額は8520億ドルに達し、同社史上最大の調達ラウンドとなります。年内に予定されるIPOに向けた布石とみられています。

ラウンドはSoftBankとAndreessen Horowitzが共同主導し、D.E. Shaw Ventures、MGX、TPGなどが参加しました。Amazon、NVIDIA、Microsoftも戦略的パートナーとして出資しています。初めて銀行チャネルを通じた個人投資家にも門戸を開き、30億ドル以上を集めました。

事業面では月間売上が20億ドルに達し、AlphabetやMetaの同時期と比べ4倍の成長速度だと同社は主張しています。ChatGPTの週間アクティブユーザーは9億人を超え、有料会員は5000万人以上です。検索利用は1年で約3倍に伸びています。

法人向け事業は売上全体の40%を占めるまでに成長し、2026年末までにコンシューマーと同等になる見通しです。最新モデルGPT-5.4がエージェント型ワークフローの需要を牽引し、APIは毎分150億トークン以上を処理しています。広告事業も開始からわずか6週間でARR1億ドルを突破しました。

同社はAIスーパーアプリ構想を掲げ、ChatGPT、Codex、ブラウジング機能などを単一のエージェント体験に統合する方針です。インフラ面ではNVIDIA、AMD、AWS Trainiumなど複数のチップ基盤に拡大し、回転信用枠も約47億ドルに増額しました。調達資金はAIチップやデータセンターの拡充に充てられます。

出典：TechCrunch | OpenAI公式

OllamaがApple MLX対応、Macでのローカル推論を大幅高速化

2026年03月31日 NVIDIA Apple GitHub ChatGPT Claude Claude Code Codex Qwen OpenClaw Llama エンジニア推論機械学習クラウドクラウドサービス中国 Ollama

MLX対応の概要

Apple MLXフレームワーク対応開始

Ollama 0.19プレビューで提供

Qwen3.5-35Bモデルのみ対応

Apple Silicon搭載Mac・RAM32GB以上が必要

性能改善と圧縮技術

キャッシュ性能の向上を実現

Nvidia NVFP4圧縮形式に対応

メモリ使用効率の大幅改善

ローカルLLM需要の高まり

OpenClawがGitHubで30万スター突破

クラウドAPIの料金・制限への不満が背景

詳細を見る

ローカルLLM実行ツールOllamaは、Appleが開発したオープンソースの機械学習フレームワークMLXへの対応を発表しました。これにより、Apple Silicon搭載Macでの大規模言語モデルの推論性能が大幅に向上します。

今回の対応はOllama 0.19のプレビュー版として提供されており、現時点で対応モデルはAlibabaのQwen3.5-35Bパラメータ版のみです。利用にはApple Silicon搭載Macに加え、最低32GBのRAMが必要とされています。

MLX対応に加え、キャッシュ性能の改善やNvidiaのNVFP4モデル圧縮形式への対応も同時に発表されました。NVFP4はモデルのメモリ使用量を大幅に削減する技術で、より効率的な推論環境の構築が可能になります。

ローカルモデル実行への関心は急速に高まっています。OpenClawがGitHubで30万スター以上を獲得し、中国を中心に世界的な注目を集めています。研究者やホビイスト以外の層にもローカルLLMの活用が広がりつつあります。

背景には、Claude CodeやChatGPT Codexなどのクラウドサービスにおけるレート制限や高額なサブスクリプション費用への開発者の不満があります。OllamaはVisual Studio Codeとの統合も拡充しており、ローカル開発環境の充実を進めています。

出典：Ars Technica

Midjourney技術者がWeb設計を革新するOSSライブラリPretext公開

2026年03月30日 OpenAI Anthropic GitHub Claude Codex エンジニアコーディングバイブコーディング MIT ベンチマーク Canva Pixel Midjourney

Pretextの技術革新

DOM迂回でテキスト計測を高速化

15KBのゼロ依存TypeScriptライブラリ

300〜600倍の描画性能向上を実現

モバイルでも120fps動作可能

開発手法と反響

ClaudeやCodexでAIバイブコーディング

48時間でGitHub星1.4万獲得

X上で1900万回閲覧を記録

企業への示唆

生成AIのUI構築に即時導入推奨

アクセシビリティ管理は自社責任に

詳細を見る

MidjourneyのエンジニアCheng Lou氏が2026年3月27日、Webテキストレイアウトを根本から変えるオSSライブラリPretextをMITライセンスで公開しました。15KBのゼロ依存TypeScriptライブラリで、ブラウザのDOM操作を迂回し、テキストの計測と配置を高速に行います。

従来のWeb開発では、テキストの高さや位置を取得するたびにブラウザがレイアウトリフローと呼ばれる再計算を実行し、深刻なパフォーマンス低下を招いていました。PretextはブラウザのCanvasフォントメトリクスと純粋な算術演算を組み合わせ、DOMに一切触れずに文字・単語・行の配置を予測します。

ベンチマークによると、Pretextのlayout関数は500種類のテキストを約0.09ミリ秒で処理でき、従来のDOM読み取りと比較して300〜600倍の性能向上を達成しています。この速度により、ウィンドウリサイズや物理演算中でもリアルタイムにテキスト再配置が可能になりました。

開発にはAnthropicのClaudeやOpenAIのCodexなどAIコーディングツールが活用されました。多言語データセットや小説全文を用いてブラウザ実装とのピクセル単位の整合性を反復検証し、WebAssemblyやフォント解析ライブラリなしで高精度を実現しています。

公開から48時間でGitHubスター1万4000超、X上で1900万回閲覧を記録しました。コミュニティでは雑誌レイアウト、物理演算テキスト、ディスレクシア向けフォント調整など多彩なデモが登場し、Web表現の可能性が大きく広がっています。

企業にとっては、生成AI UIや高頻度データダッシュボードを構築する場合に即時導入が推奨されます。ただしレイアウトをユーザーランドに移すことで、ブラウザが担っていたアクセシビリティや標準準拠の責任を自社で管理する必要がある点には留意が必要です。

出典：VentureBeat

OpenAI、Codexにプラグイン機能を追加しコーディング以外に拡張

プラグインの概要

スキル・連携・MCPの統合パッケージ

GitHub・Gmail・Vercel等とワンクリック連携

組織横断で設定を再現可能に

競合との関係

AnthropicのClaude Codeに対抗

GoogleのGemini CLIも同等機能提供済み

既存機能のパッケージ化が本質

検索可能なプラグインライブラリを新設

詳細を見る

OpenAIは、エージェント型コーディングアプリCodexにプラグイン機能を追加しました。これにより、Codexはコーディング領域を超えた幅広いタスクに対応できるようになります。競合するAnthropicやGoogleの類似機能に対抗する動きです。

プラグインは、スキル（ワークフローを記述するプロンプト）、アプリ連携、MCP（Model Context Protocol）サーバーを一つにまとめたバンドルです。特定のタスクに合わせてCodexを構成し、組織内の複数ユーザー間で再現可能にする仕組みとなっています。

技術的には、これまでもカスタム指示やMCPサーバーを個別に設定すれば同等の機能を実現できました。しかし今回のプラグインでは、それらをワンクリックでインストールできるようパッケージ化した点が最大の特徴です。

Codexアプリ内には新たにプラグインセクションが設けられ、検索可能なライブラリからプラグインを選択できます。GitHub、Gmail、Box、Cloudflare、Vercelなど主要サービスとの緊密な統合が用意されています。

この動きは、AIコーディングツール市場におけるプラットフォーム競争の激化を示しています。各社がエコシステムの拡充を通じて開発者の囲い込みを図る中、OpenAIもCodexの汎用性を高めることで差別化を狙っています。

出典：Ars Technica

LangChain、エージェント間で業務知識を共有する「スキル」機能を公開

2026年03月25日 LangChain Claude Claude Code Codex 推論コーディングエージェント Cursor LangSmith

スキルの概要と特徴

業務知識をエージェントに付与

作成方法と拡張性

AIとの対話から自動生成可能

テンプレートや手動作成にも対応

CLIでコード開発環境に連携

バージョン管理と権限拡張を予定

詳細を見る

LangChainは2026年3月、AIエージェント開発基盤LangSmith Fleetにおいて、エージェント間で業務知識を共有できる「スキル」機能を正式に公開しました。スキルとは、特定タスクに必要な手順やドメイン知識をまとめた指示セットです。

現在のAIエージェントは推論能力に優れる一方、業務固有の知識がなければ実用性に限界があります。たとえばサポートエージェントがSLAの優先度を知らなければ、すべての問い合わせを同一に扱ってしまいます。スキルはこの課題を解決する仕組みです。

スキルの作成方法は多彩で、AIとのチャットから自動生成する方法、エージェント作成時の自動提案、テンプレートからの選択、手動記述の4通りが用意されています。作成したスキルはワークスペースに共有でき、チーム全員のエージェントが即座に利用可能になります。

特筆すべきはポータビリティの高さです。LangSmith CLIを使えば、Fleet上のスキルをローカル開発環境にダウンロードし、Claude CodeやCursor、Codexなど任意のコーディングエージェントにそのまま連携できます。知識の再記述やコピーは不要です。

今後の機能拡張として、スキルのバージョン固定とロールバック、および複数オーナーによる共同編集権限の追加が予定されています。エージェントが高度な業務を担うほど、指示の質が成果を左右するとLangChainは強調しています。

出典：blog.langchain.com

ディズニーがOpenAIへの10億ドル投資を撤回、Sora終了で

2026年03月25日 OpenAI ChatGPT Sora Codex 動画生成シミュレーションレイオフコンテンツ動画ブランドロボティクス投資提携 IPO ByteDance

提携白紙の経緯

OpenAIがSora終了を発表

ディズニーは事前通告なく寝耳に水

10億ドル投資計画を撤回

別形態の提携は引き続き協議中

Soraの急成長と急失速

11月に330万DLでピーク到達

2月には110万DLへ急落

累計収益はわずか214万ドル

OpenAIはIPO準備で事業集約へ

ディズニーの戦略的誤算

Epic Gamesとのメタバース構想も停滞

SeeDanceなど競合アプリが台頭

新CEO就任直後に二重の危機直面

詳細を見る

ディズニーは2026年3月、OpenAIへの10億ドル出資計画を撤回しました。OpenAIが動画生成アプリSoraの終了を発表したことが直接の原因で、ディズニー側は事前に知らされておらず、計画の白紙撤回に踏み切りました。ただし両社は別の形での提携や投資の可能性について協議を続けているとされています。

2025年12月に発表されたディズニーとOpenAIの提携は、ハリウッドに大きな衝撃を与えました。Disney+上でSoraによるAI生成コンテンツを配信する計画で、前CEOボブ・アイガー氏は短尺動画の目玉にする構想を語っていました。しかしSoraのダウンロード数は2025年11月の330万件をピークに急減し、累計収益もわずか214万ドルにとどまりました。

OpenAIはIPO準備の一環として事業の選択と集中を進めています。CFOのサラ・フライアー氏は「上場企業としての準備が必要」と述べ、Soraの研究チームはロボティクス向けの世界シミュレーション研究に再配置されます。ChatGPT・Codex・Atlasを統合した「スーパーアプリ」構想に経営資源を集中させる方針です。

ディズニーにとってSora 提携の頓挫は、テック投資戦略の見直しを迫る事態です。Epic Gamesとの15億ドル規模のメタバース構想も、Epic側の1000人規模のレイオフと5億ドルのコスト削減により先行きが不透明になっています。Fortniteのプレイヤー数減少も重なり、ディズニーブランドのメタバース実現は遠のいています。

出典：Ars Technica | The Verge | WIRED

Apple、WWDC26でAI進化を予告し6月開催発表

2026年03月23日 Google OpenAI Anthropic Apple Gemini Claude iOS Codex Siri MacOS デザインエンジニアコーディング中国エージェント YouTube

WWDC26の概要

6月8〜12日にオンライン開催

iOS・macOS等の全プラットフォーム更新

AI進化を主要テーマに明示

開発者向け新ツールも発表予定

Siri刷新への期待

Google Gemini連携契約を締結済み

新型Siriの高度なAI機能搭載

オンスクリーン認識と個人文脈理解強化

開発者向けAI基盤

Foundation Modelフレームワーク進化

XcodeにClaude・Codex統合済み

詳細を見る

Appleは2026年3月、年次開発者会議WWDC26を6月8日から12日までオンラインおよびクパチーノ本社で開催すると発表しました。今年のテーマとして「AI進化」を明確に掲げています。

昨年のWWDCではLiquid Glassデザインが中心でAIへの言及は限定的でしたが、今年は大きく方針を転換します。Appleは年初にGoogleと契約を結び、GeminiをAI機能の基盤として採用することを決定しています。

最大の注目点はSiriの全面刷新です。高度なAI機能を搭載した新型Siriは、個人的な文脈の理解や画面上の情報認識といった機能が強化される見込みです。度重なる延期を経て、ついにお披露目となる可能性があります。

開発者向けには、昨年発表されたFoundation Modelフレームワークの進化が期待されます。オフラインで動作するAIモデルの拡充に加え、XcodeにはすでにAnthropicのClaude AgentやOpenAIのCodexといったエージェント型コーディングツールが統合されています。

カンファレンスはApple Developerアプリ、公式サイト、YouTubeチャンネルでライブ配信されます。中国向けにはBilibiliチャンネルでも視聴可能で、グローバルな開発者コミュニティに向けた発信が強化されています。

出典：TechCrunch

OpenAI、デスクトップ統合「スーパーアプリ」を開発中

2026年03月20日 OpenAI Anthropic ChatGPT Claude Sora Claude Code Codex 動画生成 AIブラウザハードウェア動画コーディング投資買収

統合アプリの全容

ChatGPT・Codex・Atlasを一本化

製品の分散化が品質低下の要因

モバイル版ChatGPTは変更なし

競争環境と戦略転換

Anthropicとの競争が激化

Claude Codeの人気急上昇が背景

Codexへの集中投資を明言

「副次的探索」の縮小を指示

詳細を見る

OpenAIは、ChatGPTアプリ、AIコーディングツール「Codex」、AIブラウザ「Atlas」を統合したデスクトップ向け「スーパーアプリ」の開発を進めていることが、米ウォール・ストリート・ジャーナルの報道で明らかになりました。アプリケーション部門CEOのフィジ・シモ氏が社内メモで方針を示しています。

シモ氏はメモの中で、製品の分散化が「開発速度を低下させ、求める品質基準の達成を困難にしている」と指摘しました。同社は昨年、動画生成AI「Sora」の発表やジョニー・アイブ氏のAIハードウェア企業買収など派手な展開を見せていましたが、戦略の再集中が急務となっています。

背景にはAnthropicとの競争激化があります。特にClaude Codeの急速な普及がOpenAIにとって脅威となっており、経営陣は優先度の低い取り組みの見直しを進めています。シモ氏は従業員に対し「副次的な探索に気を取られないように」と呼びかけました。

シモ氏はX（旧Twitter）への投稿で「企業には探索のフェーズと再集中のフェーズがあり、どちらも重要だ」と述べた上で、「Codexのように新しい賭けが成果を出し始めた今こそ、集中投資すべき時だ」と強調しました。

なお、モバイル版のChatGPTについては今回の統合の対象外とされています。OpenAIの広報担当者はコメントを控えており、統合アプリの具体的なリリース時期は明らかになっていません。今後のデスクトップ体験の大幅な刷新が見込まれます。

出典：The Verge

GitHub、AI時代のOSSメンター選定に「3C」指針を提唱

2026年03月19日 OpenAI GitHub Gemini Codex ポリシー投資エージェント

メンター危機の背景

AI生成PRが急増し選別困難に

月間PR数が4500万件超で前年比23%増

tldrawらがPR受付を停止する事態

3Cフレームワーク

Comprehension：問題理解の確認

Context：AI利用開示でレビュー最適化

Continuity：継続参加者に投資集中

実践と効果

ガイドライン未遵守のPRは即クローズ

公平性向上と属人的判断の排除

詳細を見る

GitHubのAbigail Cabunoc Mayes氏は、AI時代におけるオープンソースのメンターシップのあり方を再考する指針「3Cフレームワーク」を提唱しました。AIツールの普及でコントリビューション量が急増し、メンテナーの負担が深刻化しています。

2025年のOctoverseレポートによると、GitHubでは月間約4500万件のプルリクエストがマージされ、前年比23%増を記録しました。一方でAI生成コードは一見高品質に見えるため、従来の貢献者評価シグナルが機能しなくなっています。

3Cの第一はComprehension（理解力）です。OpenAI CodexやGemini CLIはPR提出前にイシュー承認を必須化しました。コードスプリントなど対面での理解度確認も有効とされ、貢献者が自分の理解度を超えたコードをコミットしないよう求めています。

第二のContext（文脈提供）では、AI利用の開示が重要です。ROOSTやFedoraなど複数プロジェクトがAI開示ポリシーを導入済みです。さらにAGENTS.mdの活用により、AIエージェントにプロジェクト規範を遵守させる動きも広がっています。

第三のContinuity（継続性）は、メンターシップ投資の最終判断基準です。一度きりの貢献ではなく繰り返し参加する人材にのみ深い指導を行うことで、メンターの乗数効果を最大化できます。明確な基準は属人的バイアスも排除し、より公平なコミュニティ形成につながります。

出典：GitHub公式

OpenAIがPython開発ツール企業Astralを買収へ

2026年03月19日 OpenAI Anthropic Claude Claude Code Codex ワークフローエンジニア創業者セキュリティコーディング開発ツール買収

買収の狙いと背景

Codexチームに統合予定

uv・Ruff・tyの3ツールを獲得

AIコーディング支援市場の競争激化

Codex週間200万人超の利用者

OSSの継続と展望

買収後もオープンソース継続

Python開発ワークフロー全体を支援

AnthropicのBun買収に対抗

規制当局の承認が条件

詳細を見る

OpenAIは2026年3月、人気のオープンソースPython開発ツールを手がけるAstralの買収合意を発表しました。Astralはパッケージマネージャーuv、リンターRuff、型チェッカーtyを開発しており、買収後はCodexチームに統合される予定です。

Astralの主力ツールuvは月間1億2600万回以上ダウンロードされ、Ruffは1億7900万回に達するなど、Python開発者の間で広く普及しています。これらのツールは依存関係管理、コード品質チェック、型安全性の確保といった開発の基盤を担っています。

OpenAIは本買収について「Codexの開発を加速し、ソフトウェア開発ライフサイクル全体でAIができることを拡大する」と説明しています。Codexは年初から利用者が3倍、利用量が5倍に成長しており、週間アクティブユーザーは200万人を超えています。

この動きはAIコーディング支援市場での競争を反映しています。2025年11月にはAnthropicがJavaScriptランタイムBunを買収しClaude Codeに統合しており、OpenAIも今月初めにLLMセキュリティツールのPromptfooを買収するなど、開発者ツールの囲い込みが加速しています。

Astral創業者のCharlie Marsh氏は、買収後もオープンソースツールの開発を継続しコミュニティとともに構築していくと表明しました。OpenAIも同様にOSSプロジェクトの支援を続けながら、Codexとのシームレスな統合を模索する方針です。買収完了には規制当局の承認が必要とされています。

出典：Ars Technica | OpenAI公式

Google、ブラウザAIエージェント開発チームを再編

2026年03月19日 Google OpenAI Anthropic NVIDIA Perplexity Gemini ChatGPT Claude Claude Code Chrome Codex OpenClaw Comet アシスタントコーディング医療エージェント Computer Use

開発体制の転換

Project Marinerチーム再編

研究者が高優先度プロジェクトへ異動

Gemini Agentに技術統合

業界の潮流変化

OpenClaw旋風で戦略転換

ブラウザ型の利用者数低迷

コーディング型エージェントが台頭

CLI操作が10〜100倍効率的

今後の展望

GUI操作は80/20の補完的役割

汎用エージェントへの進化が焦点

詳細を見る

GoogleがChromeブラウザを操作するAIエージェント「Project Mariner」の開発チームを再編したことがWIREDの取材で明らかになりました。研究プロトタイプに携わっていたGoogle Labsのスタッフの一部が、より優先度の高いプロジェクトへ異動しています。

Googleの広報担当者はこの変更を認めたうえで、Project Marinerで培ったコンピュータ操作技術は同社のエージェント戦略に引き続き組み込まれると説明しています。すでに一部の機能は最近発表されたGemini Agentに統合されています。

背景にはOpenClawなど高性能コーディングエージェントの急速な台頭があります。NVIDIAのジェンスン・ファンCEOはOpenClawを「エージェント型コンピュータの新しいOS」と評し、「すべての企業がOpenClaw戦略を持つ必要がある」と述べました。

ブラウザエージェントの普及は期待を下回っています。Perplexityの「Comet」は週間アクティブユーザー280万人にとどまり、OpenAIのChatGPT Agentも100万人未満に減少しました。スクリーンショットベースの処理は計算コストが高く、テキストベースのCLI操作と比べ10〜100倍のステップが必要とされています。

一方で、コンピュータ操作エージェントが不要になるわけではないとの見方もあります。Simular CEOのアン・リー氏は「ターミナルで多くの問題を解決できるが、GUIでしか対応できない場面は常に存在する」と指摘しています。医療保険サイトやレガシーソフトウェアなど、APIが存在しない領域では引き続き重要な役割を果たすと述べました。

AI各社はコーディングエージェントを汎用アシスタントの基盤として位置づけ始めています。OpenAIはCodexをChatGPT内の汎用エージェントにする構想を示し、AnthropicはターミナルなしでClaude Codeを使える「Claude Cowork」をすでに提供しています。

出典：WIRED

Xiaomi、1兆パラメータLLM「MiMo-V2-Pro」を低価格で公開

2026年03月18日 OpenAI Anthropic DeepSeek Codex GPT-5 推論リスクプロンプトインジェクションインフラセキュリティ中国エージェントプロンプトコンテキスト

モデル性能と技術

1兆パラメータ中42Bのみ稼働

100万トークンの長大コンテキスト対応

幻覚率30%に大幅低減

エージェント評価で中国勢トップ

価格と市場影響

入力1ドル/100万トークンの低価格

GPT-5.2の約7分の1のコスト

オープンソース版も計画中

コード・端末操作に高い信頼性

詳細を見る

Xiaomiは2026年3月18日、1兆パラメータの大規模言語モデル「MiMo-V2-Pro」を発表しました。開発を率いたのはDeepSeek R1出身のFuli Luo氏で、OpenAIやAnthropicの最上位モデルに迫る性能を、約6〜7分の1の価格で提供します。

MiMo-V2-Proは1兆パラメータを擁しながら、1回の推論で稼働するのは42Bのみというスパース構造を採用しています。7対1のハイブリッドアテンション機構により、100万トークンの長大コンテキストでも性能劣化を抑え、効率的な推論を実現しています。

第三者機関Artificial Analysisの検証では、グローバル知能指数で10位・スコア49を獲得し、GPT-5.2 Codexと同等の評価を受けました。エージェント評価GDPval-AAではElo 1426を記録し、中国発モデルとして最高位に位置しています。

価格設定は入力1ドル・出力3ドル（100万トークンあたり、256K以下）と極めて競争力があります。GPT-5.2の全評価コスト2,304ドルに対し、MiMo-V2-Proはわずか348ドルで同等の処理が可能です。

企業導入においては、コスト対性能比の高さからインフラ部門に魅力的な選択肢となります。一方、エージェント機能の強力さゆえにプロンプトインジェクションのリスクも増大するため、セキュリティ部門は監査体制の整備が不可欠です。Luo氏は安定版のオープンソース公開も予告しています。

出典：VentureBeat

MiniMax M2.7公開、自己進化型AIで開発工程の半分を自動化

2026年03月18日 Google Vercel Gemini Claude Claude Code Codex ワークフロー GPT-5 Sonnet 強化学習リスク開発ツール米国中国エージェントベンチマーク Cursor

自己進化と性能

RL工程の30〜50%を自動実行

MLE Benchメダル率66.6%達成

幻覚率34%でClaude超え

SWE-Proで56.22%の高水準

コストと戦略転換

入力0.30ドル/100万トークン

GLM-5の3分の1以下のコスト

中国AI勢のプロプライエタリ転換

Claude Code等11以上のツール対応

詳細を見る

中国AI企業MiniMaxは2026年3月18日、新たなプロプライエタリLLM「M2.7」を公開しました。同モデルはエージェント型ワークフローとソフトウェア工学タスクに特化し、Vercel AI Gatewayでも標準版と高速版の2種類が利用可能となっています。

M2.7の最大の特徴は自己進化型の開発手法です。先行バージョンのモデルを活用して強化学習のハーネスを構築し、データパイプラインや学習環境の管理を自動化しました。これにより開発工程の30〜50%をモデル自身が担当し、100ラウンド以上の反復ループでコード修正を最適化しています。

ベンチマーク性能ではSWE-Pro 56.22%でGPT-5.3-Codexに匹敵し、GDPval-AAではElo 1495を記録しました。幻覚率は34%とClaude Sonnet 4.6の46%やGemini 3.1 Pro Previewの50%を下回り、MLE Bench Liteのメダル率66.6%はGoogleのGemini 3.1に並ぶ水準です。

価格面では入力0.30ドル、出力1.20ドル（100万トークンあたり）と前モデルM2.5から据え置きで、同等の知能水準を持つGLM-5と比較して3分の1以下のコストを実現しています。Claude Code、Cursor、Trae等11以上の開発ツールへの公式統合も提供されています。

戦略的には、オープンソースで評価を高めてきた中国AI勢がプロプライエタリ路線へ転換する動きの一環として注目されます。一方で中国企業であることから米国・西側の規制産業での採用にはハードルがあり、企業の意思決定者はコスト効率と地政学的リスクを慎重に比較検討する必要があります。

出典：vercel.com | VentureBeat

Vercelがコーディングエージェント向けプラグインを公開

2026年03月17日 OpenAI Vercel Claude Claude Code Codex コーディングデプロイエージェント Cursor

プラグインの主要機能

47種以上のスキルを搭載

Next.jsやAI SDK等の知識グラフ対応

3種の専門エージェントを内蔵

5つのスラッシュコマンドを提供

技術的な仕組み

ファイル編集やコマンドをリアルタイム監視

非推奨パターンを即時検出・警告

Claude CodeとCursorに対応

OpenAI Codex対応も近日予定

詳細を見る

Vercelは、コーディングエージェント向けの新プラグインを公開しました。Claude CodeとCursorに対応し、Vercelプロジェクトの理解を深めるためのプラットフォーム知識グラフを提供します。

プラグインは47種以上のスキルを搭載しており、Next.js、AI SDK、Turborepo、Vercel Functions、Routing Middlewareなど主要技術をカバーしています。リレーショナル知識グラフにより、各技術間の関連性も把握できます。

AIアーキテクト、デプロイメントエキスパート、パフォーマンスオプティマイザーの3種の専門エージェントを内蔵しています。bootstrapやdeploy、env、status、marketplaceの5つのスラッシュコマンドも利用可能です。

技術的には、ビルド時にパターンマッチャーをコンパイルし、7つのライフサイクルフックで優先度付きの注入パイプラインを実行します。globパターンやbash正規表現、import文などに基づきスキルが発火し、セッション内で重複排除されます。

さらにPostToolUseバリデーションにより、非推奨パターンやサンセット済みパッケージ、古いAPIをリアルタイムで検出します。npxコマンドやClaude Code公式マーケットプレイスから簡単にインストールでき、OpenAI Codexへの対応も近日中に予定されています。

出典：vercel.com

OpenAI、GPT-5.4 miniとnanoを公開

2026年03月17日 OpenAI ChatGPT Codex GPT-5 エンジニア推論コーディングエージェントコンテキストベンチマーク Computer Use

性能と価格

GPT-5 mini比2倍以上高速

SWE-Bench Proで54.4%達成

nano入力100万トークン0.20ドル

mini入力100万トークン0.75ドル

主な用途

コーディング補助の高速化

サブエージェント並列処理

スクリーンショット解析対応

Codexでコスト3分の1

詳細を見る

OpenAIは2026年4月2日、小型高性能モデルGPT-5.4 miniとGPT-5.4 nanoをAPI・Codex・ChatGPTで公開しました。大量処理ワークロード向けに設計された両モデルは、速度とコスト効率を重視しています。

GPT-5.4 miniは前世代のGPT-5 miniと比較して、コーディング・推論・マルチモーダル理解・ツール使用の全領域で大幅に改善されています。処理速度は2倍以上に向上し、複数のベンチマークで上位モデルGPT-5.4に迫る性能を示しています。

ベンチマークではSWE-Bench Proで54.4%、OSWorld-Verifiedで72.1%を達成しました。特にOSWorldではGPT-5.4の75.0%にほぼ匹敵し、コンピュータ操作タスクでの実用性が際立っています。

料金体系はGPT-5.4 miniが入力100万トークンあたり0.75ドル、出力4.50ドルです。nanoはさらに安価で入力0.20ドル、出力1.25ドルに設定されています。両モデルとも40万トークンのコンテキストウィンドウに対応します。

開発者にとって注目すべきはサブエージェント構成への最適化です。GPT-5.4が計画・判断を担い、miniやnanoが並列で個別タスクを高速処理する構成が推奨されており、Codexではmini利用時のクォータ消費が30%で済むため、コスト効率の高い開発体験を実現します。

出典：OpenAI公式 | vercel.com

OpenAI Codex SecurityがSASTレポートを採用しない理由

2026年03月16日 OpenAI Codex 推論リスク脆弱性セキュリティエージェント

SAST の限界

データフロー追跡だけでは不十分

サニタイザー存在と安全性は別問題

変換チェーン後の制約維持が課題

順序・正規化の不整合が実際の脆弱性に

エージェント型検証の設計

リポジトリ構造と脅威モデルから出発

z3ソルバーで制約充足を形式検証

サンドボックスでPoC実行検証

トリアージ前に証拠を確立

SAST起点を避ける理由

既存結果への早期収束リスク

暗黙の前提が推論を歪める

詳細を見る

OpenAIは自社のコードセキュリティ製品「Codex Security」において、従来の静的解析（SAST）レポートを起点としない設計を採用しました。代わりにリポジトリのアーキテクチャ、信頼境界、意図された動作から分析を開始し、人間に報告する前に検証を行う方針です。

SASTは入力源から危険なシンクまでのデータフロー追跡に優れますが、実際のコードベースでは間接呼び出しやリフレクション、フレームワーク固有の制御フローにより近似処理が必要になります。より根本的な問題は、サニタイザーが存在しても、その制約が変換チェーン全体で維持されるかを判定できない点にあります。

具体例として、JSONペイロードから取得したリダイレクトURLに対し正規表現チェック後にURLデコードを行うパターンがあります。CVE-2024-29041ではExpressにおいて、不正なURLがデコード・解釈の過程で許可リストを迂回できる脆弱性が発見されました。データフローは明白でも、変換後に検証が有効かが真の問題でした。

Codex Securityはコードパスをセキュリティ研究者のように読み、検証と実装の不一致を探します。最小のテスト可能な単位に分解してマイクロファザーを生成し、Python環境のz3ソルバーで制約充足問題として形式化することも可能です。サンドボックス環境でエンドツーエンドのPoCを実行し、疑惑と確証を区別します。

SASTレポートを起点としない理由は3つあります。第一に、既存の検出結果が探索範囲の早期収束を招きます。第二に、SASTが内包する暗黙の前提が推論を歪め、調査ではなく確認作業に陥ります。第三に、エージェント自身の発見能力の評価が困難になり、システム改善の妨げとなります。

出典：OpenAI公式

マスク氏、xAIで再び大規模人員削減を指示

2026年03月14日 OpenAI Anthropic xAI Claude Grok Claude Code Codex チャットボット創業者事前学習コーディングイーロン・マスクスタートアップ SpaceX Tesla

xAI組織再編の全容

SpaceX・Teslaから監査役派遣

コーディング製品の不振が引き金

共同創業者2名が相次ぎ退社

訓練データの品質に重大な課題

競合との差と上場圧力

Anthropic・OpenAIに大きく後れ

Grokは個人・法人とも普及せず

SpaceX統合で6月上場期限迫る

「基礎から再構築」とマスク氏表明

詳細を見る

イーロン・マスク氏は、自身が率いるAIスタートアップxAIに対し、コーディング製品の低迷を理由に新たな人員削減を指示しました。SpaceXやTeslaから「修正役」の管理職が送り込まれ、従業員の業務を監査しています。

AnthropicのClaude CodeやOpenAIのCodexといった競合AIコーディングツールが業界を席巻する中、xAIのGrok チャットボットおよびコーディング製品は有料ユーザーの獲得に苦戦しています。設立からわずか2年で根本的な立て直しを迫られる異例の事態です。

SpaceXとTeslaから派遣された管理職は、xAI社員の成果物を精査し、不十分と判断した社員を解雇しています。特にモデル訓練に使用するデータの品質が競合に劣る主因として注目されており、改善が急務となっています。

今回の混乱で、技術スタッフの最上級メンバーであったZihang Dai氏が退社しました。さらにGrokモデルの事前学習を統括していたGuodong Zhang氏も、コーディング製品の問題の責任を問われ主要業務を外されたことを受け、退社を表明しています。

マスク氏はxAIとSpaceXを12.5億ドルで統合しており、6月の大型上場に向けた圧力が高まっています。同氏はXへの投稿で「xAIは最初の構築がうまくいかなかったため、基礎から再構築する。Teslaでも同じことがあった」と述べ、長期的な再建に自信を示しました。

出典：Ars Technica

YC支援のRandom LabsがAI群制御型コーディングエージェントSlate V1を公開

2026年03月12日 OpenAI Anthropic Claude Claude Code Codex エンジニアリスクコーディングエージェントコンテキスト

Slateの技術基盤

Thread Weavingで文脈維持

オーケストレータとワーカーの分離構造

エピソード記憶で状態圧縮

複数モデルの並列実行に対応

事業戦略と展望

従量課金クレジット制を採用

OpenAI Codex・Claude Code連携を予定

Terminal Bench 2.0で高い安定性を実証

「次の2000万人のエンジニア」が標的

詳細を見る

Y Combinator支援のRandom Labsは、業界初の「スウォームネイティブ」自律型コーディングエージェント「Slate V1」を正式リリースしました。2024年にKiranとMihir Chintawarが共同創業した同社は、大規模並列処理で複雑なエンジニアリングタスクを実行する新しいアプローチを提案しています。

Slateの中核技術は「Thread Weaving」と呼ばれるアーキテクチャです。従来のAIコーディングツールが抱えていたコンテキストウィンドウの制約を、OS的なフレームワークで解決します。中央のオーケストレータが戦略的判断を担い、TypeScriptベースのDSLで並列ワーカースレッドにタスクを割り振る分離構造を採用しています。

記憶管理においても独自のアプローチを取ります。多くのエージェントが採用する「圧縮」方式では重要な状態情報が失われるリスクがありますが、Slateはワーカースレッド完了時に成功したツール呼び出しと結論のみを要約した「エピソード」を生成します。これによりスウォーム知性を維持しながら大規模並列処理を実現しています。

商業面では従量課金制のクレジットモデルへ移行し、組織レベルの課金管理機能を備えるなどプロフェッショナルチーム向けの設計が明確です。さらにOpenAIのCodexやAnthropicのClaude Codeとの直接連携を来週リリース予定と発表しており、競合ではなくオーケストレーション層としての立ち位置を狙っています。

性能面では、Terminal Bench 2.0のmake-mips-interpreterタスクで初期バージョンが3分の2のテストに合格しました。最新のフロンティアモデルでも単体では成功率20%未満とされるこのタスクでの好成績は、オーケストレーション型アーキテクチャの有効性を示しています。同社はSlateを開発者の代替ではなく、世界的なエンジニア不足を補う協調ツールと位置づけています。

出典：VentureBeat

OpenAIがResponses APIにコンピュータ環境を統合しエージェント基盤を強化

2026年03月11日 OpenAI Codex ワークフローネットワーク認証コーディングエージェントプロンプトコンテキスト

シェルツールの全容

Unix CLIで多言語実行

コマンド並列実行に対応

出力上限でコンテキスト節約

ストリーミング逐次応答

コンテナとスキル基盤

ファイル・SQLite永続管理

ネットワークは許可リスト制御

スキルで再利用可能な手順定義

コンパクション機能で長時間実行

詳細を見る

OpenAIは、Responses APIにシェルツールとホスト型コンテナワークスペースを統合し、AIモデルが実際のコンピュータ環境でタスクを実行できるエージェント基盤を構築したと発表しました。従来のプロンプト応答を超え、ファイル操作やAPI呼び出しなど幅広い業務を自動化できます。

シェルツールは従来のコードインタプリタがPython限定だったのに対し、Go・Java・Node.jsなど多言語に対応します。モデルがコマンドを提案し、Responses APIがコンテナ内で実行、結果をモデルに返すループで動作します。複数コマンドの並列実行にも対応し、処理速度を大幅に向上させています。

コンテナ環境は3つの文脈を提供します。第一にファイルシステムでデータを整理し、第二にSQLiteなどの構造化データベースで効率的にクエリを実行できます。第三にネットワークアクセスはサイドカープロキシ経由で制御され、許可リストとドメイン単位の認証情報注入により安全性を確保しています。

エージェントスキルは繰り返し発生するワークフローを再利用可能な部品として定義する仕組みです。SKILL.mdファイルとリソースをバンドルし、バージョン管理されたパッケージとしてAPI経由で管理できます。モデルはシェルコマンドでスキルを発見し、指示を解釈して同一ループ内で実行します。

長時間タスクではコンテキストウィンドウが枯渇する課題に対し、ネイティブのコンパクション機能を実装しました。モデルが会話状態を分析し、重要情報を暗号化されたトークン効率の高い表現に圧縮します。OpenAIのCodexもこの仕組みに依存しており、長時間のコーディングタスクを品質を落とさず継続できます。

出典：OpenAI公式

OpenAIがClaude Code追撃へCodex開発を全社加速

コーディングAI競争の構図

Claude Codeが年間売上25億ドル超

Codexは10億ドルで後塵を拝す

Cursor 買収を試みるも断念

OpenAI社内の巻き返し策

2025年3月にスプリントチーム結成

Windsurf 買収もMicrosoft介入で破談

GPT-5.2搭載でCodex利用者が急増

業界への波及と今後の課題

Claude Codeが1兆ドル株安誘発

安全性と開発速度の両立が焦点

詳細を見る

OpenAIがAIコーディングエージェント「Codex」の開発を全社的に加速させています。競合Anthropicの「Claude Code」が年間売上25億ドル超と急成長する一方、Codexは2026年1月時点で10億ドル超にとどまり、後発の立場に置かれています。

OpenAIは2021年にCodexの初期版を開発し、MicrosoftのGitHub Copilotに技術を提供していました。しかし2022年末のChatGPTの爆発的成功により、社内リソースがチャットボットやマルチモーダルAIに集中し、専任のコーディング製品チームが長期間不在となりました。

Anthropicはこの間、実際のコードリポジトリを使ったモデル訓練に注力しました。2024年6月にClaude Sonnet 3.5がリリースされると、そのコーディング能力が開発者に高く評価され、Cursorの急成長にもつながりました。OpenAIはCursorの買収を持ちかけましたが、創業者らは独立を選びました。

OpenAIは2025年3月にスプリントチームを結成し、同時にWindsurfを30億ドルで買収する計画も進めました。しかしMicrosoftが知的財産へのアクセスを要求し、両社の関係が緊張する中で買収は破談しました。その後GPT-5.2を搭載したCodexは性能が大幅に向上し、2025年9月にはClaude Codeの5%だった利用量が2026年1月には40%まで急伸しました。

一方でAIコーディングの社会的影響も拡大しています。Wall Street JournalはClaude Codeが1兆ドル規模の株安を引き起こしたと報じ、IBMは25年ぶりの株価急落に見舞われました。安全性団体からはOpenAIがCodex開発を急ぐあまり安全性評価をおろそかにしているとの指摘もあり、開発競争の加速と責任あるAI開発の両立が問われています。

出典：WIRED

AnthropicとOpenAIがLLM脆弱性スキャナーを無償公開、従来SASTの限界を露呈

2026年03月10日 OpenAI Anthropic Claude Claude Code Codex GPT-5 Opus 専門家推論リスク脆弱性セキュリティ

2社の独自スキャナー比較

Claude Code Securityが500件超の未知脆弱性を発見

Codex Securityが120万超コミットをスキャン

OpenAIが14件のCVEを新規発行

両ツールとも現在無償提供中

誤検知率が50%以上低減

企業セキュリティへの影響

従来SATSのパターンマッチング限界が明確化

デュアルユースリスクの深刻化

静的コードスキャンの商品化が加速

予算の重心が修復自動化へ移行

ボードへの30日パイロット実施を推奨

詳細を見る

2026年2月20日にAnthropicがClaude Code Securityを、3月6日にOpenAIがCodex Securityを相次いでリリースし、LLM推論を活用した脆弱性スキャナーが企業向けに無償提供された。

AnthropicはClaude Opus 4.6を用い、数十年間の専門家レビューと数百万時間のファジングを経た本番OSコードベースで500件超の高深刻度ゼロデイ脆弱性を発見しました。従来のカバレッジ誘導型ファジングでは検出不能だったLZW圧縮アルゴリズムのヒープバッファオーバーフローも特定しています。

OpenAIのCodex SecurityはGPT-5搭載の社内ツール「Aardvark」から発展し、ベータ期間中に120万件超のコミットをスキャン。OpenSSH・GnuTLS・Chromiumなど著名OSSで792件の致命的問題と1万561件の高深刻度問題を検出し、14件のCVEが新規付番されました。

Checkmarx Zeroの検証では、Claude Code Securityが8件中2件しか真陽性を返せない事例も確認されており、LLMスキャナーの精度限界と第三者監査の必要性が指摘されています。Enkrypt AI CSO Merritt Baer氏は「OSSの脆弱性発見はゼロデイ級として扱うべきで、CVSSスコアだけでトリアージすべきではない」と警告しました。

企業セキュリティ担当者には7つのアクションが推奨されています。代表リポジトリで両ツールを同時実行して既存SATSとの差分（盲点）を把握すること、ガバナンスフレームワークをパイロット前に整備すること、ソフトウェア構成分析・コンテナスキャン・DASTなど両ツールがカバーしない領域を明確にすること、そして30日間のパイロットで取得した実証データを調達判断の根拠とすることが特に重要です。

出典：VentureBeat

OpenAI、コード脆弱性を自動検出するCodex Securityを公開

2026年03月06日 OpenAI ChatGPT Codex 脆弱性パッチセキュリティ認証エージェント

製品の特徴と精度

脅威モデル自動生成と編集機能

サンドボックスで検証し誤検知削減

修正パッチを文脈付きで提案

フィードバック学習で精度向上

OSS貢献と実績

14件のCVEをOSSで発見・報告

OpenSSH・GnuTLS等の重大脆弱性修正

誤検知率50%以上削減を達成

OSS支援プログラムを無償提供

詳細を見る

OpenAIは2026年3月、アプリケーションセキュリティエージェント「Codex Security」のリサーチプレビューを開始しました。ChatGPT Pro・Enterprise・Business・Edu顧客向けに、初月は無料で提供されます。

Codex Securityは旧名「Aardvark」として昨年からプライベートベータを実施してきました。ベータ期間中にSSRFやクロステナント認証バイパスなどの重大脆弱性を発見し、セキュリティチームが数時間以内にパッチを適用した実績があります。

同ツールの最大の特徴は、リポジトリを分析して脅威モデルを自動生成し、プロジェクト固有の文脈に基づいて脆弱性を優先順位付けする点です。サンドボックス環境での自動検証により、誤検知率を50%以上削減し、重要度の過大報告も90%以上減少させました。

OSSコミュニティへの貢献も注目されます。OpenSSH、GnuTLS、GOGS、Chromiumなど広く使われるプロジェクトで14件のCVEを報告しました。過去30日間で外部リポジトリの120万コミット以上をスキャンし、792件の重大・1万561件の高深刻度の脆弱性を検出しています。

OpenAIはOSSメンテナー向けに「Codex for OSS」プログラムも開始し、無償のChatGPT ProアカウントやCodex Securityを提供します。vLLMなどのプロジェクトが既に活用を開始しており、今後数週間で対象を拡大する予定です。

出典：OpenAI公式

Block社ドーシーCEO、AI理由に従業員半数を解雇

2026年03月06日 OpenAI Anthropic Codex Opus レイオフ AGI コーディングバイブコーディングイーロン・マスク投資ベンチャーキャピタルバブル

大規模レイオフの背景

従業員約5000人を一斉解雇

AI進化で企業構造の抜本改革が必要と主張

12月のOpus 4.6やCodex 5.3が転機

過剰採用ではなく先手の判断と説明

AI中心の新企業像

管理階層を撤廃し知能層を構築

会社全体をミニAGI化する構想

顧客が自ら製品をバイブコーディング

1〜2年で対応しなければ存亡の危機

X・分散化・政治への見解

Xのアルゴリズム選択に改善余地

Blueskyもイデオロギー偏向と批判

政府と民間企業の分離が必要

詳細を見る

Block（旧Square）のジャック・ドーシーCEOは、約1万人の従業員のうちほぼ半数を解雇したことを明らかにしました。同社は直近四半期に約30億ドルの利益を計上し、時価総額390億ドルの好業績下での決断です。

ドーシー氏は解雇の理由について、2025年12月にAnthropicのOpus 4.6やOpenAIのCodex 5.3などのAIツールが大規模コードベースへの対応力を劇的に向上させたことを挙げました。これにより企業の構造そのものを根本から見直す必要が生じたと説明しています。

同氏が描く新たな企業像は、従来の管理階層を完全に撤廃し、会社全体に知能レイヤーを構築する「ミニAGI」型の組織です。全社員がこの知能層に問いかけ、意図を組み込み、顧客向けの機能を迅速にスケールできる体制を目指しています。

イーロン・マスク氏が率いるX（旧Twitter）については、私企業化とビジネスモデル変革を評価しつつも、アルゴリズムによるフィルターバブルやイデオロギー的分断を批判しました。自身が創設に関わったBlueskyについても、VC 投資を受けて普通の企業化した点に失望を表明しています。

ドーシー氏は、AIに対応しない企業は1〜2年以内に存亡の危機に直面すると警告しました。政治については「超混乱している」と述べ、テクノロジー企業と政府の分離の重要性を強調。AI企業間のモデル切り替えコストがほぼゼロである点にも言及し、業界の競争構造への懸念を示しました。

出典：WIRED

OpenAI、教育機関向けAI活用支援ツールを大幅拡充

2026年03月05日 OpenAI ChatGPT Codex AI活用ワークフロー学生コーディング米国エージェント教師学校

学生のAI活用格差

週9億人がChatGPT利用

大学生層が最大の利用者層

上級者でも活用度は90〜99%不足

基本利用から高度応用への移行が課題

教育機関向け新施策

Codexでコーディング実習提供

研究用Prism環境を無料公開

OpenAI認定資格を試験導入

学習成果測定スイートを近日提供

詳細を見る

OpenAIは、教育機関がAI活用の格差を解消するための新たなツール群とリソースを発表しました。毎週9億人がChatGPTを利用するなか、大学生が年齢層別で最大の利用者であることが明らかになっています。

同社の分析によると、大学生は文章作成や分析、コーディングなど11分野中5分野で主流ユーザーのトップに立つ一方、パワーユーザーと比較すると活用度は90〜99%低い水準にとどまっています。この「能力活用格差」の解消が教育分野における重要課題と位置づけられています。

具体的な施策として、コーディングエージェント「Codex」を授業に導入し、学生がバグ修正やテスト実行などの実務経験を積める環境を提供します。また、LaTeX対応の研究協業環境「Prism」を無料で公開し、論文執筆からAI支援ワークフローまでを一元化します。

アリゾナ州立大学やカリフォルニア州立大学システムでは、OpenAI認定資格のパイロット運用が開始されました。学生・教職員が実践的なAIスキルを習得し、雇用主に対して能力を証明できる仕組みです。ギリシャ、エストニア、UAEなど各国の教育システムも導入を進めています。

教員支援にも注力しており、「ChatGPT for Teachers」は全米の主要学区で15万人以上の教職員が利用中です。米国教員連盟との連携やOpenAI Academyを通じたコミュニティカレッジ向け無料研修も展開し、AI教育の裾野拡大を図っています。

出典：OpenAI公式

OpenAIがGPT-5.4発表、PC操作や100万トークン対応

2026年03月05日 OpenAI ChatGPT Codex スライド GPT-5 専門家推論コーディング投資エージェントプロンプトコンテキストベンチマーク MCP Computer Use

モデル性能の飛躍

GDPvalで専門家超え83%達成

OSWorldでPC操作成功率75%

事実誤認が33%減少

推論トークン消費量の大幅削減

エージェント基盤の進化

コンピュータ操作のネイティブ対応

Tool Searchでトークン47%削減

APIで100万トークン文脈窓

Excel・Sheets連携プラグイン提供

詳細を見る

OpenAIは2026年3月5日、最新AIモデルGPT-5.4をChatGPT、API、Codexで公開しました。推論・コーディング・エージェント機能を統合した同社史上最高性能のフロンティアモデルと位置づけています。

GPT-5.4は同社初の汎用モデルとしてネイティブコンピュータ操作機能を搭載しています。Playwrightによるコード実行やスクリーンショットに基づくマウス・キーボード操作が可能で、OSWorldベンチマークでは人間の72.4%を上回る75.0%の成功率を達成しました。

ビジネス用途ではスプレッドシート、プレゼンテーション、文書作成の能力が大幅に向上しています。投資銀行業務のモデリングタスクでは平均87.3%のスコアを記録し、前モデルGPT-5.2の68.4%から約19ポイント改善されました。

API向けにはTool Search機能を新たに導入し、多数のツール定義を事前にプロンプトへ含める従来方式を刷新しました。MCP Atlasベンチマークでは同精度を維持しつつトークン使用量を47%削減する効果が確認されています。

価格は入力100万トークンあたり2.50ドル、出力15ドルに設定され、GPT-5.2より引き上げられました。一方で推論効率の向上により、タスク全体のコストは抑制される見込みです。APIでは最大100万トークンのコンテキストウィンドウに対応しています。

LangChain、コーディングエージェント向けスキル評価手法を公開

2026年03月05日 LangChain Claude Claude Code Codex ワークフローコーディングエージェントプロンプト LangSmith

評価パイプラインの要点

Dockerで再現性ある環境構築

制約付きタスクで採点精度向上

バグ修正型タスクが検証に有効

スキル有無で完了率を比較

スキル設計の知見

XMLタグでモジュール化推奨

AGENTS.mdで確実な呼び出し実現

スキル数は12以下で正確に選択

LangSmithで軌跡を可視化

詳細を見る

LangChainは2026年3月、Claude CodeやCodexなどのコーディングエージェントに与える「スキル」の評価手法とベストプラクティスをブログで公開しました。スキルとは、特定領域でエージェントの性能を高めるための指示・スクリプト・リソースの集合体です。

評価パイプラインの基本は、タスクを定義し、スキルの有無でエージェントの成績を比較する手法です。テスト環境には軽量なDockerコンテナを用い、ディレクトリの初期状態を統一することで再現性を確保しています。

タスク設計では、オープンエンドな課題よりもバグ修正型の制約付きタスクが有効であると報告されています。採点が容易になるだけでなく、エージェントの設計空間を適切に限定できるためです。評価指標には、スキルの呼び出し有無、タスク完了率、ターン数、実行時間などを採用しています。

スキル設計においては、AGENTS.mdやCLAUDE.mdにスキルの使用方法を記載することで呼び出し率が安定しました。スキルを単独でプロンプト任せにした場合の呼び出し率は最大70%にとどまる一方、事前読み込みファイルに案内を記載すると一貫した呼び出しが実現できたと報告されています。

実験の結果、スキルを搭載したClaude Codeのタスク完了率は82%に達した一方、スキルなしでは9%に低下しました。LangSmithのトレース機能でエージェントの全行動を記録・分析し、失敗原因の特定とスキル内容の反復改善を高速に回すワークフローが紹介されています。

出典：blog.langchain.com

ByteDance動画AI「Seedance 2.0」に計算資源と著作権の壁

2026年03月05日 Claude Claude Code Codex 動画生成エンジニアクリエイターリスク GPU 著作権動画コーディング米国中国米中 ByteDance

技術と普及の現状

Seedance 2.0が業界に衝撃

映画監督級の映像生成能力

GPU不足で数時間待ちの状態

中国国内アプリ限定で提供中

著作権問題の深刻化

Disney等が差止め書簡送付

ユーザーが著名キャラ映像を大量生成

中国のIP保護制度の未整備が背景

米中AI格差の構図

動画AIでは中国が米国に先行

コーディングAIでは米国が優位

詳細を見る

ByteDanceは2025年2月、動画生成AI「Seedance 2.0」を発表しました。中国のゲーム開発者や映像クリエイターから「監督のように考える」と高い評価を受け、AI動画の品質に懐疑的だった層にも衝撃を与えています。

しかし現時点では計算資源の深刻な不足が普及の障壁となっています。利用者によると、5秒の動画生成に約9万人待ちの行列が発生し、数時間の待機が必要です。月額70ドル超の有料会員でも長時間待たされる状況で、深夜に生成リクエストを送るなどの裏技が共有されています。

Disney、Netflix、Paramountなど大手映画スタジオがByteDanceに著作権侵害を主張する差止め書簡を送付しました。ユーザーがウルヴァリンやトム・クルーズなど著名キャラクターの映像を生成・拡散しており、グローバル展開時の法的リスクが急速に高まっています。

中国のエンタメ業界はハリウッドとは対照的にAI動画を積極的に受容しています。カンヌ受賞の賈樟柯監督がSeedance 2.0で作品を制作し公開するなど、著名クリエイターの参入が相次いでいます。春節晩会の背景映像にも採用され、政府の後押しも見られます。

米中AI分野の棲み分けも鮮明になっています。動画AIではKling AIを含む中国勢が世界をリードする一方、コーディングAIでは中国の開発者もClaude CodeやCodexに依存しています。Seedance 2.0のAPI価格は15秒動画で約2ドルと公表されており、今後のサードパーティ開放が注目されます。

出典：WIRED

Raycast、AIコーディング統合アプリ基盤「Glaze」を発表

2026年03月04日 OpenAI Claude Claude Code App Store Codex Windows デザイン創業者クラウドコーディングバイブコーディングプロンプト基盤モデル

Glazeの基本機能

プロンプト入力だけでアプリ生成

Claude CodeとCodexが基盤モデル

クラウド保存やAPI管理を自動化

他人のアプリを取得しカスタマイズ可能

事業戦略と展望

Mac版先行、Windows・モバイル展開予定

無料版と月額20〜30ドルの有料プラン

Glaze Storeでアプリ共有・発見

Mac・WindowsApp Storeへの挑戦を表明

詳細を見る

Raycastは、Mac向けランチャーアプリの開発元として知られる企業です。同社は新製品Glazeを発表し、AIを活用した「バイブコーディング」によるアプリの構築・利用・共有・発見を一元化するプラットフォームを提供します。

Glazeの最大の特徴は、プロンプトを入力するだけでアプリを一発生成できる点です。基盤モデルにはClaude CodeとOpenAIのCodexを採用しており、クラウドストレージやAPI連携、デザイン原則の適用といった技術的な作業をすべて自動で処理します。

共同創業者のトーマス・ポール・マン氏は「コードを触る必要があるなら、それは我々の失敗だ」と述べています。Glaze Storeというディレクトリでは、他のユーザーが作成したアプリを閲覧・取得でき、さらに自分好みにカスタマイズして使うことも可能です。

GlazeはRaycastのランチャー機能と深く統合されており、生成したアプリはRaycastの拡張機能として自動的に連携します。現在はMac版のみですが、今後Windowsやモバイルにも対応予定で、無料版に加え月額20〜30ドルの有料プランを計画しています。

マン氏は現在を「ソフトウェアのiTunesモーメント」と表現し、あらゆるアプリが一か所で手に入る時代の到来を予見しています。MacやWindowsのApp Storeに挑戦する意欲を示しており、個人の小さなユーティリティからチーム専用ツールまで、ソフトウェアの在り方を根本から変える可能性を秘めています。

出典：The Verge

OpenAI、社内データエージェントを2名で構築し全社展開

2026年03月03日 OpenAI Slack Codex GPT-5 エンジニアエージェントプロンプトコンテキスト

エージェントの全容

GPT-5.2基盤で自然言語対応

70%のコードをAIが生成

600PB超・7万データセットに対応

問合せ1件あたり2〜4時間短縮

技術的工夫と課題

Codexがテーブル探索を自動化

6層のコンテキスト階層で精度向上

過信防止の発見フェーズ強制

少量精選データが大量投入に勝る結果

企業への示唆

製品化せず構築用APIを外部提供

データガバナンスが成否を左右

詳細を見る

OpenAIは、社内のデータ分析エージェントをわずか2名のエンジニアが3カ月で構築したことを明らかにしました。このツールはSlackやWebインターフェースから自然言語で問い合わせると、チャートやダッシュボードを数分で返す仕組みです。

同社のデータ基盤責任者であるEmma Tang氏によると、600ペタバイト超のデータと7万のデータセットを扱う環境で、5000人の社員のうち4000人以上がこのエージェントを日常的に利用しています。財務チームの地域別売上比較からエンジニアのレイテンシ調査まで、部門横断で活用されています。

技術的な最大の課題は、7万のデータセットから正しいテーブルを見つけることでした。Codexを活用した「Codex Enrichment」プロセスが日次でテーブルの依存関係や結合キーを自動解析し、ベクターデータベースに格納することでこの問題を解決しています。

モデルの過信という行動上の課題に対しては、プロンプトエンジニアリングで発見フェーズに時間をかけるよう強制する手法を導入しました。また評価の結果、コンテキストは量より質が重要であり、厳選された少量の情報のほうが高精度な結果を生むことが判明しています。

OpenAIはこのツールの製品化は予定しておらず、Responses APIやEvals APIなど外部利用可能なAPIのみで構築したと強調しています。Tang氏は「データガバナンスこそがAIエージェント成功の前提条件」と述べ、データの整備と注釈付けの重要性を企業に訴えました。

出典：VentureBeat

VC投資家がAI SaaS企業への選別を強化、汎用ツール離れ鮮明に

2026年03月01日 OpenAI Anthropic Salesforce Claude Claude Code Codex ワークフロー CRM 専門家投資家インフラコンプライアンススタートアップ投資ベンチャーキャピタルエージェント SaaS

投資家が避けるSaaS領域

薄いワークフロー層や汎用水平ツールの敬遠

UIと自動化だけの差別化では参入障壁が不十分

独自データのない垂直SaaSへの投資縮小

SaaS業界の構造変化

AIエージェント台頭で座席課金モデルが崩壊危機

ソフトウェア株から約1兆ドルの時価総額が消失

KlarnaがSalesforce CRMを自社AI系に置換

今後の投資トレンド

ワークフロー所有とドメイン専門性に資本集中

成果報酬型や従量課金モデルへの移行加速

詳細を見る

複数のVC 投資家がTechCrunchの取材に応じ、AI SaaSスタートアップへの投資基準が大きく変化していることを明かしました。汎用的な水平ツールや薄いワークフロー層、独自データを持たない垂直SaaSは投資対象から外れつつあります。

645 VenturesのAaron Holiday氏は、投資家が現在注目するのはAIネイティブ・インフラ、独自データを持つ垂直SaaS、ミッションクリティカルなワークフローに深く組み込まれたプラットフォームだと説明しました。AltaIR CapitalのRyabenkiy氏も製品の深さが不可欠と強調しています。

AIエージェントの進化により、従来の座席課金モデルが根本から揺らいでいます。Claude CodeやOpenAI Codexなどのツールにより、SaaS製品の中核機能を容易に再現できるようになり、企業は自社開発を選ぶケースが増加しています。KlarnaがSalesforce CRMを自社AIシステムに置き換えた事例がその象徴です。

公開市場では、Anthropicの新製品発表のたびにSaaS株が下落する現象が続いています。2026年2月初旬には約1兆ドルの時価総額がソフトウェア株から消失しました。専門家はこの動きを「SaaSpocalypse」と呼び、SaaSの終局価値が史上初めて根本的に問われていると指摘しています。

一方で投資家らはSaaSの完全な終焉は否定しています。コンプライアンス対応や監査支援など企業の基幹業務を支えるソフトウェアへの需要は持続するとの見方です。今後は従量課金や成果報酬型への移行が進み、ワークフロー所有とドメイン専門性を持つ企業に資本が集中すると予測されています。

出典：TechCrunch | TechCrunch

FigmaがCodexと提携しデザイン連携を実現

2026年02月26日 OpenAI Anthropic Codex エコシステムアシスタントワークフローデザインエンジニアコーディング提携エージェント MCP Canva Figma

統合の技術的内容

Figma MCPサーバー経由でCodexと直結

コード→デザインの即時変換が実現

Dev Mode・FigJamとのネイティブ連携

先週のAnthropic統合に続くマルチAI戦略

設計・実装サイクルの大幅短縮が可能

開発ワークフローへの影響

エンジニアがコーディング環境から離れず設計変更

プロダクト開発の反復速度向上

デザインシステムとの自動整合が可能

詳細を見る

FigmaとOpenAIは2026年2月26日、Figma MCPサーバーを通じてOpenAI Codexとデザインプラットフォームを直接連携させる統合を発表しました。エンジニアはコーディング環境から離れることなく、デザインキャンバスの変更・反復が行えるようになります。

この統合の核心はFigma MCPサーバーの活用で、CodexがFigmaのデザインツール、Dev Mode、FigJamに直接アクセスできる点です。先週発表されたAnthropicとのMCP統合に続き、Figmaはマルチ大手AIとのエコシステム構築を加速しています。

開発チームにとっての実質的な価値は、コード変更がデザインに即座に反映されるフィードバックループの短縮です。従来は別々のツールを往来していた作業が一元化されます。

この動きはソフトウェア開発ワークフローにおけるAIエージェントの役割が、コード生成から設計・実装の統合制御へと拡張していることを示しています。

FigmaがOpenAI・Anthropic双方と提携した事実は、AIコーディングアシスタント市場の競争が激化し、各プラットフォームが設計ツール統合を差別化要因として争っていることを示しています。

出典：TechCrunch | OpenAI公式

インドAI投資競争、8エクサフロップス配備へ

2026年02月20日 Google OpenAI Anthropic NVIDIA マイクロソフト Cloudflare Cerebras ChatGPT Codex エコシステムアシスタント半導体インフラコンプライアンスコーディングインドスタートアップ投資

インドAIインフラへの巨大投資

UAE・G42とCerebrasが8エクサフロップスの計算資源をインドに配備

Peak XVが13億ドルのインド・アジア特化ファンドを設立

India AI Impact SummitがグローバルAI大手を集めてニューデリーで開催

インドのデータ主権・コンプライアンス要件に準拠した設計

インフラ先行投資でAIエコシステムの地盤固め

インドAI消費・スタートアップ市場

SarvamがインドNLP特化チャットアプリIndusを正式公開

OpenAI India利用者の80%が30歳未満という若年層集中

ChatGPTのインド利用は業務用途35%でグローバル平均超え

OpenAIのCodingアシスタントCodexがインドで世界平均の3倍利用

ローカル言語モデル需要とグローバルAIの競争が激化

詳細を見る

インドは2026年、世界で最も注目されるAI市場となっています。India AI Impact Summitには、OpenAI、Anthropic、NVIDIA、Microsoft、Google、Cloudflareなどの主要AI大手のエグゼクティブが集結し、インドへのAI投資を競うように発表しました。

インフラ投資では、アブダビのG42がAIチップメーカーCerebrasと組み、8エクサフロップスの計算能力を持つスーパーコンピュータをインドに設置します。この規模はインドのAI産業の基盤を大幅に強化するものです。Peak XVは13億ドルの新規ファンドを設立し、AI分野に重点を置いています。

スタートアップ面では、インドのAI企業Sarvamがインド人ユーザー向けに最適化したチャットアプリ「Indus」を公開しました。ヒンディー語など地域言語への対応を強みとして、OpenAIやGoogleとの差別化を図っています。ローカルAIとグローバルAIの競争が本格化しています。

OpenAIのデータによると、インドでのChatGPT利用者の約80%が30歳未満で、業務用途での利用が全体の35%を占めています。特にAIコーディングアシスタントの利用がグローバル平均の3倍という数字は、インドのIT産業との強い親和性を示しています。

インドのAIブームは、大規模インフラ投資、若年層の高い採用率、ローカルスタートアップの台頭という三つの力が重なる特別な現象です。グローバル vs ローカルの競争がインドのAI市場の形を決定づける2026年が始まっています。

出典：TechCrunch | TechCrunch | TechCrunch | TechCrunch

GitHubとOpenAIがCodexとSoraでエージェントコーディングを拡張

2026年02月13日 OpenAI GitHub Sora Flow Codex ワークフローエンジニアコーディングコードレビューエージェント

エージェントコーディングの進化

GitHubがエージェントワークフローでリポジトリタスクを自動化

OpenAIがCodexとSoraのスケールアクセスを拡大

AIエージェントが開発ライフサイクルに深く統合

詳細を見る

GitHubはAgenttic Workflowsを発表し、AIエージェントがリポジトリのタスク（コードレビュー、PR作成、ドキュメント更新など）を自動化できる機能を提供します。開発プロセス全体のエージェント化が加速しています。

OpenAIは同時期にCodexとSoraの利用上限引き上げとアクセス拡大を発表しました。コーディングとビジュアル生成という二つの重要なAI機能のスケールが多くの開発者に開放されます。

この組み合わせは、コード生成だけでなくUI/UXのプロトタイピングにも活用できる統合的な開発環境を示唆しており、ソフトウェア開発の未来像として注目されます。

出典：GitHub公式 | OpenAI公式

CodexとClaudeがカスタムGPUカーネルを全ユーザーに解放

2026年02月13日 Claude Codex エンジニア専門家推論 GPU

GPU最適化の民主化

カスタムカーネル生成がAI支援で一般開発者に解放

CUDA専門知識なしでGPU最適化を実現

AI推論コストの削減を広く可能に

詳細を見る

CodexとClaudeのコード生成能力を組み合わせて、専門知識なしでカスタムGPUカーネルを生成できる機能が全ユーザーに開放されました。これまでCUDA専門家のみが担えたGPU最適化がAIの力で民主化されます。

カスタムGPUカーネルは特定の計算ワークロードに対してGPU使用効率を大幅に改善できますが、その開発には深い専門知識が必要でした。AIによる生成でこの技術的障壁が大幅に下がります。

この機能はMLエンジニアや研究者が推論効率を最大化する際の重要なツールとなります。自社AI推論のコスト削減に取り組む企業にとって実務的な価値があります。

出典：Hugging Face

HarnessがCodexでエージェントファースト開発を5ヶ月実践した知見

2026年02月11日 OpenAI Codex 開発ツール CI/CD 日本エージェント

実践から得た知見

5ヶ月間のCodex活用実験の成果を公開

エージェントファーストの開発体制への移行

実務での課題と成功パターンを詳説

詳細を見る

CI/CDプラットフォームのHarnessは、OpenAIのCodexを活用したエージェントファースト開発の5ヶ月間にわたる実験結果を公開しました。実際の製品機能の構築・出荷にエージェントを活用した現場レポートとして注目されます。

実験から得られた主な知見として、エージェントは繰り返しのルーティン作業では高い効果を発揮する一方、複雑な依存関係のある機能開発では人間の監督が依然として必要であることが確認されました。

このような実践からの学びは、AI開発ツールの導入を検討する企業にとって非常に参考になります。理論ではなく実際の開発現場での課題と解決策が語られており、日本の開発チームにも応用可能な示唆が含まれています。

出典：OpenAI公式

OpenAI Codexアプリが1週間で100万ダウンロード突破

2026年02月09日 OpenAI GitHub ChatGPT Copilot GitHub Copilot Codex Windows 生産性エコシステムエンジニアコーディングサム・アルトマン Cursor Windsurf

成長と影響

Mac専用Codexアプリが1週間で100万DL達成

全体Codexユーザーが前週比60%増

Sam AltmanがX上で自らマイルストーンを発表

ChatGPT初期リリース時の爆発的成長を想起させる

AIコーディング市場での存在感を急速に拡大

競争環境への影響

GitHub Copilot・Cursor・Windsurf等との競争激化

OpenAIがコーディングツール市場に本格参入

月間アクティブユーザー3億人超のChatGPTを基盤に展開

開発者市場でのシェア争いが本格化

AI支援コーディングの主流化を加速

詳細を見る

OpenAIのCEO Sam AltmanはX上で、Mac向けの独立したCodexアプリケーションがリリース後1週間で100万ダウンロードを突破したと発表しました。これは全体のCodexユーザー数の前週比60%増を反映しています。

この成長速度は2022年末のChatGPT初期公開時の爆発的普及を想起させます。AI コーディングツール市場はGitHub Copilot、Cursor、Windsurfなどが激戦を繰り広げており、OpenAIはChatGPTの巨大ユーザーベースを武器に参入しました。

Codexアプリは現在Mac限定ですが、複数の並行AIコーディングタスクを実行できる機能を提供しています。3億人超の月間アクティブユーザーを持つChatGPTのエコシステムと連携した展開が今後の競争力の鍵となります。

AI支援コーディングの主流化は、ソフトウェアエンジニアの生産性に直接影響を与える重要なトレンドです。1週間での100万DLという数字は、開発者コミュニティにおけるOpenAIへの信頼と需要の高さを示しています。

今後のWindows版展開やエンタープライズ機能の拡充が注目されます。コーディングツール市場でのシェア争いは、AI企業のデベロッパー戦略の試金石となりそうです。

出典：VentureBeat

OpenAIがGPT-5.3-Codexを発表、コーディング超えたエージェント戦略

2026年02月05日 OpenAI Anthropic Claude Codex GPT-5 Opus エンジニアリスクコーディングデプロイエージェント

GPT-5.3-Codexの特徴

コーディング以外にも対応拡大

エージェント型タスク実行が強み

システムカードでリスク開示

プログラミング自律完遂能力

Claude Opus 4.6と同日リリース

AI競争の激化を象徴

開発者・企業への影響

複雑な業務自動化が可能に

デプロイパイプラインへの統合

コスト対性能の比較検討が必要

詳細を見る

OpenAIは2026年2月5日、新しいコーディングエージェントモデル「GPT-5.3-Codex」を発表した。AnthropicのClaude Opus 4.6とほぼ同日のリリースとなり、AI競争の激化を示した。

GPT-5.3-Codexはコード生成に特化した従来のCodexシリーズを進化させ、コーディング以外のエージェントタスクにも対応する汎用性を持つ。

OpenAIはシステムカードでモデルの能力・制限・安全性評価を詳細に開示しており、エンタープライズ顧客が導入判断をしやすい体制を整えた。

Arstechnicaの報道によれば「Codexはもはやコードを書くだけではない」とされ、複雑な業務プロセス全体を自律的に遂行できる能力が確認されている。

GPT-5.3-Codexとプレスの発表はOpenAIのエンタープライズ向けエージェントプラットフォーム戦略の一環で、Frontierとの統合でさらなる相乗効果を狙っている。

出典：OpenAI公式 | OpenAI公式 | Ars Technica | TechCrunch | VentureBeat

AnthropicがClaude Opus 4.6を公開、100万トークンとエージェントチーム機能

2026年02月05日 OpenAI Anthropic Claude Codex 生産性 GPT-5 Opus 推論コーディングエージェントコンテキスト

Opus 4.6の主要機能

100万トークンコンテキストウィンドウ

エージェントチーム機能を初搭載

コーディング超えた汎用性を強調

OpenAI Codexに正面から対抗

推論速度の大幅改善も実現

複数エージェントの協調動作が可能

市場・競合へのインパクト

AIコーディング市場の競争激化

エンタープライズ需要の取り込みを狙う

スーパーボウル直前の戦略的発表

詳細を見る

Anthropicは2026年2月5日、最新の大型モデル「Claude Opus 4.6」を公開した。100万トークンのコンテキストウィンドウと、複数AIが協調する「エージェントチーム」機能が目玉だ。

100万トークンのコンテキストは従来の4〜8倍以上の情報を一度に処理できることを意味し、大規模コードベースの解析や長文書類の一括処理が現実的になった。

「エージェントチーム」はClaude同士が役割分担して複雑なタスクを遂行する仕組みで、ソフトウェア開発・リサーチ・分析業務での生産性向上が期待される。

リリースのタイミングはOpenAIのGPT-5.3-Codex発表とほぼ同日で、スーパーボウルの週という注目度の高い時期を両社が狙ったことが読み取れる。

Claude Opus 4.6の登場はコーディング特化モデルから汎用エージェントAIへのシフトを明確にしており、企業の業務自動化プロジェクトに直接応用可能な水準に達した。

出典：The Verge | TechCrunch | VentureBeat | Anthropic公式 | The Verge

GitHubがClaudeとCodexのAIコーディングエージェントを統合

2026年02月04日 OpenAI Anthropic GitHub Claude Copilot Codex 生産性ワークフローエンジニアコーディングコードレビューエージェントコンテキスト

統合の詳細と利用条件

GitHub・VS CodeでClaudeとCodexが利用可能

Copilot Pro+または Enterprise向け

GitHub Mobileでもエージェント操作対応

Agent HQで一元管理が可能

OpenAI CodexのApp Server構築詳細公開

コンテキスト切り替え摩擦の削減が目的

開発者への影響

マルチエージェントコーディング環境実現

PR作成からコードレビューまで自動化

AIコーディング市場での競争激化

詳細を見る

GitHubは2026年2月4日、AnthropicのClaude とOpenAIのCodexを直接GitHub上で利用できるパブリックプレビューを開始した。対象はCopilot Pro+またはCopilot Enterpriseのサブスクリプションユーザーだ。

この統合によりGitHub、GitHub Mobile、Visual Studio Codeの各環境からAIコーディングエージェントをシームレスに呼び出せるようになり、開発ワークフローの断絶が大幅に解消される。

Agent HQと呼ばれる新インターフェースにより、ClaudeとCodexを一元的に管理し、タスクに応じて最適なエージェントを選択することができる。

OpenAIはCodexのApp Server構築の技術的詳細を公開し、複数サーフェス（Webアプリ、CLI、API）での一貫した動作を実現する仕組みを説明した。

GitHubへのAIエージェント統合は開発者の生産性向上に大きく寄与すると期待されており、AIコーディングツール市場における競争の新たな軸になっている。

出典：The Verge | GitHub公式 | OpenAI公式

AppleのXcode 26.3がClaudeとCodexを統合しエージェントコーディング時代へ

2026年02月03日 OpenAI Anthropic Apple Claude iOS Claude Code Codex MacOS 生産性エコシステムエンジニアコーディングエージェント MCP Intel

Xcode 26.3の新機能

Claude Agent SDKの統合

OpenAICodexのネイティブ対応

MCPプロトコルでの接続

開発者への影響

Appleプラットフォーム向けエージェント開発

Xcodeが主要AIツールの窓口に

iOS・macOS開発の生産性向上

詳細を見る

AppleはXcode 26.3でAnthropicのClaude Agent SDKとOpenAIのCodexを統合し、Appleプラットフォーム向けアプリ開発に本格的なエージェントコーディング機能を追加しました。

この統合はModel Context Protocol（MCP）を介して行われており、開発者はXcode内から直接Claude CodeやCodexのエージェント機能を呼び出してコード生成・リファクタ・テストを自動化できます。

AnthropicのClaude Agent SDK対応により、iOS・macOS向けアプリにAIエージェント機能を組み込む開発が格段に容易になり、Apple Intelligenceとの連携も視野に入ります。

Xcodeが複数のAIプロバイダーに対応することで、開発者は好みのAIモデルを選択でき、ベンダーロックインを回避しながらAI補助開発を享受できます。

この発表はAppleが独自AIモデルだけでなく、外部AIエコシステムとのオープンな統合戦略を採用していることを示す重要なシグナルです。

出典：VentureBeat | The Verge | Anthropic公式 | Ars Technica | TechCrunch

AlibabaのQwen3-Coder-Nextがバイブコーダー向けの強力なオープンソースモデルに

2026年02月03日 OpenAI GitHub Claude Copilot Claude Code GitHub Copilot Codex Qwen エンジニアコーディングバイブコーディング中国オープンソースモデル

モデルの特徴

超スパースアーキテクチャ採用

バイブコーディング特化設計

オープンソースで無料利用可能

競争への影響

Claude Code・Codexへの対抗

中国AIオープンソースの躍進

開発者コスト削減効果

詳細を見る

アリババのQwenチームは、バイブコーディングユーザー向けに最適化されたオープンソースの超スパースモデル「Qwen3-Coder-Next」を公開しました。高い性能と低い計算コストを両立する超スパースアーキテクチャが特徴です。

超スパースモデルは、活性化されるパラメータが全体の一部に限られるため、同等性能のデンスモデルより低コスト・低レイテンシーで動作し、ローカル実行も現実的になります。

Claude Code・OpenAI Codex・GitHub Copilotなど有料コーディングAIに対し、高品質なオープンソース代替を提供することは、コスト重視の開発者や企業への強い訴求力を持ちます。

Qwen3の一連のリリースは、中国のAI研究コミュニティがグローバルなオープンソースAIリーダーとして台頭していることを改めて示しています。

開発者にとってQwen3-Coder-Nextは実用的な選択肢であり、コーディングAIの競争激化がすべての開発者に恩恵をもたらします。

出典：VentureBeat

OpenAIがmacOS向けCodexデスクトップアプリを発表、並列AIコーディングエージェントを実現

2026年02月02日 OpenAI Anthropic GitHub Claude Copilot Claude Code GitHub Copilot Codex MacOS アシスタントエンジニアリスクコーディングコードレビューエージェント Cursor Windsurf

Codexアプリの機能

複数エージェントの並列実行

長時間タスクの管理

Claude Codeへの対抗

開発者への影響

コーディングパラダイムの転換

チーム型AI開発の実現

macOSネイティブ体験

詳細を見る

OpenAIは2026年2月2日、macOS向けのCodexデスクトップアプリを発表しました。単一のAIアシスタントとの対話型開発から、複数のAIエージェントが並列で異なるタスクを実行する「チーム型開発」への転換を可能にします。

Codexアプリは長時間実行タスクの管理・複数エージェントへの作業分配・進捗の可視化などの機能を持ち、Anthropicの人気ツールClaude Codeへの直接的な対抗として位置付けられています。

開発者にとってこれは、単に作業速度が上がるだけでなく、アーキテクチャレベルで複数の問題を同時に解決するという新しい開発モデルへの移行を意味します。

ただしエージェント型開発は適切なテスト・コードレビュー・ロールバック計画なしには技術的負債を急増させるリスクもあり、エンジニアリング文化の成熟も必要です。

この発表はAIコーディングツール競争の激化を示しており、GitHub Copilot・Cursor・Windsurf等との競争がさらに激しくなるでしょう。

出典：OpenAI公式 | VentureBeat | Ars Technica

OpenAIがCodexエージェントループの内部設計を公開

2026年01月23日 OpenAI Codex エンジニアコーディングデバッグエージェント

アーキテクチャの詳細

Codexのエージェントループ

マルチステップコード生成

テスト・デバッグの自動化

自律的なコーディングの実現

開発者への示唆

エージェント型AIの設計パターン

ループ設計の考え方

失敗回復の仕組み

実装の参考事例

詳細を見る

OpenAIはCodex コーディングAIエージェントのループ設計を詳細に解説したブログ記事を公開した。計画・実行・テスト・修正というエージェントループの全工程を明らかにした。

エージェントが自律的にコードを書き、テストし、失敗から学んで修正する過程の設計原則が示されており、AI開発者にとって重要なアーキテクチャ参考資料となる。

この公開は、エージェント型AIの設計パターンへの理解を深め、自律コーディングエージェントの次世代開発を加速させると見られる。

出典：OpenAI公式

DatadogがOpenAI Codexでシステムレベルのコードレビューを実現

2026年01月09日 OpenAI Codex AI活用エンジニア脆弱性セキュリティコーディングコードレビュー CI/CD

大規模コードレビューの自動化

DatadogがOpenAI Codexを使ったシステムコードレビューを展開

数百万行規模のコードベースを自動的にレビュー

セキュリティ脆弱性・品質問題・パフォーマンス改善を検出

人間の reviewer では見落としやすい問題を発見

CI/CDパイプラインに統合してプルリクエスト毎に自動実行

開発速度を落とさずにコード品質を維持

詳細を見る

OpenAIが紹介したDatadogの事例では、Codexを使ってシステム全体のレベルでのコードレビューを自動化しています。個々のプルリクエストを審査するだけでなく、コードベース全体の整合性を評価する仕組みを構築しています。

Datadog社内のコードリポジトリは巨大であり、人間のレビュアーだけでは全体的な品質維持が困難です。Codexによる自動スキャンは、セキュリティ脆弱性、パフォーマンスのアンチパターン、コーディング規約違反などを一括してフラグアップします。

この事例はSREやプラットフォームエンジニアにとって参考になるAI活用パターンです。大規模なマイクロサービスアーキテクチャを持つ企業ほど、Codexのようなシステムレベルのコードレビュー自動化の価値が高まります。

出典：OpenAI公式

CursorがGraphite買収でAI開発環境を強化

Graphite買収の意義

AIコードレビューツールGraphiteを買収

評価額2.9億ドル超の価格で取得

スタックPRで並行開発が可能

生成から出荷まで一貫環境構築

AIコーディング対決

4大エージェントがマインスイーパー対決

音声・モバイル対応も同一課題で評価

盲検判定で公平な比較を実施

最前線モデルの精度向上を確認

詳細を見る

AIコーディングアシスタントのCursorは、AIを活用したコードレビュー・デバッグツールのGraphiteを買収したと発表しました。買収額は非公開ですが、Graphiteの直近評価額2.9億ドルを大幅に上回ると報じられています。

Graphiteの主要機能であるスタック型プルリクエストは、承認待ちなしに複数の依存変更を並行して扱えるワークフローを提供します。AIが生成したコードのバグ修正サイクルを大幅に短縮する可能性があります。

Cursorは11月にも採用戦略会社Growth by Designを買収するなど積極的なM&A;を展開しており、評価額290億ドルの同社がAI開発の全工程を統合した環境構築を目指していることがわかります。

Ars Technicaは4つの主要AIコーディングエージェント（Codex/GPT-5、Claude Code/Opus 4.5、Gemini CLI、Mistral Vibe）にマインスイーパーを再実装させる比較実験を行いました。音声エフェクト・モバイル対応・サプライズ機能付きの完全版ゲームが課題です。

各エージェントはHTML/JavaScriptファイルを直接操作し、ブラインド評価で結果が審査されました。AIコーディングツールへの開発者の信頼が揺れるなかで、最前線モデルが着実に精度向上を遂げていることが示されました。

出典：TechCrunch | Ars Technica

Claude 4コーデックスとReplit安全技術

2025年12月18日 OpenAI Anthropic Replit Claude Codex セキュリティコーディングエージェントコンテキスト

コーデックス詳細

コーデックスがGAで正式提供開始

CVE-Benchで87%を記録

長期セッションも文脈維持

防衛用途に段階的解放

Replit安全基盤

スナップショットで即座にロールバック

並列サンドボックスで複数解法試行

エージェント暴走を技術的に防止

詳細を見る

AnthropicはAIコーディングエージェント「Claude 4 Codex」を正式リリースしました。複数ファイルにわたる複雑な実装タスクを高い精度で自律的にこなします。

コンテキスト圧縮技術により、大規模リポジトリを横断する長期セッションでも文脈を正確に保ちながら継続作業ができ、複雑なタスクの長時間自律実行を安定して実現しています。

サイバーセキュリティ評価のCVE-Benchでは87%のスコアを記録し、従来モデルを大幅に上回る性能を示すことで防衛的セキュリティ用途への適用可能性を証明しました。

OpenAIは信頼できるセキュリティ研究者向けに防衛的サイバーセキュリティのパイロットプログラムを開始し、審査を通過したパートナーから順次利用範囲を段階的に拡大していく方針を明示しています。

ReplitはAIエージェントを安全に運用するための「スナップショットエンジン」の技術詳細を公式ブログで公開し、オープンソースコミュニティへの知見共有に貢献しました。

このスナップショット技術により、AIエージェントが誤った変更を加えた場合でも即座に以前の正常な状態へロールバックすることが技術的かつ確実に保証されており、安全性が大きく高まります。

今後は並列サンドボックスで複数の解法を同時試行する「並列サンプリング」機能の拡充も開発ロードマップに含まれており、エージェントの問題解決精度のさらなる向上が幅広い領域で期待されています。

出典：OpenAI公式 | VentureBeat | blog.replit.com

CodexでSora Androidを28日で開発

2025年12月12日 Google OpenAI Sora Android iOS Codex ワークフロー動画生成 GPT-5 エンジニア品質保証動画コーディングコードレビューエージェントコンテキスト

わずか4人のチームが実現した高速リリース

4人のエンジニアがCodexと並走し28日で本番リリース

GPT-5.1-Codexモデルを使用、誰でも利用可能な同バージョン

Play Storeで初日1位、24時間で動画生成100万件超

クラッシュフリー率99.9%の高品質を維持

コード全体の約**85%**をCodexが生成

iOSコードをKotlinへ意味保持で翻訳、クロスプラットフォーム開発を代替

Codexを最大活用するための実践的ワークフロー

AGENT.mdでアーキテクチャ方針を明文化しセッション間の一貫性を確保

まず理解・計画フェーズを経てから実装を依頼する手順が安定稼働の鍵

複数セッションを並列実行し、playback・search・エラー処理を同時進行

大規模タスクでは計画書をファイル保存してコンテキスト超過に対処

コードレビューにもCodexを活用し、マージ前のバグ検出に貢献

ボトルネックはコード執筆からアーキテクチャ判断・フィードバックへ移行

詳細を見る

OpenAIのエンジニアリングチームは、AIコーディングエージェント「Codex」を活用し、SoraのAndroidアプリをわずか28日で開発・グローバルリリースしました。投入したエンジニアはわずか4名であり、従来の開発常識を大きく覆す成果となっています。

使用したモデルはGPT-5.1-Codexの早期版であり、現在は誰でも利用できるバージョンと同一です。リリース初日にGoogle Play Storeで1位を獲得し、Androidユーザーは24時間で100万本以上の動画を生成しました。クラッシュフリー率は99.9%を維持しており、品質面でも従来型の開発プロセスと遜色ありません。

開発全体を通じてコードの約85%をCodexが生成しました。チームはアーキテクチャ設計・依存性注入・ナビゲーション構造などの基盤を自ら実装し、その上でCodexにパターンを学習させる方針を採りました。「動くものを速く作る」のではなく「我々のやり方で動くものを作る」という考え方が成功の核心です。

Codexを安定運用するうえで重要だったのは、AGENT.mdファイルへのスタイルガイドやパターンの明文化です。セッションをまたいで同じ指針を適用できるため、複数の並列タスクが同一のコーディング規約に従って進行しました。

実装前に理解・計画フェーズを設けるワークフローも効果的でした。Codexに関連ファイルを読ませてデータフローを説明させ、チームが認識を修正したうえで設計書を作成し、その計画に沿って実装を指示する手順により、長時間の無監視実行が可能になりました。

また、iOSの既存コードベースをKotlinへ翻訳する作業にもCodexを活用しました。アプリケーションロジックはSwiftでもKotlinでも本質的に同じであり、Codexが意味を保持したまま変換することで、クロスプラットフォームフレームワーク不要の開発スタイルが実現しました。

OpenAIの内部では、Codex自体の開発にもCodexが活用されており、「CodexのほぼすべてがCodexで構築されている」とプロダクトリードが明かしています。AI支援開発はツールの改善にも帰還的に適用される段階に達しています。

今回の事例は、AI支援開発がエンジニアの仕事を省力化するのではなく、アーキテクチャ設計・意思決定・品質管理といった高付加価値の業務に集中させる方向へシフトさせることを示しています。明日のソフトウェアエンジニアに求められるのは、深いシステム理解とAIとの長期的な協働能力です。

出典：OpenAI公式 | Ars Technica

GitHubが提唱するAI自動最適化の新概念

2025年12月12日 OpenAI マイクロソフト GitHub Claude Claude Code Flow Codex ワークフローデザインエンジニア推論エージェントベンチマーク

Continuous Efficiencyとは何か

グリーンソフトウェアとContinuous AIを融合した新概念

コードベースの継続的・自動的な効率改善を目指す取り組み

GitHub NextとGitHub Sustainabilityチームが共同で開発

自然言語（Markdown）でワークフローを記述できる実験的フレームワーク

Claude CodeやOpenAI Codexなど複数のAIエンジンに対応

現在はオープンソースの研究プロトタイプとして公開中

実証された主な活用事例

グリーンソフトウェアルールをコードベース全体に自動適用

RegExp最適化PRがnpm月5億DL超プロジェクトでマージ済み

Web持続可能性ガイドライン（WSG）の自動適用も実施

「Daily Perf Improver」によるFSharp.Control.AsyncSeqのパフォーマンス改善を確認

リポジトリ構造に応じてビルド・ベンチマーク手順を自動推論

マイクロベンチマーク駆動の最適化PRが複数マージ済み

詳細を見る

GitHubは「Continuous Efficiency」と呼ぶ新しいエンジニアリング手法を提唱しました。これはグリーンソフトウェアの知見とContinuous AIを組み合わせ、コードの効率を継続的かつ自動的に改善するアプローチです。

同手法の基盤となるのが「Agentic Workflows」と呼ばれる実験的フレームワークです。エンジニアはYAMLやスクリプトの代わりにMarkdownで意図を記述し、GitHub Actions上でAIエージェントが自律的にタスクを実行します。

グリーンソフトウェアに関しては、月間5億回以上ダウンロードされるnpmパッケージにRegExpのホイスティング最適化を適用し、プルリクエストが承認・マージされました。小さな改善でも、スケールすることで大きな効果をもたらすことが実証されました。

Web持続可能性ガイドライン（WSG）のワークフローでは、GitHubおよびMicrosoftのWebプロパティに対してスクリプト遅延読み込みやネイティブブラウザ機能の活用など複数の改善機会を発見・修正しました。

パフォーマンスエンジニアリングへの応用では、「Daily Perf Improver」が三段階のワークフローを通じてリポジトリのビルド・ベンチマーク手順を自動推論し、FSharp.Control.AsyncSeqで実測可能な改善を実現しました。

AIエージェントは自然言語で記述されたルールを解釈し、コード全体に横断的に適用できます。従来の静的解析やリンターを超えた意味的な汎用性と、PRやコメントとして実装まで行うインテリジェントな修正が特徴です。

現時点では研究デモンストレーター段階であり、変更や誤りが生じる可能性もあります。GitHubはアーリーアダプターやデザインパートナーの参加を呼びかけており、今後さらなるルールセットやワークフローの公開を予定しています。

出典：GitHub公式

Codex、HF Skills連携でOSSモデル訓練可能に

2025年12月11日 OpenAI Claude Claude Code Codex エンジニアファインチューニングインフラコーディングエージェントオープンソースモデル Hugging Face

統合の機能

ファインチューニングとRL整合

トレーニングメトリクスの監視

チェックポイント評価と報告作成

GGUF量子化とHub公開

意義と展望

Claude Codeに続く統合

AGENTS.mdでリポジトリ設定

コーディングエージェントとMLOpsの融合

OSS開発の民主化に貢献

詳細を見る

Hugging Faceが、OpenAIのコーディングエージェント「Codex」にHugging Face Skillsリポジトリを統合しました。先行してClaude Codeで実現された機能に続くもので、Codexがオープンソースモデルの訓練から公開まで一連のMLタスクを実行できるようになります。

HF Skillsにより、Codexは言語モデルのファインチューニング、RL整合の適用、Trackioからのリアルタイムメトリクス監視、チェックポイント評価、実験レポート作成、GGUF量子化、Hugging Face Hubへの公開が可能です。AGENTS.mdファイルによるリポジトリレベルの設定に対応しています。

この統合は、コーディングエージェントとMLOpsプラットフォームの融合における重要な進展です。ソフトウェア開発とML エンジニアリングの壁を低くし、専門的なMLインフラの知識がないチームでもオープンソースモデル開発に取り組める環境の実現に貢献します。

出典：Hugging Face

OpenAI、自律防衛AI「Aardvark」公開　脆弱性を自動修正

2025年12月10日 OpenAI Codex エコシステム GPT-5 専門家推論リスク脆弱性パッチセキュリティエージェント

AIの攻撃・防御能力が急伸

GPT-5.1のCTFスコアが76%に到達

8月の27%から3ヶ月で約3倍に急成長

次期モデルはゼロデイ攻撃可能な水準を想定

自律型セキュリティAIの投入

コード全体の脆弱性を発見し修正パッチを提案

すでにOSSで新規CVEを発見する実績

一部OSSリポジトリには無償提供を計画

安全なエコシステムの構築

専門家によるフロンティア・リスク評議会を設置

防御目的の利用者に信頼されたアクセスを提供

詳細を見る

米OpenAIは2025年12月10日、AIのサイバーセキュリティ能力向上に対応する新戦略を発表しました。同時に、脆弱性を自律的に発見・修正するAIエージェント「Aardvark」のベータ版を公開。最新モデル「GPT-5.1」のCTFスコアが76%に達するなど能力が急伸する中、防御側の体制強化を急ぎます。

最新の評価では、AIのハッキング能力が劇的に向上しています。2025年8月時点で27%だった「GPT-5」のCTF（旗取りゲーム）スコアは、11月の「GPT-5.1-Codex-Max」で76%へと約3倍に跳ね上がりました。同社は次期モデルが未知の脆弱性を突く「ゼロデイ攻撃」も可能な水準に達すると予測しています。

防御力強化の切り札として投入されたのが、自律型セキュリティ研究エージェント「Aardvark」です。コードベース全体を推論して脆弱性を特定し、修正パッチまで提案します。すでにオープンソースソフトウェア（OSS）において新規の脆弱性（CVE）を発見する実績を上げており、一部の非営利OSSには無償提供される計画です。

技術提供に加え、組織的な安全対策も強化します。新たに「フロンティア・リスク評議会」を設置し、外部のセキュリティ専門家と連携してリスク境界を定義します。また、防御目的の研究者や企業に対して、より強力なモデル機能へのアクセス権を付与する「信頼されたアクセスプログラム」の導入も予定しており、エコシステム全体の強化を図ります。

出典：OpenAI公式

Vercel、OpenAI最新「GPT-5.1 Codex Max」対応

2025年12月05日 OpenAI Vercel Codex GPT-5 エンジニア推論コーディング

長時間開発に特化した進化

現実の開発タスクで学習

長時間の文脈維持が可能

従来より高速・高効率

導入と運用のメリット

統一APIで即座に利用

詳細なオブザーバビリティ

自動リトライで障害対策

詳細を見る

Vercelは2025年12月5日、同社のAI GatewayにおいてOpenAIの最新モデル「GPT-5.1 Codex Max」が利用可能になったと発表しました。開発者は個別のプロバイダー契約を結ぶことなく、即座にこの強力なモデルをアプリケーションに統合できます。

特筆すべきは「Compaction」技術による最適化です。現実世界の開発タスクで学習されたこのモデルは、複数の文脈にまたがる長時間のコーディング作業でも、セッションを中断することなく推論と文脈を維持し続けることができます。

性能面でも進化を遂げており、従来のCodexモデルと比較して処理速度とトークン効率が向上しました。AI SDKでモデル名を指定するだけで利用でき、複雑なエンジニアリングタスクの自動化において威力を発揮します。

AI Gatewayを経由することで、開発者は単なるモデル利用にとどまらず、使用量やコストの追跡、自動リトライによる安定性向上といった恩恵を受けられます。企業レベルの信頼性が求められる開発現場にとって、強力な選択肢となるでしょう。

出典：vercel.com

OpenAI新モデル、長時間自律開発で生産性7割増を実現

2025年11月19日 Google OpenAI Gemini ChatGPT Codex 生産性ネットワーク GPT-5 エンジニア推論セキュリティコーディングデバッグリファクタリングエージェントコンテキスト

コンテキスト制限を打破する技術

「コンパクション」で数百万トークンを処理

24時間以上の長時間タスクを自律的に完遂

推論トークンを30%削減しコストを低減

競合を凌駕する圧倒的性能

SWE-benchで77.9%を記録し首位

GoogleのGemini 3 Proを上回る

社内エンジニアのPR出荷数が約70%増加

CLIやIDEなどの開発環境で即利用可能

詳細を見る

OpenAIは2025年11月19日、エージェント型コーディングモデル「GPT-5.1-Codex-Max」を発表しました。数百万トークンの文脈を維持し、長時間にわたる開発タスクを自律遂行可能です。エンジニアの生産性を劇的に高める革新的なツールとして注目されます。

最大の特徴は、新技術「コンパクション」の搭載です。作業履歴を圧縮して記憶を継承することで、コンテキスト制限を克服しました。これにより、大規模なリファクタリングや24時間以上続くデバッグ作業など、従来は不可能だった複雑な長期タスクを完遂できます。

性能面では、Googleの最新モデル「Gemini 3 Pro」を主要指標で上回りました。SWE-bench Verifiedでは77.9%の正答率を記録し、業界最高水準を達成。さらに推論プロセスの最適化によりトークン使用量を30%削減し、コスト効率も向上させています。

ビジネスへの貢献も実証済みです。OpenAI社内ではエンジニアの95%が日常的に利用し、導入後のプルリクエスト出荷数が約70%増加しました。単なる支援ツールを超え、開発速度と品質を底上げする「自律的なパートナー」として機能しています。

本モデルは現在、ChatGPT PlusやEnterpriseプラン等のCodex環境で利用可能で、API提供も近日中に開始されます。デフォルトでサンドボックス環境にて動作し、ネットワークアクセスも制限されるなど、企業が安心して導入できるセキュリティ設計も徹底されています。

出典：OpenAI公式 | OpenAI公式 | VentureBeat

OpenAI、企業顧客100万人突破史上最速で成長

2025年11月05日 OpenAI ChatGPT Codex 生産性 AI活用 GPT-5 画像音声コードレビュー投資 Canva

驚異的な成長スピード

企業顧客数が100万人を突破

史上最速のビジネスプラットフォーム

Enterprise版シート数は前年比9倍

Work版シート数は700万席を突破

生産性を高める新機能群

GPT-5搭載のAgentKitで業務自動化

Codexでコードレビュー時間を半減

マルチモーダル対応で多様な業務へ

企業の75%がプラスのROIを報告

詳細を見る

OpenAIは、法人向けサービスの利用企業が世界で100万社を突破し、史上最速で成長するビジネスプラットフォームになったと発表しました。ChatGPT for Workのシート数も700万席を超え、2ヶ月で40%増と急拡大しています。消費者向けChatGPTの普及を背景に、業務自動化を支援する新ツール群も投入し、企業のAI活用を後押しします。

企業向けサービスの勢いは数字にも表れています。有料の法人顧客は100万人を超え、特に大企業向けのChatGPT Enterpriseのシート数は前年比で9倍に達しました。この成長は、AIが単なる実験的ツールから、事業運営に不可欠な基盤へと移行している現状を明確に示しています。

この急成長の背景には、消費者向けChatGPTの圧倒的な普及があります。週に8億人が利用するサービスに慣れ親しんでいるため、従業員が抵抗なく業務でAIを使い始められます。これにより、企業は導入時の摩擦を減らし、投資対効果（ROI）を早期に実現できるのです。

OpenAIは企業の本格導入を支援するため、新ツール群も発表しました。社内データと連携する「AgentKit」や、コード生成を支援する「Codex」の利用が急増。画像や音声も扱えるマルチモーダル機能も強化し、より幅広い業務での活用を可能にしています。

実際に多くの企業が成果を上げています。ウォートン校の調査では、導入企業の75%がプラスのROIを報告。求人サイトIndeedは応募数を20%増加させ、シスコはコードレビュー時間を半減させるなど、具体的なビジネス価値を生み出しています。

自社ツールへの組み込みも進んでいます。CanvaやShopifyなどがChatGPTと連携し、新たな顧客体験を創出しています。OpenAIは、単なるツール提供者にとどまらず、「仕事のOS」を再定義するプラットフォームとなることを目指しており、その動きは今後さらに加速しそうです。

出典：OpenAI公式

Sora、無料枠超過分の有料販売を開始

2025年10月31日 OpenAI Apple Sora App Store Codex 動画生成クリエイター動画コーディング

有料化の背景と価格

無料モデルは「持続不可能」と判断

パワーユーザーの強い需要に対応

10回の追加生成で4ドル

App Store経由で購入可能

今後の収益化計画

将来的な無料生成枠の削減を示唆

クリエイター向け収益化策を検討

権利者への収益分配も視野に

詳細を見る

動画生成AI「Sora」を開発するOpenAIは、無料の動画生成枠を使い切ったユーザー向けに、追加クレジットの有料販売を開始しました。Soraチームを率いるBill Peebles氏は、現在の無料提供モデルの経済性は「完全に持続不可能」であると指摘。パワーユーザーの旺盛な需要に応えつつ、事業の持続可能性を確保する狙いです。

追加クレジットは、AppleのApp Storeを通じて購入できます。価格は10回の追加生成あたり4ドルに設定されています。ただし、生成する動画の長さや解像度によって消費クレジット数は変動します。購入したクレジットの有効期限は12ヶ月で、OpenAIのコーディングプラットフォーム「Codex」でも利用可能です。

有料化に踏み切った背景には、膨大な計算コストがあります。Peebles氏は「パワーユーザーは現在の無料生成枠に満足していないことは明らかだ」と述べ、有料で必要なだけ生成できる選択肢を提供する必要性を強調しました。これにより、ユーザーは制限を気にすることなく創作活動に打ち込めるようになります。

さらに同氏は、将来的には無料の生成枠を削減する必要があるとも警告しています。「成長に対応するため、いずれ無料生成数を引き下げる必要がある」と述べ、変更がある場合は事前に透明性を持って告知する方針です。現在の寛大な無料枠がいつまで続くか、動向が注目されます。

今回の動きは、Soraを中心としたAIクリエイターエコノミー構築に向けた、より広範な収益化戦略の一環です。OpenAIは近く、クリエイター向けの収益化プログラムを試験的に開始する予定であり、人気キャラクターなどの権利者が利用料を設定できる仕組みも構想しています。

出典：The Verge

独HYGH、ChatGPTで開発爆速化、週2MVP達成

2025年10月10日 OpenAI ChatGPT Codex 生産性 AI活用ワークフロー広告クリエイティブエンジニア創業者インフラドイツ

開発プロセスの革新

MVP開発が月単位から週単位へ

会議録からPRDを自動生成

Codex活用で即時プロトタイピング

インフラ移行計画の工数を削減

全社的な生産性向上

従業員1人あたり週5.5時間を節約

広告モックアップ作成の高速化

毎週のベストプラクティス共有会

売上増、納期短縮を実現

詳細を見る

ドイツのデジタルメディア企業HYGHが、OpenAIのChatGPT Businessを導入し、開発速度とキャンペーン提供のあり方を根本から変革しています。同社はAI活用により、ソフトウェア開発のリードタイムを数ヶ月から数日に短縮。従業員一人あたり週平均5.5時間の労働時間を削減し、週に2つのMVP（実用最小限の製品）をリリースできる体制を構築しました。この取り組みは、生産性と収益性の向上に直結しています。

特に大きな変革を遂げたのが、ソフトウェア開発の現場です。かつては1〜2ヶ月を要したMVP開発は、今や週に2本リリースする驚異的なペースを達成しました。会議の録音から製品要求仕様書（PRD）をAIが自動生成し、開発者はCodexを用いて即座にプロトタイプを構築します。これにより、アイデアから製品化までのサイクルが劇的に短縮されました。

AIの恩恵はクリエイティブ業務にも及びます。広告代理店部門では、これまで時間のかかっていた広告キャンペーンのモックアップ作成が大幅に高速化。ChatGPTが広告コピーやビジュアルの草案を生成することで、顧客への提案速度と選択肢が向上し、チームはより創造的な業務に集中できるようになりました。

同社は全社的なAI活用を推進しています。ChatGPT Businessへの移行により、共有ワークスペースや管理機能、GDPRに準拠したデータ保護が確保されました。共同創業者のアントニウス・リンク氏は「売上は上がり、納期は縮まり、生産性は爆発した」と成果を語ります。この成功は、AIがもたらすビジネスインパクトの大きさを物語っています。

AI活用の文化を根付かせるため、HYGHは毎週「ワークフロー水曜日」と名付けた社内勉強会を開催。従業員が自作の自動化ツールやベストプラクティスを共有し、互いに学び合うことで、組織全体のAIリテラシーが向上しました。特に若手従業員がネイティブにAIを使いこなす姿が、他の社員にも良い刺激を与えているようです。

リンク氏は「AIを使わない企業は取り残されるだろう」と断言します。AIは単なる効率化ツールではなく、アイデアをぶつけ合える『思考のパートナー』であると位置づけています。HYGHの事例は、AIを組織の隅々にまで浸透させることが、企業の競争力をいかに高めるかを示す好例と言えるでしょう。

出典：OpenAI公式

OpenAIの真の主役、Codex正式版が開発を革新

2025年10月09日 OpenAI ChatGPT App Store Codex 生産性ワークフロークリエイティブ GPT-5 エンジニアコーディングコードレビューリファクタリングサム・アルトマン投資エージェント

Codexの進化と能力

GPT-5搭載で自律コーディング

7時間超の長時間タスクも遂行

研究版から製品版へ完全移行

専用SDKでシステム統合が容易

驚異的な生産性向上

OpenAI社内で生産性70%向上

技術スタッフの92%が毎日利用

コードレビュー時間を半減

自社製品の開発もCodexで加速

詳細を見る

OpenAIが年次開発者会議「DevDay 2025」で、AIコーディング支援ツール「Codex」の正式版リリースを発表しました。ChatGPTのアプリストアなど華やかな発表の影に隠れがちですが、これがソフトウェア開発の常識を覆し、企業の生産性を飛躍させる最も重要な一手と見られています。Codexは単なるツールではなく、開発の未来を創るエンジンとなるのでしょうか。

今回の発表の核となるのが、最新モデル「GPT-5-Codex」です。これは単なるコード補完ツールではありません。まるで人間のチームメイトのように振る舞い、複雑なリファクタリング作業を7時間以上も自律的に実行できます。単純なタスクは迅速に、複雑なタスクにはじっくり取り組む「適応的思考」を備え、開発者を強力にサポートします。

その効果はOpenAI社内で実証済みです。技術スタッフの92%が日常的にCodexを利用し、コード貢献度を示すプルリクエスト数は週に70%も増加しました。自社の新製品やクリエイティブツールもCodexを用いて短期間で開発されており、この生産性向上のサイクルこそが、同社の急速なイノベーションの源泉となっているのです。

特にエンタープライズ向けに強化されたのが、コードレビュー機能です。Codexはプログラムの依存関係を深く理解し、人間のレビュアーが見逃しがちな質の高いバグを毎日数百件も発見します。これにより、開発者は品質への自信を深め、手戻りを減らすことができます。これは「より速く、より確実に出荷する」という企業の目標達成に直結します。

Codexの正式版リリースは、OpenAIのエンタープライズ市場攻略戦略の要です。サム・アルトマンCEOも「優れた製品で企業市場を勝ち取ることに大きく注力する」と明言しています。すでにCiscoのような大企業が導入し、コードレビュー時間を半減させるなどの成果を上げており、その実用性は証明されつつあります。

消費者向けのAIがまだ模索を続ける一方で、Codexは今日、企業に具体的なROI（投資対効果）をもたらす「実績あるAIエージェント」としての地位を確立しました。新たに提供されるSDKにより、各社の独自ワークフローへの組み込みも可能になります。Codexは、次世代のソフトウェア開発を静かに、しかし強力に牽引する存在となるでしょう。

出典：VentureBeat

OpenAI「Codex」一般提供開始、Slack連携とSDKで開発を加速

2025年10月06日 OpenAI GitHub Slack ChatGPT Codex 生産性ワークフローエンジニアクラウドコーディングコードレビュー CI/CD スタートアップエージェント

開発を加速する新機能

Slack連携によるタスクの直接委任

Codex SDKで独自のワークフローへ統合

環境制御・監視を行う管理者向けツール追加

CI/CD向けにGitHub Actionsも提供開始

実証された生産性向上

日常利用が8月以降10倍以上に急増

OpenAI社内PRマージ数が週70%増加

Ciscoは複雑なレビュー時間を最大50%削減

Instacartは技術的負債の自動クリーンアップを実現

詳細を見る

OpenAIは、コード生成とレビューを支援するコーディングエージェント「Codex」の一般提供（GA）開始を発表しました。これにより、新たなSlack連携機能やCodex SDKが提供され、開発チームは既存のワークフロー内でAIをシームレスに活用できるようになります。世界中のスタートアップや大企業で採用が進んでおり、開発効率の劇的な向上が期待されています。

Codexは研究プレビュー開始以来、飛躍的に進化し、日常利用は8月上旬から10倍以上に急増しました。OpenAI社内ではほぼ全てのエンジニアが利用しており、プルリクエスト（PR）のマージ数が週70%増加しています。さらに、Codexが自動でPRをレビューし、本番環境に到達する前に重大な問題点を検出するなど、コード品質維持にも貢献しています。

今回のGAにおける目玉は、エンジニアリングワークフローに直接組み込むための「Codex SDK」と「Slack連携」です。SDKを利用すれば、Codex CLIの核となる強力なエージェントを独自のツールやアプリに数行のコードで統合できます。また、Slackから直接Codexにタスクを委任できるため、チームコラボレーションを効率化します。

大規模導入を進める企業向けには、新しい管理者ツールが追加されました。これにより、ChatGPTワークスペース管理者は、クラウド環境の制御、ローカル利用における安全なデフォルト設定の適用が可能になります。加えて、利用状況やコードレビューの品質を追跡するための分析ダッシュボードが提供され、ガバナンスと監視が強化されます。

導入事例として、Ciscoでは複雑なプルリクエストのレビュー時間を最大50%削減し、エンジニアはより創造的な業務に集中できています。また、InstacartではCodex SDKを統合し、ワンクリックでのエンドツーエンドのタスク完了や、デッドコードなどの技術的負債を自動で解消し、コードベース全体のレイテンシ改善に役立っています。

Slack連携およびSDKは、ChatGPT Plus、Pro、Business、Edu、Enterpriseの各プランで利用可能です。管理者向け機能は、企業での利用を想定しBusiness、Edu、Enterpriseプランに限定されています。OpenAIは、Codexを通じて開発者の生産性を根本から変革することを目指しています。

出典：OpenAI公式

GPT-5-Codexが開発生産性を劇的に向上させる理由

エージェント能力の進化

複雑なタスクで最長7時間以上の独立稼働

タスクに応じた思考時間の動的な調整

迅速な対話と長期的な独立実行の両立

実世界のコーディング作業に特化しRL学習を適用

ワークフローへの密着

CLI、IDE拡張機能、GitHubへシームレスに連携

ローカル環境とクラウド間のコンテキスト維持

画像やスクリーンショットを入力可能

品質と安全性の向上

コードレビューの精度が大幅に向上

重大なバグを早期に発見しレビュー負荷を軽減

サンドボックス環境による強固なセキュリティ

詳細を見る

OpenAIは、エージェント型コーディングに特化した新モデル「GPT-5-Codex」を発表し、開発環境Codexを大幅にアップグレードしました。これはGPT-5を実世界のソフトウェアエンジニアリング作業に最適化させたバージョンです。開発者はCLI、IDE、GitHub、ChatGPTアプリを通じて、より速く、信頼性の高いAIアシスタントを活用できるようになります。

最大の進化は、タスクの複雑性に応じて思考時間を動的に調整する能力です。GPT-5-Codexは、大規模なリファクタリングやデバッグなどの複雑なタスクにおいて、最長7時間以上にわたり独立して作業を継続できることが確認されています。これにより、長期的なプロジェクトの構築と迅速なインタラクティブセッションの両方に対応します。

モデルは、既存のコードベース全体を理解し、依存関係を考慮しながら動作検証やテスト実行が可能です。特にコードレビュー機能が強化されており、コミットに対するレビューコメントの正確性と重要性が向上。重大な欠陥を早期に特定し、人間のレビュー工数を大幅に削減します。

開発ワークフローへの統合も一層強化されました。刷新されたCodex CLIとIDE拡張機能（VS Codeなどに対応）により、ローカル環境とクラウド環境間でシームレスに作業を移行できます。コンテキストが途切れないため、作業効率が劇的に向上します。

さらに、Codexは画像やスクリーンショットを入力として受け付けるようになりました。これにより、フロントエンドのデザイン仕様やUIバグなどを視覚的にAIへ共有し、フロントエンドタスクの解決を効率化します。また、GitHub連携によりPRの自動レビューや編集指示も可能です。

安全性確保のため、Codexはデフォルトでサンドボックス環境で実行され、ネットワークアクセスは無効です。プロンプトインジェクションのリスクを軽減するとともに、開発者はセキュリティ設定をカスタマイズし、リスク許容度に応じて運用することが可能です。

出典：OpenAI公式 | OpenAI公式 | TechCrunch

Codex（プロダクト）に関するニュース一覧

Codex（プロダクト）に関するニュース一覧

チップの概要

性能と狙い

今後の展開

対話で旅程を予約

社内のAIネイティブ化

公開された指針

実践のポイント

新サービスの中身

OSS脆弱性に集中投下

新しい利用分析

柔軟な支出管理

性能の成果

仕組み

発表の柱

企業向け強化

自律訓練の仕組み

ENPIREの構成

公開と展望

600億ドル買収

IPO後の急騰

調達と評価額

事業内容

導入の成果

授業後の自動分析

人間とAIの協業

買収の狙い

Codexの利用拡大

新体制と狙い

技術と勝算

規範への支持表明

来歴技術の取り組み

残された課題

技術の仕組み

性能と実用性

研究の壁

AIの活用

今後の展望

大手AI依存からの脱却

競合と差別化戦略

開発プロセスの転換

技術的成果と組織変化

チャットからエージェントへ

IPOと収益化への布石

標準化の狙いと体制

今後のロードマップ

スーパーアプリ構想

戦略転換の背景

試行錯誤と失敗の過程

方針転換と得られた教訓

エージェント対応の設計思想

ベンチマーク結果

導入の経緯と方針

開発手法の変革

今後の展望

ベンチマーク性能の向上

研究ワークフローの拡張

企業向け機能の全容

急成長する非開発者の利用

エンタープライズ戦略の加速

MXCの技術設計

ACSによるガバナンス標準化

エコシステムと企業展開

提供開始の概要

企業導入の狙い

今後の展開

拠点の規模と体制

地域への約束

人材育成投資

評価設計の3類型

5つの妥当性リスク

開発ワークフローの変革

実験コストの低下

実証された成果

自己改善の仕組み

資金調達の概要

事業の成長実績

提携の概要

双方の狙い