Codex(プロダクト)に関するニュース一覧

SpaceX、Cursorを600億ドルで買収提案

買収提案の経緯

Cursor20億ドル調達を直前に中断
SpaceX600億ドル買収オプション提示
不成立でも100億ドルのAI開発協業金

両社の思惑

SpaceXIPO後に買収手続きの意向
Cursor、AI競争激化で独立継続にリスク
SpaceX、AI企業としての評価獲得を狙う
データセンター資源をCursorに提供可能

SpaceXがAIコーディングツールCursorの開発元Anysphereに対し、600億ドル(約9兆円)での買収オプションを提示しました。Cursorは発表のわずか数時間前まで、Andreessen HorowitzNvidia等が参加する20億ドルの資金調達ラウンド評価額500億ドル)のクローズを今週中に予定していました。SpaceXは今年中に買収を実行するか、買収しない場合でもAI開発協業の対価として100億ドルをCursorに支払うとしています。

Cursor資金調達買収交渉を並行して進めていました。20億ドルの調達が実現しても、キャッシュフローの黒字化には不十分で、追加の大型調達が不可避だったとされています。AnthropicClaude CodeOpenAICodexとの競争が激化するなか、巨額の計算資源を確保し続ける独立路線には不確実性が高まっていました。

一方、xAIと合併したSpaceXは、AI分野の強化を急いでいます。GoogleによるWindsurf買収がキーパーソンの獲得を主目的としたのに対し、SpaceXCursorのチーム全体を維持する方針です。ミシシッピ州やテネシー州のデータセンターが持つ膨大な計算能力をCursorに提供できる点も、協業の実質的な価値となります。

SpaceX買収手続きをIPO後に先送りする理由は、上場前の財務開示の更新を避けたいことと、公開株式を買収資金に活用しやすくなることにあります。さらにCursor買収の発表は、SpaceXを宇宙・衛星事業だけでなくAI企業として市場に位置づける狙いがあり、ウォール街が付与する高いバリュエーション倍率の獲得を見込んでいます。

Agentforce Vibes 2.0がコンテキスト肥大化問題に挑む

コンテキスト肥大化の実態

複雑化で文脈量が膨張
トークン増加でコスト・遅延悪化
ノイズ混入で精度が低下
VentureCrowdも導入初期に直面

Salesforceの対策と業界動向

Skills/Abilitiesで文脈を制御
サードパーティ連携を拡充
Claude CodeCodexは自動圧縮型
取捨選択の設計が成否を分ける

AIエージェントの「コンテキスト肥大化(Context bloat)」が、企業導入における隠れた障壁として注目されています。ワークフローが複雑になるほどエージェントに渡すデータや指示が膨張し、トークン消費の増大・処理速度の低下・コスト上昇を引き起こします。オーストラリアスタートアップ投資プラットフォームVentureCrowdは、AIコーディングエージェントでフロントエンド開発サイクルを最大90%短縮した一方、まさにこの問題に直面しました。

VentureCrowdのCPO Diego Mogollon氏は「課題はエージェント自体ではなく、周囲の環境にある。AI問題に見えて実はコンテキスト問題だ」と指摘します。エージェントは実行時にアクセスできるデータを根拠に推論するため、不適切なデータや不明確なプロセスがあると、自信を持って誤った結果を出力してしまいます。

SalesforceAgentforce Vibes 2.0でこの課題に対応しました。新たに導入されたAbilities(目標定義)とSkills(ツール指定)により、エージェントが参照するコンテキストSalesforceのデータモデル内に限定できます。ReActなどサードパーティフレームワークへの対応も拡充され、無料プランから利用可能です。

一方、Claude CodeOpenAI Codexはファイル読み込みやコマンド実行で自律的にコンテキストを拡張し、肥大化時には自動圧縮で対処する設計です。いずれのアプローチもコンテキストの「制限」ではなく「管理」に重点を置いている点は共通しています。

Mogollon氏は「より多くの情報を与えることではなく、何を除外するかが重要だ」と強調します。コンテキストエンジニアリングへの投資と、自社に適した制約手法の選択が、企業のエージェント活用の成否を左右する局面に入っています。

OpenAIがInfosysと提携、Codexを企業向けに展開

提携の概要と狙い

CodexをTopaz AIに統合
ソフトウェア開発・DevOpsが対象
60カ国超の顧客基盤を活用
実験段階から大規模導入へ

業界動向と背景

インドIT大手の株価が年初来22%下落
AI関連売上は四半期約267億円
Codex Labs設立で導入支援を強化
週間400万人超Codexユーザー

OpenAIインドIT大手Infosysと提携し、コーディング支援ツールCodexを含むAIツール群をInfosysのTopaz AIプラットフォームに統合すると発表しました。ソフトウェア開発の近代化、ワークフローの自動化、AIシステムの大規模展開を支援する狙いで、まずはソフトウェアエンジニアリング、レガシーシステムの刷新、DevOps領域に注力します。

この提携はAI企業がグローバルITサービス事業者と組み、大企業でのAI導入を加速させるトレンドの一環です。OpenAIは以前からHCLTechと提携しており、InfosysもAnthropicと同様の契約を結んでいます。OpenAIにとってInfosysの60カ国超にわたる顧客基盤は、エンタープライズ市場への重要な販売チャネルとなります。

インドのIT業界は厳しい局面にあります。クライアント支出の鈍化と生成AIの急速な進化が重なり、Infosysの株価は年初来で22%以上下落しました。従来のアウトソーシング業務がAIに置き換えられるとの懸念や、米国・イランの地政学リスクも影響しています。一方でInfosysはAI事業を積極的に拡大しており、12月四半期のAI関連売上は約250億ルピー(約267億円)に達し、総売上の約5.5%を占めています。

OpenAIは同日、企業向けCodex導入を支援するCodex Labsの設立も発表しました。Accenture、Capgemini、Cognizant、PwC、TCSなど大手ITサービス企業が初期パートナーに名を連ねます。Codexは現在週間アクティブユーザー400万人を超えており、これらのパートナー網を通じてさらなる普及を目指します。金額など契約の詳細は公表されていません。

OpenAI、ChatGPTにチーム共有型AIエージェント機能を追加

機能と設計思想

Codex基盤クラウド実行型
チーム内で共有・改善が可能
Slack連携で自動応答に対応
スケジュール実行や承認制御を搭載

業務適用と展開

営業・経理・IT審査など実用例多数
GPTsからの移行パスを提供
5月6日からクレジット課金開始
管理者向け監視・制御機能を装備

OpenAIは2026年4月22日、ChatGPTの有料ビジネスプラン向けに「ワークスペースエージェント」機能をリサーチプレビューとして公開しました。従来のGPTsを発展させた位置づけで、Codexをエンジンとしてクラウド上で自律的にタスクを実行します。チーム内で共有でき、レポート作成やリード対応、ベンダー審査といった反復的な業務ワークフローを自動化できます。

エージェントSlackやメール、CRMなど外部ツールと連携し、スケジュール実行やイベント駆動で動作します。機密性の高い操作には承認ステップを設定でき、管理者はコンプライアンスAPIを通じてエージェントの構成や実行履歴を監視できます。ロールベースのアクセス制御により、組織全体での安全な運用を実現しています。

構築はChatGPT上の対話型ビルダーで行い、自然言語でワークフローを記述するとエージェントが自動生成されます。テンプレートも用意されており、営業・マーケティング・財務などの領域ですぐに利用を開始できます。エージェントは使用を重ねるほど改善され、チームの暗黙知を再利用可能なワークフローに変換する設計です。

OpenAIの社内でも営業チームがコールメモからのリード評価やフォローアップメール作成に活用しており、週5〜6時間の手作業が自動化された事例が報告されています。The Vergeは、AnthropicClaude CoworkやOpenClawなどAIエージェント市場の競争激化を指摘しています。ワークスペースエージェントは5月6日まで無料で、以降はクレジットベースの課金に移行する予定です。

OpenAI、Responses APIにWebSocket対応を追加

高速化の仕組み

永続接続で会話状態を再利用
トークン再レンダリングを省略
安全性チェックを差分のみに限定

導入効果

エージェント処理が最大40%高速化
GPT-5.3で1,000TPS超を達成
CodexCursor・Clineが即座に採用
推論高速化の恩恵をユーザーへ直結

OpenAIは2026年4月22日、Responses APIにWebSocketモードを正式導入したと発表しました。従来のHTTPベースでは、エージェントがツール呼び出しのたびに会話履歴全体を再送信する必要があり、推論速度が向上してもAPIのオーバーヘッドがボトルネックになっていました。WebSocketによる永続接続でこの構造的課題を解消し、エージェントのエンドツーエンド処理を最大40%高速化しています。

技術的には、WebSocket接続のライフタイム内で前回のレスポンス状態をインメモリにキャッシュする設計です。後続リクエストがprevious_response_idを指定すると、サーバーはキャッシュから状態を取得し、トークンの再レンダリングやモデル解決ロジックの再実行を省略します。安全性分類器やバリデーターも差分入力のみを処理するよう最適化されました。

開発の背景には、コーディングエージェントCodex向けの高速モデルGPT-5.3-Codex-Sparkの存在があります。同モデルは専用のCerebrasハードウェア上で1,000TPS超の推論速度を実現しますが、従来のAPI構造ではCPU側の処理がGPUの速度に追いつかない状態でした。WebSocketモードの導入により、本番環境で1,000TPSの目標を達成し、バースト時には4,000TPSも記録しています。

既にVercel AI SDK、Cline、Cursorなど主要な開発ツールがWebSocketモードを統合済みです。Vercelは最大40%、Clineは39%、Cursorは最大30%のレイテンシ改善を報告しています。既存のResponses APIと同じリクエスト・レスポンス形式を維持しているため、開発者はインテグレーションを大幅に書き換えることなく移行できる点も普及を後押ししています。

OpenAIはWebSocketモードを、2025年3月のResponses APIローンチ以来最も重要な機能追加と位置づけています。モデルの推論速度が急速に向上する中、APIインフラ側の最適化がユーザー体験に直結する時代に入ったことを示す事例といえます。

OpenAI、Codex Labs設立で企業導入を加速

急拡大する利用実績

週間利用者が4百万人突破
Virgin AtlanticやCiscoなど大手が採用
コーディング以外の業務にも用途拡大

企業展開の新体制

Codex Labs設立で導入支援を本格化
Accentureら大手SIer7社と提携
パイロットから本番運用への移行を支援

OpenAIは2026年4月21日、コーディングエージェントCodex」の企業導入を加速するため、新プログラム「Codex Labs」を立ち上げたと発表しました。あわせて大手グローバルシステムインテグレーター(GSI)7社との提携も公表し、世界中の企業へのCodex展開を本格化します。

Codexの週間利用者数は4月初旬の300万人から、わずか2週間で400万人超に急増しています。個人開発者だけでなく、Virgin Atlanticはテストカバレッジ向上と技術的負債の削減に、Rampはコードレビューの高速化に、Ciscoは大規模リポジトリの横断的な分析にCodexを活用しています。さらにNotionは新機能開発、Rakutenはインシデント対応にも導入しています。

Codex Labsは、OpenAI専門家が企業に直接入り込み、ハンズオンワークショップや実務セッションを通じてCodexの導入を支援するプログラムです。どの業務にCodexが適合するかの特定から、既存ワークフローへの統合、反復的な運用体制の構築までをカバーします。

提携先のGSIにはAccenture、Capgemini、CGI、Cognizant、Infosys、PwC、TCSの7社が名を連ねています。各社はCodexの高価値なユースケースの特定とデプロイを支援し、パイロットから本番環境への移行を後押しします。GSI各社自身もCodexを社内で活用し、顧客への展開ノウハウを蓄積しています。

Codexの用途はコーディングにとどまらず、ブラウザ操作やドキュメント作成、複数ツール横断の情報整理といったナレッジワーク領域にも広がっています。OpenAIエンジニアリング部門だけでなく、あらゆる部門の生産性向上を見据えた企業全体での活用を推進する方針です。

OpenAIがChatGPT Images 2.0を公開、推論と多言語テキスト生成を統合

推論統合による画像生成

Oシリーズ推論機能を統合
Web検索で最新情報を反映
1プロンプト最大8枚同時生成
キャラクターの一貫性を維持

テキスト描画と多言語対応

英語テキストの高精度レンダリング
日中韓含む非ラテン文字に対応
インフォグラフィックや漫画を生成
2K解像度と柔軟なアスペクト比

提供体系と競争環境

全ユーザーに基本機能を無料開放
有料プランでThinking機能を提供
GoogleMicrosoftとの競争が激化

OpenAIは2026年4月21日、ChatGPT Images 2.0を全世界のChatGPTおよびCodexユーザー向けに公開しました。今回のアップデートでは、同社のOシリーズ推論機能が画像生成に統合され、プロンプトに対してモデルがWeb検索やレイアウト設計を行ったうえで画像を生成する「エージェント型」のアプローチが導入されています。知識のカットオフは2025年12月に更新されました。

最大の技術的進歩は、テキスト描画の精度向上です。かつてAI画像生成の弱点とされていた文字の崩れが大幅に改善され、メニューや雑誌の表紙、科学図表など密度の高い構成でも正確な文字を生成できるようになりました。さらに日本語、韓国語、中国語、ヒンディー語、ベンガル語など非ラテン文字の描画にも対応しています。ただし非英語言語では一部不正確な出力も報告されており、今後の改善が期待されます。

機能面では、1つのプロンプトから最大8枚の画像を同時に生成でき、キャラクターやオブジェクトの一貫性を保持したまま漫画のシーケンスやソーシャルメディア用グラフィックの作成が可能です。解像度は最大2Kに対応し、アスペクト比は横長の3:1から縦長の1:3まで柔軟に設定できます。アーキテクチャは「ゼロから刷新」されたとのことですが、拡散モデルか自己回帰モデルかは非公開です。

提供体系は3層構造で、無料ユーザーには基本モデルを開放し、PlusおよびProユーザーにはWeb検索や複数画像生成を含むThinking機能を提供します。API向けにはgpt-image-2モデルが公開され、4K解像度のベータ版も用意されています。前モデルのGPT-Image-1.5はデフォルトから外れましたが、APIでのレガシーサポートは継続します。

競合環境では、GoogleNano Banana 2MicrosoftのMAI-Image-2がすでに市場に投入されており、画像生成AIの性能競争は一段と激しさを増しています。OpenAIは安全対策として、AI生成画像への透かし付与や選挙干渉防止のポリシーを堅持する姿勢を示しました。企業ユーザーにとっては、単なる画像生成ツールから「視覚的な情報整理システム」への転換点となる可能性があります。

Kimi K2.6が数日間稼働するAIエージェントを実現

長時間エージェントの実力

最長5日間の自律稼働を実証
300サブエージェント・4000ステップ同時実行
SySYコンパイラを10時間で構築
8年物のOSSコードを13時間で刷新

オーケストレーションの課題

既存フレームワークは短時間前提の設計
状態管理とロールバックが未整備
ガバナンスが導入速度に追いつかず
エージェント専用インフラの概念が未成熟

中国のAIスタートアップMoonshot AIは2026年4月、新モデルKimi K2.6を発表しました。同モデルは長時間にわたり自律的に稼働するAIエージェントを想定して設計されており、社内テストでは最長5日間の連続実行に成功しています。モデルはHugging Face、API、Kimi Codeなどを通じて公開されました。

Kimi K2.6の特徴は、独自の「Agent Swarms」アーキテクチャにあります。最大300のサブエージェントが4000ステップを同時に処理でき、事前定義された役割ではなくモデル自身がオーケストレーションを判断します。AnthropicClaude CodeOpenAICodexも長時間エージェントを模索していますが、K2.6はより動的な制御を目指しています。

実証実験では、SySYコンパイラを10時間で一から構築し、140件の機能テストをすべて通過しました。Moonshot AIはこれを「エンジニア4人が2カ月かかる作業に相当する」と説明しています。また、8年間運用されたオープンソースの金融マッチングエンジンの改修では、13時間で12の最適化戦略を試行し、1000回以上のツール呼び出しで4000行超のコードを修正しました。

一方、長時間稼働するエージェントは既存のオーケストレーション基盤の限界を露呈させています。大半のフレームワークは数秒から数分の実行を前提に設計されており、環境変化に応じた状態管理や障害時のロールバックが十分に整備されていません。専門家は「エージェントランタイム」「エージェントゲートウェイ」「エージェントメッシュ」といった新たなインフラ概念の必要性を指摘しています。

セキュリティ企業ArmorCodeのMark Lambert氏は、AIエージェントがコードやシステム変更を生成する速度が組織のレビュー能力を超えつつあると警告しています。F5のKunal Anand氏も、エージェントが「永続的インフラ」として機能する時代に入ったと述べ、APIゲートウェイのパターン自体が目標やワークフローを理解する形へ進化する必要があると指摘しました。

Hyattが全従業員にChatGPT Enterprise導入

導入の概要と狙い

全社的にChatGPT Enterprise展開
GPT 5.4Codexを利用可能
手作業削減で接客時間を確保
OpenAIと連携し研修も実施

活用される部門と効果

財務の決算・分析業務を加速
マーケティングのコンテンツ制作効率化
開発チームの生産性向上
顧客体験のパーソナライズ強化

Hyatt Hotelsは、OpenAIChatGPT Enterpriseを全世界の本社およびホテル従業員に展開したことを発表しました。従業員はGPT 5.4Codexなど最先端のAI機能にアクセスでき、手作業の削減により顧客対応に集中できる環境を整備します。

今回の導入は、財務、マーケティング、事業開発、プロダクト・エンジニアリング、カスタマーエクスペリエンスなど多岐にわたる部門を対象としています。財務部門では月次・四半期決算の迅速化や財務分析の精度向上が期待され、マーケティング部門ではコンテンツ制作の大規模化ブランド一貫性の強化に活用されます。

導入にあたりHyattはOpenAIと緊密に連携し、ライブ研修やオンボーディングセッションを実施しています。従業員が日常業務にAIをスムーズに統合できるよう支援体制を整えており、ChatGPTアプリとの連携など新たなAI体験の構築も進めています。

Hyattの取り組みは、Accenture、Walmart、Morgan Stanleyなど大手企業によるOpenAI採用の流れに続くものです。OpenAIのビジネス顧客は全世界で100万社を超えており、ホスピタリティ業界におけるAI活用の拡大を象徴する事例といえます。

OpenAI幹部3人が同日退社、事業集約で科学・動画部門を整理

相次ぐ幹部の退社

Kevin Weilが科学部門ごと退社
Sora責任者Bill Peeblesも離脱
エンタープライズCTOも同日退社を発表

戦略転換の背景

Soraは日次100万ドルの損失で先月終了
科学研究ツールPrismも廃止しCodexに統合
IPO準備に向けコーディングと法人向けに集中

組織の混乱と再編

Fidji Simoの医療休暇で経営陣が再編
Altmanが「混沌」を認め安定運営を表明

OpenAIで4月17日、Kevin Weil(科学部門VP・元CPO)、Sora責任者のBill Peebles、エンタープライズ担当CTOのSrinivas Narayananの3人が同日に退社を発表しました。OpenAIが「サイドクエスト」と呼ぶ周辺事業の整理を進める中での離脱で、同社の戦略転換を象徴する動きです。

Weilが率いたOpenAI for Scienceは他の研究チームに分散され、科学者向けAIワークスペースPrismは廃止されます。Prismの機能はCodexデスクトップアプリに統合される計画です。Weilの退社は、彼のチームが生命科学向けモデルGPT-Rosalindを発表したわずか翌日のことでした。

AI動画ツールSoraは1日あたり推定100万ドルの計算コストが発生しており、先月サービスを終了しています。責任者だったPeeblesは退社に際し、Soraが業界全体のAI動画投資を加速させた意義を強調しつつ、「エントロピーを育むことが研究機関の長期的成長に不可欠だ」と述べました。

OpenAIはエンタープライズ向けサービスとコーディングツールに経営資源を集中し、ChatGPTを「スーパーアプリ」化する構想を推進しています。年内のIPO申請も視野に入れており、Anthropicなど競合との激化する競争に対応する狙いがあります。

こうした動きは、Fidji Simoの医療休暇、Brad Lightcapの特別プロジェクト異動、Kate Rouchの休職など、一連の経営陣再編の延長線上にあります。Sam Altman CEOは自身のブログで「極度に激しく混沌とした数年間だった」と認め、より予測可能な運営体制への移行を示唆しています。

AIコーディングのCursor、評価額500億ドルで20億ドル調達へ

資金調達の概要

評価額500億ドルで交渉中
Thrive・a16zが主導の見込み
NvidiaやBattery Venturesも参加か
前回の293億ドルからほぼ倍増

急成長する事業基盤

2026年末ARR60億ドル超を予測
独自モデルで粗利益黒字化を達成
法人向けは黒字、個人向けは赤字継続
Claude CodeCodexと競合激化

AIコーディングツールを手がけるCursorが、少なくとも20億ドルの新規資金調達に向けた交渉を進めていることが、事情に詳しい複数の関係者への取材で明らかになりました。既存投資家のThrive CapitalとAndreessen Horowitzがリードする見込みで、評価額は新規資金注入前の時点で500億ドルに達するとされています。

今回の調達が実現すれば、2025年11月に実施した前回ラウンドの293億ドルからわずか半年で評価額がほぼ倍増することになります。新たな投資家としてBattery Venturesの参加が見込まれるほか、戦略的投資家であるNvidiaも出資する可能性があると報じられています。ラウンドはすでにオーバーサブスクライブの状態ですが、最終条件は確定していません。

Cursorは2026年末までに年間経常収益(ARR)60億ドル超を見込んでおり、2026年2月時点のARR20億ドルから約3倍の成長を想定しています。従来はサードパーティモデルへの依存により粗利益率がマイナスでしたが、2025年11月に投入した独自のComposerモデルや、中国発の低コストモデルKimiの活用により、わずかながら粗利益の黒字化を達成しました。

競合環境は厳しさを増しています。AnthropicClaude CodeOpenAICodexなど、モデル提供元自身がコーディングツール市場に参入しており、Cursorは自社のサプライヤーに置き換えられるリスクに直面しています。独自モデルの開発を加速させることで差別化を図る戦略ですが、大企業向けでは黒字を確保する一方、個人開発者向けアカウントでは依然として赤字が続いており、収益構造の改善が今後の課題です。

Salesforce、全機能をAPI化する「Headless 360」発表

Headless 360の全容

全機能をAPI・MCP・CLIで公開
100超の新ツールを即日提供
ReactによるUI開発に対応

AIエージェント基盤の整備

Agent Scriptをオープンソース化
静的・動的グラフの統一ランタイム
従量課金モデルへ移行

オープン戦略と今後

OpenAIAnthropic等の主要モデル統合
AgentExchangeに5000万ドル投資

Salesforceは2026年4月16日、サンフランシスコで開催した年次開発者会議TDXにて、プラットフォームの全機能をAPI・MCPツール・CLIコマンドとして公開する「Headless 360」構想を発表しました。AIエージェントがブラウザを開くことなくシステム全体を操作できるようにする、同社27年の歴史で最も大規模なアーキテクチャ刷新です。

即日利用可能な100以上の新ツールには、60超のMCPツールと30超のコーディングスキルが含まれ、Claude CodeCursorCodexなどの外部コーディングエージェントからSalesforce組織全体にアクセスできます。さらにReactによるフロントエンド開発にも対応し、Lightning以外の選択肢を開発者に提供しています。Agentforce Experience Layerにより、Slack・Teams・ChatGPTなど複数のサーフェスへ一度の定義でデプロイが可能になりました。

エージェントの信頼性確保に向けては、新たなドメイン固有言語「Agent Script」をオープンソースで公開しました。これは決定論的な制御とLLMの柔軟性を両立させるもので、顧客向けには静的グラフで厳密に制御し、社内向けには動的グラフで自律的に推論させる、2つのアーキテクチャを同一ランタイム上で実現します。テストセンターやA/Bテスト APIなど、ライフサイクル管理ツール群も整備されました。

プラットフォームの開放戦略として、OpenAIAnthropicGoogle GeminiMeta LLaMAMistral AIのモデルを統合し、AgentExchangeマーケットプレイスには5000万ドルの投資枠を設定しています。一方でEVPのGovindarjan氏はMCPの将来について「正直なところ確信はない」と率直に述べ、API・CLI・MCPの3方式すべてを提供する方針を示しました。

収益モデルも従来のシート課金から消費ベースの課金へ移行します。AIエージェントが業務を担う時代には、ユーザー数ではなく利用量に応じた課金が合理的だという判断です。SaaS業界全体がAIによる既存モデルの陳腐化を懸念する中、Salesforceは自らのプラットフォームを解体・再構築することで、エージェント時代のインフラとしての地位を確立しようとしています。

RobloxのAIアシスタントにエージェント機能追加

計画から実装まで支援

Planning Modeで意図を対話的に具体化
コード分析と質問で計画を自動作成
計画に沿いAIが自動でゲーム構築

3D生成と自動テスト

テクスチャ付き3Dメッシュの即時生成
プロシージャルモデルで編集可能な3D作成
自動プレイテストでバグ検出・修正
複数エージェントの並列実行も開発中

Robloxは2026年4月16日、ゲーム開発向けAIアシスタントRoblox Assistant」に新たなエージェント機能を導入したと発表しました。従来のプロンプト一発型ではなく、計画・構築・テストの全工程でクリエイターと協働する仕組みへと刷新されています。同社はTechCrunchへの独占取材で詳細を明らかにしました。

中核となる「Planning Mode」は、Assistantを対話型の開発パートナーに変える機能です。ゲームのコードやデータモデルを分析したうえで明確化のための質問を行い、プロンプトを編集可能なアクションプランに変換します。クリエイターは実装前にプランを微調整でき、意図が正確に反映されているか確認できます。

新たに発表された「Mesh Generation」と「Procedural Model Generation」も注目の機能です。Mesh Generationはテクスチャ付きの3Dオブジェクトをゲーム内に直接生成でき、開発初期のプレースホルダー作成を大幅に効率化します。Procedural Modelsはコードとプロンプトで編集可能な3Dモデルを作成し、本棚の段数や階段の高さなどの属性を動的に調整できます。

テスト工程もエージェント化されています。Planning Modeの実行中、AIはプレイテストツールを使ってログ読み取り・スクリーンショット撮影・キーボードやマウス入力によるデザイン確認を行い、バグを発見するとAssistantにフィードバックして自動修正します。この自己修正ループにより、実行を重ねるほど精度が向上する仕組みです。

今後の計画として、複数AIエージェントの並列稼働、クラウドでの長時間ワークフロー実行、より現実的なゲームキャラクターの生成を開発中です。ClaudeCursorCodexなどサードパーティツールとの連携も予定されており、Roblox Studioの開発環境がさらに拡張される見込みです。

OpenAI、Codexにデスクトップ操作や画像生成を追加

主要な新機能

バックグラウンドでアプリ操作
画像生成モデルを統合
アプリ内ブラウザでフロントエンド開発
90以上の新プラグイン追加

開発者体験の進化

記憶機能で過去の操作を学習
自動化タスクのスケジュール実行
複数エージェントの並列動作

競争と展開

Claude Code対抗で機能拡充

OpenAIは2026年4月16日、開発者向けツールCodexの大規模アップデートを発表しました。週間300万人が利用するCodexに、デスクトップアプリのバックグラウンド操作画像生成、アプリ内ブラウザなどの機能を追加します。コーディング専用ツールから「スーパーアプリ」を目指す総合的な開発環境への転換を図ります。

最大の目玉はComputer Use」機能です。macOSユーザー向けに先行提供され、Codexが独自のカーソルでデスクトップ上のあらゆるアプリを操作できるようになります。ユーザーが別のアプリで作業を続けている間も、複数のエージェントがバックグラウンドで並列に動作します。OpenAICodex責任者Thibault Sottiauxは「Codexを起点にスーパーアプリを構築している」と戦略を明言しました。

画像生成モデルgpt-image-1.5の統合により、モックアップやゲームアセットをコーディングと同じワークフロー内で作成できます。さらに90以上の新プラグインが追加され、CircleCIやGitLab、Microsoft Suiteなど開発者が日常的に使うツールとの連携が強化されました。SlackGmailNotionなど複数アプリの情報を一括で取得し、優先度順に提示する機能も備えます。

プレビュー版として提供される「Memory」機能では、過去のセッションで得た好みや修正履歴を記憶し、次回以降のタスクを効率化します。「Heartbeat Automations」により、Codexは自らタスクをスケジュールし、数日から数週間にわたる長期作業を自動で継続できるようになりました。毎朝のデイリーブリーフ機能では、Google DocsやSlackの未対応事項を整理して提示します。

今回のアップデートは、Anthropicとの競争激化を背景としています。Claude Codeが企業利用で支持を集めるなか、OpenAICodexの機能拡充で巻き返しを狙います。バックグラウンド操作はmacOS限定で提供開始され、Windows版は基本機能のみ対応です。パーソナライゼーション機能のEnterprise・Edu・EU・UK向け提供は後日予定となっています。

OpenAIが生命科学特化モデルGPT-Rosalindを発表

モデルの性能と特徴

生物学ワークフロー50種に最適化
BixBenchで公開モデル最高性能
RNA予測で人間専門家の95%超え
タンパク質工学・ゲノミクスに対応

研究エコシステムの構築

Codex用プラグインをGitHubで公開
50以上の公開データベースと連携
米国の認定企業に限定提供
プレビュー期間はクレジット無償

2026年4月16日、OpenAIは生命科学研究に特化した推論モデルGPT-Rosalindを発表しました。DNA構造の解明に貢献した化学者ロザリンド・フランクリンにちなんで命名されたこのモデルは、創薬やゲノミクス、タンパク質工学などの科学ワークフローに最適化されており、仮説生成から実験計画まで研究の初期段階を加速することを目的としています。

性能評価では、バイオインフォマティクスベンチマークBixBenchで公開スコアを持つモデル中最高の成績を記録しました。LABBench2ではGPT-5.4を11タスク中6タスクで上回り、特に分子クローニングプロトコルの設計タスクCloningQAで顕著な向上を示しています。さらにDyno Therapeuticsとの共同評価では、未公開RNA配列の予測タスクで人間専門家の95パーセンタイルを超える結果を達成しました。

OpenAIは同時にCodex向けLife Sciences研究プラグインGitHubで無償公開しました。このプラグインは50以上の公開マルチオミクスデータベースや文献ソースに接続し、タンパク質構造の検索や配列解析、文献レビューなど日常的な研究ワークフローを統合する仕組みです。Amgen、Moderna、Allen Institute、Thermo Fisher Scientificなどが初期パートナーとして参加しています。

GPT-Rosalindは現在、米国の認定エンタープライズ顧客に限定したリサーチプレビューとして提供されています。アクセスには有益な研究目的、適切なガバナンス体制、企業レベルのセキュリティ管理が求められ、プレビュー期間中はクレジットを消費しない方針です。OpenAIはロスアラモス国立研究所との共同研究も進めており、AI誘導によるタンパク質・触媒設計の探索を含め、生命科学モデルシリーズの長期的な拡充を予定しています。

MozillaがセルフホストAIクライアントThunderboltを発表

製品の概要と特徴

自社運用型のAIクライアント
Haystack基盤の柔軟な構成
複数AIモデルとAPI互換

企業向けの安全設計

ローカルSQLiteでデータ保持
エンドツーエンド暗号化に対応
デバイス単位のアクセス制御
クラウド非依存の完全自社管理

Mozillaは2026年4月16日、企業向けの新しいAIクライアントThunderboltを発表しました。クラウドベースのサードパーティサービスに依存せず、自社インフラ上でAIを運用したい企業や個人に向けた製品です。Firefoxブラウザで知られるMozillaが、独自のAIモデルやエージェントブラウザではなく、フロントエンドクライアントという形でエンタープライズAI市場に参入しました。

Thunderboltは、オープンソースのAIフレームワークHaystackの上に構築されています。Haystackはユーザーが選んだコンポーネントからカスタムのAIパイプラインを構築できるモジュラー型のフレームワークで、Thunderboltはその上で動作する「ソブリンAIクライアント」として位置づけられています。ACP互換エージェントOpenAI互換APIに接続でき、ClaudeCodexDeepSeekなど主要なモデルとの連携が可能です。

企業データとの統合もThunderboltの大きな特徴です。オープンプロトコルを通じてローカルに保存された企業データにアクセスし、オフラインのSQLiteデータベースをモデルが参照する「信頼できる情報源」として活用できます。ローカル実行モデルと組み合わせることで、AIスタック全体を自社で管理できる仕組みです。

セキュリティ面では、オプションのエンドツーエンド暗号化とデバイスレベルのアクセス制御を提供しています。データ漏洩を懸念する企業にとって、外部プロバイダーへのデータ送信を排除できる点は大きな訴求力となるでしょう。Mozillaのブランド力とオープンソースの実績を背景に、プライバシー重視のAI導入という新たな選択肢を企業に提示しています。

OpenAI、サイバー防御向け専用モデルを提供開始

TACプログラム拡大

数千人規模の個人防御者へ開放
数百チームの重要インフラ防御組織が対象
本人確認による段階的アクセス制御
chatgpt.com/cyberから個人登録可能

GPT-5.4-Cyberの特徴

防御用途向けにファインチューニング
バイナリリバースエンジニアリング機能搭載
正当な脆弱性研究への制限を緩和
限定的・段階的なデプロイで提供開始

サイバー防御戦略の全体像

Codex Securityで3,000件超の重大脆弱性を修正
1,000以上のOSSプロジェクトに無料スキャン提供

OpenAIは2026年4月14日、サイバー防御者向けの信頼アクセスプログラム「Trusted Access for Cyber(TAC)」を大幅に拡大し、数千人の認証済み個人防御者と数百の重要ソフトウェア防御チームに開放すると発表しました。同時に、防御的サイバーセキュリティ用途に特化してファインチューニングした新モデル「GPT-5.4-Cyber」の提供を開始します。

GPT-5.4-Cyberは、GPT-5.4をベースにサイバーセキュリティの正当な業務に対する制限を緩和したモデルです。最大の特徴は、ソースコードなしでコンパイル済みソフトウェアのマルウェア分析や脆弱性調査を行えるバイナリリバースエンジニアリング機能を備えている点です。デュアルユースのリスクがあるため、審査済みのセキュリティベンダーや研究者に限定して段階的に展開されます。

TACプログラムへのアクセスは明確な手順で設計されています。個人ユーザーはchatgpt.com/cyberで本人確認を行うことで登録でき、企業はOpenAIの担当者を通じてチーム単位でのアクセスを申請します。承認されたユーザーは、デュアルユースのサイバー活動に関する安全制限が緩和されたモデルを利用でき、さらに上位のアクセス階層としてGPT-5.4-Cyberの利用を希望することも可能です。

OpenAIのサイバーセキュリティ戦略は、アクセスの民主化、反復的デプロイエコシステムの回復力という3つの原則に基づいています。同社はGPT-5.2から段階的にサイバー特化の安全訓練を拡充してきました。GPT-5.4は準備態勢フレームワークで「高」サイバー能力に分類されており、モデル能力の向上に合わせて防御も拡大する方針を掲げています。

実績面では、半年前にプライベートベータで開始したCodex Securityがコードベースの自動監視と修正提案を行い、3,000件超の重大・高リスク脆弱性の修正に貢献しています。また、1,000以上のオープンソースプロジェクトに無料セキュリティスキャンを提供する「Codex for Open Source」や、総額1,000万ドルのサイバーセキュリティ助成プログラムも展開しており、防御者コミュニティの強化を多面的に進めています。

Claude性能低下疑惑が拡散、Anthropicは否定

ユーザー側の主張

AMD幹部が詳細な分析を公開
推論深度の低下をログで実証と主張
BridgeBenchスコア急落の報告
AI値下げ詐欺」との批判拡大

Anthropicの反論

モデル自体の劣化を明確に否定
思考量デフォルト変更が原因と説明
キャッシュTTL変更も意図的と回答
ユーザー体感と製品設定の認識差

Anthropicの主力モデルClaude Opus 4.6およびClaude Codeの性能が低下しているとの苦情が、GitHub、X、Redditで急速に拡散しています。きっかけとなったのは、AMDのAI部門シニアディレクターであるStella Laurenzo氏が4月2日に投稿した詳細な分析です。同氏は約6,800件のセッションファイルと約1万8,000件の思考ブロックを調査し、2月以降に推論の深さが著しく低下したと主張しました。

この投稿はXで拡散され、開発者のOm Patel氏による「67%の性能低下」という投稿や、BridgeMindのベンチマークで精度が83.3%から68.3%に下落したとする報告も加わり、「AIシュリンクフレーション(値下げ詐欺)」という表現とともに大きな議論を呼びました。

これに対しAnthropic側は、モデル自体の品質低下を明確に否定しています。Claude Codeの責任者Boris Cherny氏は、2月に導入した適応型思考のデフォルト化と3月のエフォートレベルの中程度への変更が主因だと説明しました。思考表示の変更はUIレベルのもので、実際の推論能力には影響しないとしています。

ベンチマーク結果についても外部の研究者Paul Calcraft氏が反論し、比較された2回のテストはタスク数が6問と30問で異なり、共通タスクでの精度差はわずか2.2ポイントに過ぎないと指摘しました。BridgeBenchの投稿にはコミュニティノートも付されています。

一方で、Anthropicは3月下旬にピーク時間帯のセッション制限を厳格化し、プロンプトキャッシュのTTLも5分間に変更するなど、実際に複数の運用変更を行っていたことは認めています。これらの変更がユーザー体験に影響を与えたことは否定できず、モデル品質への信頼が揺らいでいる状況です。

競合のOpenAICodEx強化やChatGPT Pro新プランの投入で攻勢をかける中、Anthropicにとってパワーユーザーとの信頼関係の修復は喫緊の課題となっています。同社はエフォートレベルの手動切り替えやキャッシュ制御の環境変数公開などで対応を進めていますが、ユーザーの不満が収まるかは不透明です。

OpenAIモデルがCloudflare Agent Cloudで利用可能に

提携の概要

GPT-5.4含む最新モデル提供
数百万企業が即座にアクセス可能
Agent Cloud上でエージェント構築

開発者向け機能

CodexハーネスがGA公開
Cloudflare Sandboxで安全に実行
Workers AIでエッジ推論を実現
顧客対応や報告書生成を自動化

OpenAIのフロンティアモデルが、Cloudflareの新プラットフォーム「Agent Cloud」で利用可能になりました。GPT-5.4を含む最新モデルに数百万のCloudflare顧客が直接アクセスでき、企業向けAIエージェントの構築・展開が大幅に簡素化されます。

Agent Cloudは、Cloudflare Workers AI上で動作するプラットフォームです。企業はOpenAIモデルを活用して、顧客対応の自動化、システム更新、レポート生成などを行うエージェントを、セキュアな本番環境で展開できます。エッジコンピューティングにより、グローバル規模でのリアルタイム処理が可能です。

開発者向けツールとしては、OpenAICodexハーネスがCloudflare Sandboxesで一般提供を開始しました。Sandboxesはアプリケーションの構築・実行・テストを安全に行える仮想環境で、近日中にWorkers AIでも利用可能になる予定です。

CloudflareのCTOであるDane Knecht氏は、「OpenAIの強力なモデルをCloudflare環境に直接統合することで、知能とエンドユーザーの距離を縮める」と述べています。OpenAI側のRohan Varma氏も、クラウドエージェントが業務の基盤となりつつあると強調しました。

OpenAIはすでにAccenture、Walmart、Morgan Stanleyなど大手企業にサービスを提供しており、APIは毎分150億トークン以上を処理しています。Codexの週間アクティブユーザーは300万人に達しており、今回のCloudflare連携により企業向けAI導入がさらに加速すると見られます。

OpenAI内部メモ流出、エンタープライズ戦略でAnthropicを名指し批判

プラットフォーム統合戦略

単一製品でなく統合基盤を志向
マルチ製品導入で乗り換え障壁構築
Amazon経由の配信チャネル拡大
ChatGPTCodex・API・Frontierを一体提供

対Anthropic競争認識

コーディング特化はプラットフォーム戦で不利
計算資源不足が製品品質に影響と指摘
公表売上に約80億ドルの過大計上あり
安全性重視の姿勢を「エリート支配」と批判

OpenAIの最高収益責任者デニス・ドレッサー氏が社内向けに送った4ページのメモがThe Vergeによって報じられました。メモはQ2の戦略方針を示すもので、「市場はかつてないほど競争が激しい」との認識のもと、エンタープライズAI市場での主導権確保に向けた5つの優先事項を掲げています。

戦略の柱は、OpenAIを単なるモデル提供者からエンタープライズ向け統合プラットフォーム企業へ転換することです。ChatGPT for Work、Codex、API、エージェント基盤Frontier、そしてAmazonとの提携による実行環境を一体化し、複数製品の導入によって顧客の乗り換えコストを高める構想を示しています。

特に注目されるのはAnthropicへの直接的な批判です。ドレッサー氏はAnthropicについて「恐怖と制限に基づくストーリー」と評し、コーディング特化の戦略はプラットフォーム戦争において脆弱だと指摘しました。さらに、Anthropicの公表ランレートにはAmazonGoogleとのレベニューシェアのグロスアップが含まれ、約80億ドル過大だと主張しています。

メモではAmazonとの提携を新たな成長軸と位置づけ、AWS上でステートフルな実行環境を提供することで規制産業の顧客獲得を目指す方針も明らかにされました。Microsoftとの関係については「基盤的」としながらも、「顧客がいる場所に届ける能力を制限してきた」と率直に認めています。

両社ともに今年中のIPOが報じられるなか、このメモはエンタープライズAI市場の覇権争いが新たな段階に入ったことを示しています。企業のAI導入が「技術が動くか」から「いかに展開し成果を出すか」へ移行するなか、プラットフォーム戦略の優劣が今後の競争を左右することになりそうです。

米政府が銀行にMythos試験を推奨

Mythos金融活用の動き

米財務長官とFRB議長が銀行に推奨
JPモルガンなど大手5行が試験中
脆弱性検出での高い性能が評価
英金融当局もリスクを検討

Claude人気の高まり

HumanX会議で最も言及されたAI
企業利用でAnthropicが追い上げ
OpenAI焦点の分散が課題に
月100ドル新プランで対抗

米財務省のベッセント長官と連邦準備制度理事会のパウエル議長が今週、大手銀行の幹部を招集し、Anthropicの新モデル「Mythos」を脆弱性検出に活用するよう推奨したことがBloombergの報道で明らかになりました。JPモルガン・チェースに加え、ゴールドマン・サックス、シティグループ、バンク・オブ・アメリカ、モルガン・スタンレーの大手5行がすでにMythosの試験を行っています。

この動きは、Anthropicが現在国防総省のサプライチェーンリスク指定をめぐりトランプ政権と法廷で争っている最中だけに注目を集めています。政府内でもAnthropicへの評価が一枚岩ではないことが浮き彫りになりました。また、英国の金融規制当局もMythosがもたらすリスクについて議論を始めています。

一方、サンフランシスコで開催されたHumanXカンファレンスでは、Claudeが最も話題に上ったチャットボットとして存在感を示しました。出展企業からは「ChatGPTOpenAIは勢いを失った」という声が繰り返し聞かれ、業界の評価が変化していることがうかがえます。

Financial Timesのデータによれば、企業ユーザーの間でAnthropicOpenAIに迫りつつあるとされています。Wall Street Journalは両社をテック史上最速で成長する企業と評しました。OpenAIは焦点の分散や経営陣への批判的報道に悩まされる一方、Codex強化のため月額100ドルのChatGPT Proプランを発表し、Claude Codeのユーザー獲得を狙う姿勢を見せています。

LangChain「メモリはハーネスの中核」オープン基盤を提唱

ハーネスとメモリの関係

エージェント基盤がメモリ管理を担う構造
コンテキスト制御がメモリの基盤
メモリはプラグインではなくハーネスの中核機能

クローズド基盤のリスク

ベンダーロックインによるモデル切替困難
長期メモリがAPI背後に囲い込まれる危険性
プロプライエタリなデータ資産の喪失リスク

オープン基盤の提案

Deep Agentsをオープンソースで提供
モデル非依存でメモリの所有権を確保

LangChainの共同創業者Harrison Chase氏は2026年4月11日、ブログ記事「Your harness, your memory」を公開し、エージェントハーネス(エージェント実行基盤)とメモリが本質的に不可分であると主張しました。クローズドなハーネスを使うことは、メモリの制御権を第三者に委ねることであり、開発者にとって深刻なリスクになると警鐘を鳴らしています。

Chase氏はLetta CTOのSarah Wooders氏の論考を引用し、メモリはハーネスに後付けする「プラグイン」ではなく、コンテキスト管理そのものがメモリの基盤だと述べています。会話履歴の保持、コンパクション時の情報取捨選択、長期記憶の更新と参照など、すべてハーネスが担う責務だという考えです。

記事ではクローズド基盤のリスクを3段階で整理しています。最も軽度なケースは、OpenAIAnthropicステートフルAPIにセッション状態を保存すること。モデル切替時にスレッドの継続ができなくなります。最悪のケースでは、長期メモリを含むハーネス全体がAPI背後に隠され、開発者がメモリの所有権も可視性も失うとしています。

Chase氏は、モデルプロバイダーがメモリによるロックインを意図的に推進していると指摘します。AnthropicのManaged AgentsやOpenAICodexが生成する暗号化コンパクション要約など、エコシステム外で利用できない仕組みが具体例として挙げられています。

この問題への解決策として、LangChainはオープンソースのエージェントハーネスDeep Agentsを提案しています。モデル非依存で、agents.mdやskillsといったオープン標準を採用し、MongoDB・PostgreSQL・Redisなど任意のデータベースをメモリストアとして接続できます。開発者が自らのメモリを所有し、ベンダーに依存しないエージェント開発を可能にする設計です。

OpenAIとAnthropic、IPO控え収益化正念場

収益化の崖

史上最大級のIPOが目前
燃焼額上回る黒字化圧力
巨額投資の回収期限接近

エージェント急拡大

Codex等が計算資源を浪費
想定超えのトークン消費

苦渋の選択

OpenAISora終了
Claude従量課金強制
10年末に数千億ドル計画

AI業界の2026年は、OpenAIAnthropicにとって正念場の年となっています。米メディアThe Vergeのポッドキャスト「Decoder」で4月9日、司会のニレイ・パテル氏と同社シニアAI記者のヘイデン・フィールド氏が、両社が直面する「収益化の崖」と史上最大級のIPOに向けた圧力を議論しました。燃やす現金を上回る売上を生み出せるかが、業界全体の行方を左右する局面です。

議論の前提にあるのは、数千億ドル規模の資本投下と、それを上回るデータセンター半導体への将来投資です。番組では、いずれ利益が実現するか、さもなくばバブルが弾けるという構図が改めて確認されました。パテル氏は過去の出演CEOの多くが「一部の企業は派手に失敗し、一部は成功する」と見ていると指摘し、市場全体が走り続けざるを得ない現状を強調しました。

変化の触媒となっているのが、AIエージェントの急速な普及です。Claude CodeやCowork、オープンソースのOpenClawOpenAICodexといった製品は、顧客価値が高い一方で桁違いの計算資源を消費します。両社の想定を上回るペースでトークンが燃え、事業運営の前提そのものが揺らいでいるとフィールド氏は説明しました。

その影響は、製品の生殺与奪にも表れています。OpenAIは先月、動画生成アプリSoraを終了し、10億ドル規模のディズニーとのライセンス契約も断念しました。理由は運用コストの重さと、Codex向けに計算資源を確保する必要性です。一方、Anthropicも先週、標準サブスクリプションでのOpenClaw利用を禁じ、利用者を従量課金プランへ誘導しました。

両社は史上最大級のIPOに向け突き進んでおり、収益化への圧力はかつてないほど高まっています。今週ウォール・ストリート・ジャーナルに漏れた内部計画によれば、両社は2020年代末までに数千億ドルの売上と黒字化を見込みます。OpenAIはすでに8500億ドル評価で1220億ドルを追加調達しており、期待と現実のギャップが鮮明になってきました。

問われているのは、こうした成長計画を本当に実現できるのか、そして達成のためにどのような妥協を強いられるのかという点です。ユーザー体験の制限や人気製品の打ち切りは、顧客離れのリスクも孕みます。経営者やリーダーにとっては、AI各社の料金改定や機能縮小が自社のAI活用計画に直結する可能性があるだけに、今後の動向を注視する必要があります。

OpenAI、月100ドルChatGPT Pro新設

新料金プランの狙い

月100ドルの中間層新設
コーディング需要に対応
既存200ドルは継続提供

Codex強化と競争

Plus比Codex5倍の上限
Anthropicに対抗投入
5月末まで拡張枠を提供

利用者急増の背景

300万人Codex利用
3カ月で5倍成長

OpenAIは4月9日、ChatGPT月額100ドルの新Proプランを追加したと発表しました。これまで広告付き無料、月8ドルのGo、月20ドルのPlus、月200ドルのProという階層でしたが、中間に新たな価格帯を設けた形です。同社は料金ページから200ドル版を一旦非表示にしたものの、最上位プランは引き続き利用可能だとTechCrunchに説明しました。

新プランの主眼は、コーディング支援ツールCodexの利用枠拡大にあります。月20ドルのPlusと比較すると、100ドル版ではCodexの利用上限が5倍に引き上げられ、日常的に生成AIでコードを書く開発者を主な対象としています。両Proプランの機能自体は共通で、差分はあくまでレート制限だとOpenAIは説明しています。

この価格設定は、競合Anthropicが長く提供してきたClaude向け月100ドルプランへの対抗策と位置付けられています。OpenAI広報は「高負荷のコーディング作業で1ドルあたりの処理能力Claude Codeより優れる」と強調し、開発者の財布を巡る競争が新局面に入ったことを示しました。

導入期には追加インセンティブも用意されています。OpenAIは5月31日までの期間限定で100ドル版のCodex利用上限をさらに引き上げており、早期に試すユーザーほど恩恵を受けやすくなります。ただし、どのプランも無制限ではなく、最上位の200ドル版がPlus比20倍という位置付けは維持されます。

背景にはCodex需要の急拡大があります。OpenAIによれば、現在週300万人以上Codexを利用しており、直近3カ月で利用者は5倍、月間利用量は70%超のペースで伸びているといいます。生成AIによる開発ワークフローの普及が、今回の料金体系見直しを後押しした形です。

サイバーエージェント、ChatGPT Enterprise利用率93%到達

全社への定着

月間利用率93%到達
Enterprise版を基盤化
機密情報の取扱指針整備
Slackボットで利用促進

Codexの活用

設計段階での品質向上
エンジニアにも利用拡大

サイバーエージェントは、OpenAIChatGPT EnterpriseCodexを全社基盤として活用し、広告・メディア・ゲーム事業で開発スピードと意思決定品質を高めていると明らかにしました。同社では月間利用率が93%に達し、ほぼ全部署で日常業務に組み込まれています。ツール導入を強制しない文化の中で、自発的な選択による定着が進んだ点が特徴です。

背景には、2022年のChatGPT登場以降に社内利用が急拡大したことがあります。当初は機密情報の取扱いに対する不安が広がり、部署ごとに利用度もばらついていたといいます。そこで同社は、管理機能とセキュリティを備えたChatGPT Enterpriseを採用し、社内ガイドラインも整備しました。これにより、社員が安心してAIを業務へ取り込める環境が整ったのです。

定着を支えたのは、組織的な文化作りとOpenAIによる継続的な研修でした。プロンプトや活用事例の共有、利用状況を可視化する社内ランキングSlackボットによるフォローアップなど、利用を促す仕組みを積み重ねてきました。OpenAIが開催する入門講座やCodexハンズオン、社内ハッカソンには各回100名超が参加し、役割や習熟度に応じた学習機会を設計しています。

Codexの活用はエンジニアリング領域で急速に広がっています。設計案を多角的に評価する用途や、コードレビュー時の改善提案、AGENTS.mdのようなナレッジドキュメント整備が代表例です。同社データ技術部の高尾謙氏は、早期の意思決定品質が上がることで後工程の手戻りが減ると指摘します。実装前の合意形成が速まり、判断の根拠も明確になるといいます。

さらにCodexの利用は開発職以外にも波及しています。仕様書作成やモックアップ制作、プロダクト周辺業務でも活用されているほか、社内利用ランキングの構築自体にもCodexが使われました。AIビジネス本部の吉原颯氏は、他のコーディングモデルと比べて提案品質が高いと評価しています。ゲーム事業のGOODROIDでも、Codexを用いた新作「WormEscape」が約1カ月でソフトローンチに到達しました。

同社はAIを一時的なブームではなく、ネット業界の次の標準になる転換点と位置づけています。2016年設立のAI Labを技術的エンジンとしつつ、2023年に発足したAIオペレーション室が業務変革の推進役を担います。導入から業務設計の再構築へと段階を進め、AIを日常業務に埋め込む取り組みが今後も加速する見込みです。

OpenAI、企業向けAI戦略の全体像を公表

エンタープライズ事業の急成長

企業向け売上が全体の40%超
2026年末に消費者向けと同等見込み
Codex週間利用者が300万人突破

統合AI基盤の構築

Frontierで全社横断エージェント管理
AWSと共同で状態保持型実行環境開発
McKinseyら大手と導入支援体制構築

AI職場への浸透

統合スーパーアプリ構想を推進
ChatGPT週間9億ユーザーが導入基盤

OpenAIのエンタープライズ担当幹部が就任90日を振り気に、企業向けAI戦略の全体像を明らかにしました。同社の企業向け事業は売上全体の40%超を占めるまでに成長し、2026年末までに消費者向け事業と同等規模に達する見通しです。Codex週間アクティブユーザー300万人を突破し、APIは毎分150億トークン以上を処理しています。

戦略の柱の一つが、全社横断型のAI基盤OpenAI Frontier」です。個別のAIツールが乱立する課題に対し、企業の社内システムやデータソースと連携しながらエージェントを統合管理する仕組みを提供します。OracleやUber、State Farmなどが既に導入を進めています。

もう一つの柱が、従業員の日常業務にAIを組み込む「統合AIスーパーアプリ」構想です。ChatGPTCodexエージェント型ブラウジングなどの機能を一つのインターフェースに集約し、個人やチームの生産性を大幅に引き上げることを目指しています。ChatGPT週間ユーザー9億人という基盤が、企業展開時の学習コスト低減に寄与するとしています。

導入支援の面では、McKinsey、BCG、Accenture、Capgeminiと「Frontier Alliances」を結成。さらにAWSDatabricksSnowflakeとも連携し、既存のインフラやデータ基盤へのAI統合を支援します。AWSとは共同で、エージェントが文脈を保持しながらツール横断で稼働する状態保持型実行環境を開発中です。

同幹部は「AIの実用能力と企業の活用度には大きな乖離がある」と指摘し、この「能力オーバーハング」の解消こそが自社の使命だと強調しました。実験段階から本格展開へと移行する企業に対し、信頼できるパートナーとして伴走する姿勢を鮮明にしています。

AIエージェント自己進化フレームワークが相次ぎ登場

経験から学ぶ仕組み

実行履歴を再利用可能な知見に変換
モデル再訓練なしで能力向上
外部メモリとして知識を蓄積

ベンチマークでの成果

困難なタスクで最大14.2%改善
GAIA精度13.7ポイント向上
スキル自動生成・修正を実現

企業導入への課題

構造化ワークフローが適用条件
安全性と評価基盤が不可欠

AIエージェントが過去の経験から自律的に学習し、モデルの再訓練なしに能力を向上させるフレームワークが相次いで発表されました。IBM Research等が開発したALTK-Evolveと、複数大学の研究者によるMemento-Skillsは、いずれもエージェントの「永遠のインターン問題」に取り組んでいます。

ALTK-Evolveは、エージェントの実行履歴から再利用可能なガイドラインを抽出し、品質スコアリングで精査したうえで必要な場面でのみ注入する仕組みです。AppWorldベンチマークでは、困難なタスクで14.2ポイントの改善を達成しました。Claude CodeCodexへのプラグイン統合にも対応しています。

一方のMemento-Skillsは、スキルをマークダウン形式で保存し、実行結果に基づいて自動的に書き換える「読み書き反省学習」を採用しています。GAIAベンチマークで13.7ポイント、HLEベンチマークでは17.9%から38.7%へと倍増する成果を示しました。意味的類似度ではなく強化学習ベースのスキル選択により、タスク成功率を80%に引き上げています。

両フレームワークに共通するのは、大規模言語モデルのパラメータを固定したまま、外部メモリを通じて継続的に学習する設計思想です。従来の手動スキル設計やファインチューニングに伴う運用負担を大幅に軽減できる可能性があります。

ただし、企業導入には構造化されたワークフローが前提条件となります。Memento-Skillsの共同著者Jun Wang氏は、タスク間の構造的類似性が高い環境でこそ効果を発揮すると指摘しています。物理エージェントや長期的タスクへの適用には、マルチエージェント協調など更なる研究が必要です。安全性の面では自動テストゲートなどの基本的な仕組みはあるものの、企業規模での運用にはより包括的なガバナンス体制が求められます。

OpenAI幹部が大幅異動、AGI責任者Simoは病気療養へ

主要3幹部の異動

AGI責任者Fidji Simoが数週間の病気休職
COO Brad Lightcapが特別プロジェクト担当へ
CMO Kate Rouchがん治療のため退任
不在中はGreg Brockmanがプロダクト統括

後任体制と背景

Slack CEO Denise DresserがCOO業務を代行
広報責任者も1月に退任済み、後任未定
IPOを視野に入れる中での組織再編
Sora終了など事業整理の最中での人事刷新

OpenAIは2026年4月3日、AGI展開部門のCEOであるFidji Simo氏が神経免疫疾患の治療のため数週間の病気休職に入ると発表しました。同時にCOOのBrad Lightcap氏とCMOのKate Rouch氏の異動も明らかになりました。

Simo氏は2025年8月にOpenAIに入社して以来、ChatGPTCodexなど主要プロダクトを統括してきました。入社前から神経免疫疾患の再発があったものの、業務を優先して治療を先送りしていたと社内メモで説明しています。

休職中のプロダクト統括は共同創業者で社長のGreg Brockman氏が担当します。ビジネス面はCSO Jason Kwon氏、CFO Sarah Friar氏、CRO Denise Dresser氏が分担して対応します。

COOだったBrad Lightcap氏はCEO Sam Altman氏直属の「特別プロジェクト」担当に異動します。複雑な取引や投資案件、企業向けエンジニア派遣などを統括する役割です。元Slack CEOのDresser氏がCOO業務の大半を引き継ぎます。

CMOのKate Rouch氏は乳がん治療に専念するため退任し、回復後はより限定的な役職で復帰する予定です。新CMOの採用活動が開始されます。広報責任者Hannah Wong氏も1月に退任しており、幹部の空席が目立つ状況です。

今回の人事刷新は、Pentagon契約への批判やSoraアプリの終了など広報上の逆風が続く中で行われました。OpenAIは約10億人のユーザー基盤を持ち、今年中のIPOも視野に入れる中、企業価値8520億ドルの評価を受けています。

OpenAI、Codexを従量課金制で提供開始

料金体系の刷新

従量課金Codex専用席を新設
トークン消費ベースで課金
レートリミットなしで利用可能
ChatGPT Business年額を25→20ドルに値下げ

導入支援と実績

新規メンバーに最大500ドルのクレジット付与
週間アクティブ開発者200万人突破
企業向けCodex利用者が1月比6倍に成長
Notion・Rampなど大手が採用済み

OpenAIは2026年4月2日、AIコーディングツール「Codex」をChatGPT BusinessおよびEnterprise向けに従量課金制で提供開始すると発表しました。固定のシート料金なしで利用でき、チーム単位での試験導入が容易になります。

新たに導入されたCodex専用シートは、レートリミットが撤廃され、トークン消費量に基づいて課金される仕組みです。これにより、予算やワークフローごとのコスト可視化が格段に向上し、企業の支出管理が容易になります。

従来のChatGPT Businessシートも引き続き利用可能ですが、年間料金が1シートあたり25ドルから20ドルに引き下げられました。また、macOSWindows向けのCodexアプリやプラグイン、自動化機能が新たに追加されています。

導入促進策として、対象のChatGPT Businessワークスペースには、新規Codex専用メンバー1人あたり100ドル、チームあたり最大500ドルのクレジットが期間限定で付与されます。小規模チームでも低リスクで導入を開始できます。

現在、ChatGPTの有料ビジネスユーザーは900万人を超え、Codexの週間利用者は200万人以上に達しています。NotionやRamp、Braintrustなどの企業がすでにCodexを活用しており、エンジニアリングワークフローの高速化と再現性の向上を実現しています。

Cursorが新エージェント型開発環境を発表、Claude CodeやCodexに対抗

Cursor 3の全容

自然言語でタスク指示が可能
複数エージェントの同時実行に対応
クラウド生成コードをローカルで確認

AI大手との競争激化

月200ドルで1000ドル超の利用価値提供
Cursor従量課金へ転換済み
独自モデルComposer 2を投入

Cursorは2026年4月、AIコーディングエージェントを中心とした新製品「Cursor 3」を発表しました。コード名Glassで開発された本製品は、AnthropicClaude CodeOpenAICodexに対抗するエージェント型開発体験を提供します。

Cursor 3は既存のデスクトップアプリ内に新しいインターフェースとして統合されます。中央のテキストボックスに自然言語でタスクを入力すると、AIエージェントがコードを自動生成します。サイドバーで複数のエージェントを同時に管理できる設計です。

競合製品との最大の差別化は、IDEエージェント型製品の統合にあります。クラウド上でエージェントが生成したコードをローカル環境で即座に確認・編集できるため、開発者は従来のワークフローを維持しつつエージェントを活用できます。

一方で経営面の課題は深刻です。複数の開発者Claude CodeCodexへ移行したと証言しており、主な理由は月額200ドルの定額プランで1000ドル超相当の利用が可能な補助金付き価格設定です。Cursorは2025年6月に従量課金へ移行し、一部の開発者の不満を招きました。

Cursorは対抗策として独自AIモデル「Composer 2」の提供を開始しました。中国のMoonshot AIのオープンソースモデルをベースに追加学習を施したもので、性能・価格・速度の面で競争力があると主張しています。現在約500億ドル評価額資金調達を進めており、AI大手との消耗戦に備えています。

OpenAI、1220億ドル調達 評価額8520億ドルでIPOへ布石

史上最大の資金調達

評価額8520億ドルで完了
SoftBanka16zら共同主導
個人投資家から30億ドル調達

急成長する事業規模

月間売上20億ドルに到達
週間ユーザー9億人超え
法人比率が売上の40%に拡大

インフラと今後の戦略

AIスーパーアプリ構想を発表
複数チップ基盤に分散投資

OpenAIは2026年3月、1220億ドル(約18兆円)の資金調達を完了したと発表しました。評価額8520億ドルに達し、同社史上最大の調達ラウンドとなります。年内に予定されるIPOに向けた布石とみられています。

ラウンドはSoftBankAndreessen Horowitzが共同主導し、D.E. Shaw Ventures、MGX、TPGなどが参加しました。AmazonNVIDIAMicrosoftも戦略的パートナーとして出資しています。初めて銀行チャネルを通じた個人投資家にも門戸を開き、30億ドル以上を集めました。

事業面では月間売上が20億ドルに達し、AlphabetやMetaの同時期と比べ4倍の成長速度だと同社は主張しています。ChatGPTの週間アクティブユーザーは9億人を超え、有料会員は5000万人以上です。検索利用は1年で約3倍に伸びています。

法人向け事業は売上全体の40%を占めるまでに成長し、2026年末までにコンシューマーと同等になる見通しです。最新モデルGPT-5.4エージェントワークフローの需要を牽引し、APIは毎分150億トークン以上を処理しています。広告事業も開始からわずか6週間でARR1億ドルを突破しました。

同社はAIスーパーアプリ構想を掲げ、ChatGPTCodex、ブラウジング機能などを単一のエージェント体験に統合する方針です。インフラ面ではNVIDIA、AMD、AWS Trainiumなど複数のチップ基盤に拡大し、回転信用枠も約47億ドルに増額しました。調達資金はAIチップデータセンターの拡充に充てられます。

OllamaがApple MLX対応、Macでのローカル推論を大幅高速化

MLX対応の概要

Apple MLXフレームワーク対応開始
Ollama 0.19プレビューで提供
Qwen3.5-35Bモデルのみ対応
Apple Silicon搭載Mac・RAM32GB以上が必要

性能改善と圧縮技術

キャッシュ性能の向上を実現
Nvidia NVFP4圧縮形式に対応
メモリ使用効率の大幅改善

ローカルLLM需要の高まり

OpenClawGitHubで30万スター突破
クラウドAPIの料金・制限への不満が背景

ローカルLLM実行ツールOllamaは、Appleが開発したオープンソースの機械学習フレームワークMLXへの対応を発表しました。これにより、Apple Silicon搭載Macでの大規模言語モデルの推論性能が大幅に向上します。

今回の対応はOllama 0.19のプレビュー版として提供されており、現時点で対応モデルはAlibabaのQwen3.5-35Bパラメータ版のみです。利用にはApple Silicon搭載Macに加え、最低32GBのRAMが必要とされています。

MLX対応に加え、キャッシュ性能の改善やNvidiaNVFP4モデル圧縮形式への対応も同時に発表されました。NVFP4はモデルのメモリ使用量を大幅に削減する技術で、より効率的な推論環境の構築が可能になります。

ローカルモデル実行への関心は急速に高まっています。OpenClawGitHubで30万スター以上を獲得し、中国を中心に世界的な注目を集めています。研究者やホビイスト以外の層にもローカルLLMの活用が広がりつつあります。

背景には、Claude CodeChatGPT Codexなどのクラウドサービスにおけるレート制限や高額なサブスクリプション費用への開発者の不満があります。OllamaはVisual Studio Codeとの統合も拡充しており、ローカル開発環境の充実を進めています。

Midjourney技術者がWeb設計を革新するOSSライブラリPretext公開

Pretextの技術革新

DOM迂回でテキスト計測を高速化
15KBのゼロ依存TypeScriptライブラリ
300〜600倍の描画性能向上を実現
モバイルでも120fps動作可能

開発手法と反響

48時間でGitHub星1.4万獲得
X上で1900万回閲覧を記録

企業への示唆

生成AIのUI構築に即時導入推奨
アクセシビリティ管理は自社責任に

MidjourneyエンジニアCheng Lou氏が2026年3月27日、Webテキストレイアウトを根本から変えるオSSライブラリPretextMITライセンスで公開しました。15KBのゼロ依存TypeScriptライブラリで、ブラウザのDOM操作を迂回し、テキストの計測と配置を高速に行います。

従来のWeb開発では、テキストの高さや位置を取得するたびにブラウザがレイアウトリフローと呼ばれる再計算を実行し、深刻なパフォーマンス低下を招いていました。PretextはブラウザのCanvasフォントメトリクスと純粋な算術演算を組み合わせ、DOMに一切触れずに文字・単語・行の配置を予測します。

ベンチマークによると、Pretextのlayout関数は500種類のテキストを約0.09ミリ秒で処理でき、従来のDOM読み取りと比較して300〜600倍の性能向上を達成しています。この速度により、ウィンドウリサイズや物理演算中でもリアルタイムにテキスト再配置が可能になりました。

開発にはAnthropicClaudeOpenAICodexなどAIコーディングツールが活用されました。多言語データセットや小説全文を用いてブラウザ実装とのピクセル単位の整合性を反復検証し、WebAssemblyやフォント解析ライブラリなしで高精度を実現しています。

公開から48時間でGitHubスター1万4000超、X上で1900万回閲覧を記録しました。コミュニティでは雑誌レイアウト、物理演算テキスト、ディスレクシア向けフォント調整など多彩なデモが登場し、Web表現の可能性が大きく広がっています。

企業にとっては、生成AI UIや高頻度データダッシュボードを構築する場合に即時導入が推奨されます。ただしレイアウトをユーザーランドに移すことで、ブラウザが担っていたアクセシビリティや標準準拠の責任を自社で管理する必要がある点には留意が必要です。

OpenAI、Codexにプラグイン機能を追加しコーディング以外に拡張

プラグインの概要

スキル・連携・MCPの統合パッケージ
GitHubGmailVercel等とワンクリック連携
組織横断で設定を再現可能

競合との関係

GoogleGemini CLIも同等機能提供済み
既存機能のパッケージ化が本質
検索可能なプラグインライブラリを新設

OpenAIは、エージェントコーディングアプリCodexにプラグイン機能を追加しました。これにより、Codexコーディング領域を超えた幅広いタスクに対応できるようになります。競合するAnthropicGoogleの類似機能に対抗する動きです。

プラグインは、スキル(ワークフローを記述するプロンプト)、アプリ連携、MCP(Model Context Protocol)サーバーを一つにまとめたバンドルです。特定のタスクに合わせてCodexを構成し、組織内の複数ユーザー間で再現可能にする仕組みとなっています。

技術的には、これまでもカスタム指示MCPサーバーを個別に設定すれば同等の機能を実現できました。しかし今回のプラグインでは、それらをワンクリックでインストールできるようパッケージ化した点が最大の特徴です。

Codexアプリ内には新たにプラグインセクションが設けられ、検索可能なライブラリからプラグインを選択できます。GitHubGmail、Box、CloudflareVercelなど主要サービスとの緊密な統合が用意されています。

この動きは、AIコーディングツール市場におけるプラットフォーム競争の激化を示しています。各社がエコシステムの拡充を通じて開発者の囲い込みを図る中、OpenAICodex汎用性を高めることで差別化を狙っています。

LangChain、エージェント間で業務知識を共有する「スキル」機能を公開

スキルの概要と特徴

業務知識エージェントに付与
関連時のみスキルを自動読込
ワークスペース全体で共有・同期
退職者の知見も組織に残存

作成方法と拡張性

AIとの対話から自動生成可能
テンプレートや手動作成にも対応
CLIでコード開発環境に連携
バージョン管理と権限拡張を予定

LangChainは2026年3月、AIエージェント開発基盤LangSmith Fleetにおいて、エージェント間で業務知識を共有できる「スキル」機能を正式に公開しました。スキルとは、特定タスクに必要な手順やドメイン知識をまとめた指示セットです。

現在のAIエージェント推論能力に優れる一方、業務固有の知識がなければ実用性に限界があります。たとえばサポートエージェントがSLAの優先度を知らなければ、すべての問い合わせを同一に扱ってしまいます。スキルはこの課題を解決する仕組みです。

スキルの作成方法は多彩で、AIとのチャットから自動生成する方法、エージェント作成時の自動提案、テンプレートからの選択、手動記述の4通りが用意されています。作成したスキルはワークスペースに共有でき、チーム全員のエージェントが即座に利用可能になります。

特筆すべきはポータビリティの高さです。LangSmith CLIを使えば、Fleet上のスキルをローカル開発環境にダウンロードし、Claude CodeCursorCodexなど任意のコーディングエージェントにそのまま連携できます。知識の再記述やコピーは不要です。

今後の機能拡張として、スキルのバージョン固定とロールバック、および複数オーナーによる共同編集権限の追加が予定されています。エージェントが高度な業務を担うほど、指示の質が成果を左右するとLangChainは強調しています。

ディズニーがOpenAIへの10億ドル投資を撤回、Sora終了で

提携白紙の経緯

OpenAISora終了を発表
ディズニーは事前通告なく寝耳に水
10億ドル投資計画を撤回
別形態の提携は引き続き協議中

Soraの急成長と急失速

11月に330万DLでピーク到達
2月には110万DLへ急落
累計収益はわずか214万ドル
OpenAIIPO準備で事業集約

ディズニーの戦略的誤算

Epic Gamesとのメタバース構想も停滞
SeeDanceなど競合アプリが台頭
新CEO就任直後に二重の危機直面

ディズニーは2026年3月、OpenAIへの10億ドル出資計画を撤回しました。OpenAI動画生成アプリSoraの終了を発表したことが直接の原因で、ディズニー側は事前に知らされておらず、計画の白紙撤回に踏み切りました。ただし両社は別の形での提携投資の可能性について協議を続けているとされています。

2025年12月に発表されたディズニーとOpenAI提携は、ハリウッドに大きな衝撃を与えました。Disney+上でSoraによるAI生成コンテンツを配信する計画で、前CEOボブ・アイガー氏は短尺動画の目玉にする構想を語っていました。しかしSoraのダウンロード数は2025年11月の330万件をピークに急減し、累計収益もわずか214万ドルにとどまりました。

OpenAIIPO準備の一環として事業の選択と集中を進めています。CFOのサラ・フライアー氏は「上場企業としての準備が必要」と述べ、Soraの研究チームはロボティクス向けの世界シミュレーション研究に再配置されます。ChatGPTCodex・Atlasを統合した「スーパーアプリ」構想に経営資源を集中させる方針です。

ディズニーにとってSora提携の頓挫は、テック投資戦略の見直しを迫る事態です。Epic Gamesとの15億ドル規模のメタバース構想も、Epic側の1000人規模のレイオフと5億ドルのコスト削減により先行きが不透明になっています。Fortniteのプレイヤー数減少も重なり、ディズニーブランドのメタバース実現は遠のいています。

新CEOジョシュ・ダマロ氏は就任1週間でOpenAIとEpicの二つの危機に直面する形となりました。一方、AI動画分野ではByteDanceSeeDance 2.0が急速に台頭し、ディズニーはIP無断使用に対する法的措置を進めています。今後のAI戦略の立て直しが、新体制の最重要課題となります。

Apple、WWDC26でAI進化を予告し6月開催発表

WWDC26の概要

6月8〜12日にオンライン開催
iOSmacOS等の全プラットフォーム更新
AI進化を主要テーマに明示
開発者向け新ツールも発表予定

Siri刷新への期待

Google Gemini連携契約を締結済み
新型Siriの高度なAI機能搭載
オンスクリーン認識と個人文脈理解強化

開発者向けAI基盤

Foundation Modelフレームワーク進化
XcodeにClaudeCodex統合済み

Appleは2026年3月、年次開発者会議WWDC26を6月8日から12日までオンラインおよびクパチーノ本社で開催すると発表しました。今年のテーマとして「AI進化」を明確に掲げています。

昨年のWWDCではLiquid Glassデザインが中心でAIへの言及は限定的でしたが、今年は大きく方針を転換します。Appleは年初にGoogleと契約を結び、GeminiをAI機能の基盤として採用することを決定しています。

最大の注目点はSiriの全面刷新です。高度なAI機能を搭載した新型Siriは、個人的な文脈の理解や画面上の情報認識といった機能が強化される見込みです。度重なる延期を経て、ついにお披露目となる可能性があります。

開発者向けには、昨年発表されたFoundation Modelフレームワークの進化が期待されます。オフラインで動作するAIモデルの拡充に加え、XcodeにはすでにAnthropicClaude AgentOpenAICodexといったエージェントコーディングツールが統合されています。

カンファレンスはApple Developerアプリ、公式サイト、YouTubeチャンネルでライブ配信されます。中国向けにはBilibiliチャンネルでも視聴可能で、グローバルな開発者コミュニティに向けた発信が強化されています。

OpenAI、デスクトップ統合「スーパーアプリ」を開発中

統合アプリの全容

ChatGPTCodex・Atlasを一本化
製品の分散化が品質低下の要因
モバイル版ChatGPT変更なし

競争環境と戦略転換

Anthropicとの競争が激化
Claude Codeの人気急上昇が背景
Codexへの集中投資を明言
「副次的探索」の縮小を指示

OpenAIは、ChatGPTアプリ、AIコーディングツール「Codex」、AIブラウザ「Atlas」を統合したデスクトップ向け「スーパーアプリ」の開発を進めていることが、米ウォール・ストリート・ジャーナルの報道で明らかになりました。アプリケーション部門CEOのフィジ・シモ氏が社内メモで方針を示しています。

シモ氏はメモの中で、製品の分散化が「開発速度を低下させ、求める品質基準の達成を困難にしている」と指摘しました。同社は昨年、動画生成AI「Sora」の発表やジョニー・アイブ氏のAIハードウェア企業買収など派手な展開を見せていましたが、戦略の再集中が急務となっています。

背景にはAnthropicとの競争激化があります。特にClaude Codeの急速な普及がOpenAIにとって脅威となっており、経営陣は優先度の低い取り組みの見直しを進めています。シモ氏は従業員に対し「副次的な探索に気を取られないように」と呼びかけました。

シモ氏はX(旧Twitter)への投稿で「企業には探索のフェーズと再集中のフェーズがあり、どちらも重要だ」と述べた上で、「Codexのように新しい賭けが成果を出し始めた今こそ、集中投資すべき時だ」と強調しました。

なお、モバイル版ChatGPTについては今回の統合の対象外とされています。OpenAIの広報担当者はコメントを控えており、統合アプリの具体的なリリース時期は明らかになっていません。今後のデスクトップ体験の大幅な刷新が見込まれます。

GitHub、AI時代のOSSメンター選定に「3C」指針を提唱

メンター危機の背景

AI生成PRが急増し選別困難に
月間PR数が4500万件超で前年比23%増
tldrawらがPR受付を停止する事態

3Cフレームワーク

Comprehension:問題理解の確認
Context:AI利用開示でレビュー最適化
Continuity:継続参加者に投資集中

実践と効果

ガイドライン未遵守のPRは即クローズ
公平性向上と属人的判断の排除

GitHubのAbigail Cabunoc Mayes氏は、AI時代におけるオープンソースのメンターシップのあり方を再考する指針「3Cフレームワーク」を提唱しました。AIツールの普及でコントリビューション量が急増し、メンテナーの負担が深刻化しています。

2025年のOctoverseレポートによると、GitHubでは月間約4500万件のプルリクエストがマージされ、前年比23%増を記録しました。一方でAI生成コードは一見高品質に見えるため、従来の貢献者評価シグナルが機能しなくなっています。

3Cの第一はComprehension(理解力)です。OpenAI CodexGemini CLIはPR提出前にイシュー承認を必須化しました。コードスプリントなど対面での理解度確認も有効とされ、貢献者が自分の理解度を超えたコードをコミットしないよう求めています。

第二のContext(文脈提供)では、AI利用の開示が重要です。ROOSTやFedoraなど複数プロジェクトがAI開示ポリシーを導入済みです。さらにAGENTS.mdの活用により、AIエージェントにプロジェクト規範を遵守させる動きも広がっています。

第三のContinuity(継続性)は、メンターシップ投資の最終判断基準です。一度きりの貢献ではなく繰り返し参加する人材にのみ深い指導を行うことで、メンターの乗数効果を最大化できます。明確な基準は属人的バイアスも排除し、より公平なコミュニティ形成につながります。

OpenAIがPython開発ツール企業Astralを買収へ

買収の狙いと背景

Codexチームに統合予定
uv・Ruff・tyの3ツールを獲得
AIコーディング支援市場の競争激化
Codex週間200万人超の利用者

OSSの継続と展望

買収後もオープンソース継続
Python開発ワークフロー全体を支援
AnthropicのBun買収に対抗
規制当局の承認が条件

OpenAIは2026年3月、人気のオープンソースPython開発ツールを手がけるAstral買収合意を発表しました。Astralはパッケージマネージャーuv、リンターRuff、型チェッカーtyを開発しており、買収後はCodexチームに統合される予定です。

Astralの主力ツールuvは月間1億2600万回以上ダウンロードされ、Ruffは1億7900万回に達するなど、Python開発者の間で広く普及しています。これらのツールは依存関係管理、コード品質チェック、型安全性の確保といった開発の基盤を担っています。

OpenAIは本買収について「Codexの開発を加速し、ソフトウェア開発ライフサイクル全体でAIができることを拡大する」と説明しています。Codexは年初から利用者が3倍、利用量が5倍に成長しており、週間アクティブユーザーは200万人を超えています。

この動きはAIコーディング支援市場での競争を反映しています。2025年11月にはAnthropicがJavaScriptランタイムBun買収Claude Codeに統合しており、OpenAIも今月初めにLLMセキュリティツールのPromptfoo買収するなど、開発者ツールの囲い込みが加速しています。

Astral創業者Charlie Marsh氏は、買収後もオープンソースツールの開発を継続しコミュニティとともに構築していくと表明しました。OpenAIも同様にOSSプロジェクトの支援を続けながら、Codexとのシームレスな統合を模索する方針です。買収完了には規制当局の承認が必要とされています。

Google、ブラウザAIエージェント開発チームを再編

開発体制の転換

Project Marinerチーム再編
研究者が高優先度プロジェクトへ異動
Gemini Agentに技術統合

業界の潮流変化

OpenClaw旋風で戦略転換
ブラウザ型の利用者数低迷
CLI操作が10〜100倍効率的

今後の展望

GUI操作は80/20の補完的役割
汎用エージェントへの進化が焦点

GoogleChromeブラウザを操作するAIエージェントProject Mariner」の開発チームを再編したことがWIREDの取材で明らかになりました。研究プロトタイプに携わっていたGoogle Labsのスタッフの一部が、より優先度の高いプロジェクトへ異動しています。

Googleの広報担当者はこの変更を認めたうえで、Project Marinerで培ったコンピュータ操作技術は同社のエージェント戦略に引き続き組み込まれると説明しています。すでに一部の機能は最近発表されたGemini Agentに統合されています。

背景にはOpenClawなど高性能コーディングエージェントの急速な台頭があります。NVIDIAのジェンスン・ファンCEOはOpenClawを「エージェント型コンピュータの新しいOS」と評し、「すべての企業がOpenClaw戦略を持つ必要がある」と述べました。

ブラウザエージェント普及は期待を下回っています。Perplexityの「Comet」は週間アクティブユーザー280万人にとどまり、OpenAIChatGPT Agentも100万人未満に減少しました。スクリーンショットベースの処理は計算コストが高く、テキストベースのCLI操作と比べ10〜100倍のステップが必要とされています。

一方で、コンピュータ操作エージェントが不要になるわけではないとの見方もあります。Simular CEOのアン・リー氏は「ターミナルで多くの問題を解決できるが、GUIでしか対応できない場面は常に存在する」と指摘しています。医療保険サイトやレガシーソフトウェアなど、APIが存在しない領域では引き続き重要な役割を果たすと述べました。

AI各社はコーディングエージェントを汎用アシスタントの基盤として位置づけ始めています。OpenAICodexChatGPT内の汎用エージェントにする構想を示し、AnthropicはターミナルなしでClaude Codeを使える「Claude Cowork」をすでに提供しています。

Xiaomi、1兆パラメータLLM「MiMo-V2-Pro」を低価格で公開

モデル性能と技術

1兆パラメータ中42Bのみ稼働
100万トークンの長大コンテキスト対応
幻覚率30%に大幅低減
エージェント評価で中国勢トップ

価格と市場影響

入力1ドル/100万トークンの低価格
GPT-5.2の約7分の1のコスト
オープンソース版も計画中
コード・端末操作に高い信頼性

Xiaomiは2026年3月18日、1兆パラメータの大規模言語モデル「MiMo-V2-Pro」を発表しました。開発を率いたのはDeepSeek R1出身のFuli Luo氏で、OpenAIAnthropicの最上位モデルに迫る性能を、約6〜7分の1の価格で提供します。

MiMo-V2-Proは1兆パラメータを擁しながら、1回の推論で稼働するのは42Bのみというスパース構造を採用しています。7対1のハイブリッドアテンション機構により、100万トークンの長大コンテキストでも性能劣化を抑え、効率的な推論を実現しています。

第三者機関Artificial Analysisの検証では、グローバル知能指数で10位・スコア49を獲得し、GPT-5.2 Codexと同等の評価を受けました。エージェント評価GDPval-AAではElo 1426を記録し、中国発モデルとして最高位に位置しています。

価格設定は入力1ドル・出力3ドル(100万トークンあたり、256K以下)と極めて競争力があります。GPT-5.2の全評価コスト2,304ドルに対し、MiMo-V2-Proはわずか348ドルで同等の処理が可能です。

企業導入においては、コスト対性能比の高さからインフラ部門に魅力的な選択肢となります。一方、エージェント機能の強力さゆえにプロンプトインジェクションリスクも増大するため、セキュリティ部門は監査体制の整備が不可欠です。Luo氏は安定版のオープンソース公開も予告しています。

MiniMax M2.7公開、自己進化型AIで開発工程の半分を自動化

自己進化と性能

RL工程の30〜50%を自動実行
MLE Benchメダル率66.6%達成
幻覚率34%Claude超え
SWE-Proで56.22%の高水準

コストと戦略転換

入力0.30ドル/100万トークン
GLM-5の3分の1以下のコスト
中国AI勢のプロプライエタリ転換
Claude Code11以上のツール対応

中国AI企業MiniMaxは2026年3月18日、新たなプロプライエタリLLM「M2.7」を公開しました。同モデルはエージェントワークフローとソフトウェア工学タスクに特化し、Vercel AI Gatewayでも標準版と高速版の2種類が利用可能となっています。

M2.7の最大の特徴は自己進化型の開発手法です。先行バージョンのモデルを活用して強化学習のハーネスを構築し、データパイプラインや学習環境の管理を自動化しました。これにより開発工程の30〜50%をモデル自身が担当し、100ラウンド以上の反復ループでコード修正を最適化しています。

ベンチマーク性能ではSWE-Pro 56.22%GPT-5.3-Codexに匹敵し、GDPval-AAではElo 1495を記録しました。幻覚率は34%とClaude Sonnet 4.6の46%やGemini 3.1 Pro Previewの50%を下回り、MLE Bench Liteのメダル率66.6%はGoogleGemini 3.1に並ぶ水準です。

価格面では入力0.30ドル、出力1.20ドル(100万トークンあたり)と前モデルM2.5から据え置きで、同等の知能水準を持つGLM-5と比較して3分の1以下のコストを実現しています。Claude CodeCursor、Trae等11以上の開発ツールへの公式統合も提供されています。

戦略的には、オープンソースで評価を高めてきた中国AI勢がプロプライエタリ路線へ転換する動きの一環として注目されます。一方で中国企業であることから米国・西側の規制産業での採用にはハードルがあり、企業の意思決定者はコスト効率と地政学的リスクを慎重に比較検討する必要があります。

Vercelがコーディングエージェント向けプラグインを公開

プラグインの主要機能

47種以上のスキルを搭載
Next.jsやAI SDK等の知識グラフ対応
3種の専門エージェントを内蔵
5つのスラッシュコマンドを提供

技術的な仕組み

ファイル編集やコマンドをリアルタイム監視
非推奨パターンを即時検出・警告
Claude CodeCursorに対応
OpenAI Codex対応も近日予定

Vercelは、コーディングエージェント向けの新プラグインを公開しました。Claude CodeCursorに対応し、Vercelプロジェクトの理解を深めるためのプラットフォーム知識グラフを提供します。

プラグインは47種以上のスキルを搭載しており、Next.js、AI SDK、Turborepo、Vercel Functions、Routing Middlewareなど主要技術をカバーしています。リレーショナル知識グラフにより、各技術間の関連性も把握できます。

AIアーキテクト、デプロイメントエキスパート、パフォーマンスオプティマイザーの3種の専門エージェントを内蔵しています。bootstrapやdeploy、env、status、marketplaceの5つのスラッシュコマンドも利用可能です。

技術的には、ビルド時にパターンマッチャーをコンパイルし、7つのライフサイクルフックで優先度付きの注入パイプラインを実行します。globパターンやbash正規表現、import文などに基づきスキルが発火し、セッション内で重複排除されます。

さらにPostToolUseバリデーションにより、非推奨パターンやサンセット済みパッケージ、古いAPIをリアルタイムで検出します。npxコマンドやClaude Code公式マーケットプレイスから簡単にインストールでき、OpenAI Codexへの対応も近日中に予定されています。

OpenAI、GPT-5.4 miniとnanoを公開

性能と価格

GPT-5 mini比2倍以上高速
SWE-Bench Proで54.4%達成
nano入力100万トークン0.20ドル
mini入力100万トークン0.75ドル

主な用途

コーディング補助の高速化
サブエージェント並列処理
スクリーンショット解析対応
Codexでコスト3分の1

OpenAIは2026年4月2日、小型高性能モデルGPT-5.4 miniGPT-5.4 nanoをAPI・CodexChatGPTで公開しました。大量処理ワークロード向けに設計された両モデルは、速度とコスト効率を重視しています。

GPT-5.4 miniは前世代のGPT-5 miniと比較して、コーディング推論・マルチモーダル理解・ツール使用の全領域で大幅に改善されています。処理速度は2倍以上に向上し、複数のベンチマークで上位モデルGPT-5.4に迫る性能を示しています。

ベンチマークではSWE-Bench Proで54.4%、OSWorld-Verifiedで72.1%を達成しました。特にOSWorldではGPT-5.4の75.0%にほぼ匹敵し、コンピュータ操作タスクでの実用性が際立っています。

料金体系はGPT-5.4 miniが入力100万トークンあたり0.75ドル、出力4.50ドルです。nanoはさらに安価で入力0.20ドル、出力1.25ドルに設定されています。両モデルとも40万トークンコンテキストウィンドウに対応します。

開発者にとって注目すべきはサブエージェント構成への最適化です。GPT-5.4が計画・判断を担い、miniやnanoが並列で個別タスクを高速処理する構成が推奨されており、Codexではmini利用時のクォータ消費が30%で済むため、コスト効率の高い開発体験を実現します。

OpenAI Codex SecurityがSASTレポートを採用しない理由

SAST の限界

データフロー追跡だけでは不十分
サニタイザー存在と安全性は別問題
変換チェーン後の制約維持が課題
順序・正規化の不整合が実際の脆弱性

エージェント型検証の設計

リポジトリ構造と脅威モデルから出発
z3ソルバーで制約充足を形式検証
サンドボックスでPoC実行検証
トリアージ前に証拠を確立

SAST起点を避ける理由

既存結果への早期収束リスク
暗黙の前提推論を歪める

OpenAIは自社のコードセキュリティ製品「Codex Security」において、従来の静的解析(SAST)レポートを起点としない設計を採用しました。代わりにリポジトリのアーキテクチャ、信頼境界、意図された動作から分析を開始し、人間に報告する前に検証を行う方針です。

SASTは入力源から危険なシンクまでのデータフロー追跡に優れますが、実際のコードベースでは間接呼び出しやリフレクション、フレームワーク固有の制御フローにより近似処理が必要になります。より根本的な問題は、サニタイザーが存在しても、その制約が変換チェーン全体で維持されるかを判定できない点にあります。

具体例として、JSONペイロードから取得したリダイレクトURLに対し正規表現チェック後にURLデコードを行うパターンがあります。CVE-2024-29041ではExpressにおいて、不正なURLがデコード・解釈の過程で許可リストを迂回できる脆弱性が発見されました。データフローは明白でも、変換後に検証が有効かが真の問題でした。

Codex Securityはコードパスをセキュリティ研究者のように読み、検証と実装の不一致を探します。最小のテスト可能な単位に分解してマイクロファザーを生成し、Python環境のz3ソルバーで制約充足問題として形式化することも可能です。サンドボックス環境でエンドツーエンドのPoCを実行し、疑惑と確証を区別します。

SASTレポートを起点としない理由は3つあります。第一に、既存の検出結果が探索範囲の早期収束を招きます。第二に、SASTが内包する暗黙の前提が推論を歪め、調査ではなく確認作業に陥ります。第三に、エージェント自身の発見能力の評価が困難になり、システム改善の妨げとなります。

マスク氏、xAIで再び大規模人員削減を指示

xAI組織再編の全容

SpaceXTeslaから監査役派遣
コーディング製品の不振が引き金
共同創業者2名が相次ぎ退社
訓練データの品質に重大な課題

競合との差と上場圧力

AnthropicOpenAIに大きく後れ
Grokは個人・法人とも普及せず
SpaceX統合で6月上場期限迫る
「基礎から再構築」とマスク氏表明

イーロン・マスクは、自身が率いるAIスタートアップxAIに対し、コーディング製品の低迷を理由に新たな人員削減を指示しました。SpaceXTeslaから「修正役」の管理職が送り込まれ、従業員の業務を監査しています。

AnthropicClaude CodeOpenAICodexといった競合AIコーディングツールが業界を席巻する中、xAIGrokチャットボットおよびコーディング製品は有料ユーザーの獲得に苦戦しています。設立からわずか2年で根本的な立て直しを迫られる異例の事態です。

SpaceXTeslaから派遣された管理職は、xAI社員の成果物を精査し、不十分と判断した社員を解雇しています。特にモデル訓練に使用するデータの品質が競合に劣る主因として注目されており、改善が急務となっています。

今回の混乱で、技術スタッフの最上級メンバーであったZihang Dai氏が退社しました。さらにGrokモデルの事前学習を統括していたGuodong Zhang氏も、コーディング製品の問題の責任を問われ主要業務を外されたことを受け、退社を表明しています。

マスク氏はxAISpaceX12.5億ドルで統合しており、6月の大型上場に向けた圧力が高まっています。同氏はXへの投稿で「xAIは最初の構築がうまくいかなかったため、基礎から再構築する。Teslaでも同じことがあった」と述べ、長期的な再建に自信を示しました。

YC支援のRandom LabsがAI群制御型コーディングエージェントSlate V1を公開

Slateの技術基盤

Thread Weavingで文脈維持
オーケストレータとワーカーの分離構造
エピソード記憶で状態圧縮
複数モデルの並列実行に対応

事業戦略と展望

従量課金クレジット制を採用
OpenAI CodexClaude Code連携を予定
Terminal Bench 2.0で高い安定性を実証
「次の2000万人エンジニア」が標的

Y Combinator支援のRandom Labsは、業界初の「スウォームネイティブ」自律型コーディングエージェント「Slate V1」を正式リリースしました。2024年にKiranとMihir Chintawarが共同創業した同社は、大規模並列処理で複雑なエンジニアリングタスクを実行する新しいアプローチを提案しています。

Slateの中核技術は「Thread Weaving」と呼ばれるアーキテクチャです。従来のAIコーディングツールが抱えていたコンテキストウィンドウの制約を、OS的なフレームワークで解決します。中央のオーケストレータが戦略的判断を担い、TypeScriptベースのDSLで並列ワーカースレッドにタスクを割り振る分離構造を採用しています。

記憶管理においても独自のアプローチを取ります。多くのエージェントが採用する「圧縮」方式では重要な状態情報が失われるリスクがありますが、Slateはワーカースレッド完了時に成功したツール呼び出しと結論のみを要約した「エピソード」を生成します。これによりスウォーム知性を維持しながら大規模並列処理を実現しています。

商業面では従量課金制のクレジットモデルへ移行し、組織レベルの課金管理機能を備えるなどプロフェッショナルチーム向けの設計が明確です。さらにOpenAICodexAnthropicClaude Codeとの直接連携を来週リリース予定と発表しており、競合ではなくオーケストレーション層としての立ち位置を狙っています。

性能面では、Terminal Bench 2.0のmake-mips-interpreterタスクで初期バージョンが3分の2のテストに合格しました。最新のフロンティアモデルでも単体では成功率20%未満とされるこのタスクでの好成績は、オーケストレーション型アーキテクチャの有効性を示しています。同社はSlateを開発者の代替ではなく、世界的なエンジニア不足を補う協調ツールと位置づけています。

OpenAIがResponses APIにコンピュータ環境を統合しエージェント基盤を強化

シェルツールの全容

Unix CLIで多言語実行
コマンド並列実行に対応
出力上限でコンテキスト節約
ストリーミング逐次応答

コンテナとスキル基盤

ファイル・SQLite永続管理
ネットワーク許可リスト制御
スキルで再利用可能な手順定義
コンパクション機能で長時間実行

OpenAIは、Responses APIにシェルツールとホスト型コンテナワークスペースを統合し、AIモデルが実際のコンピュータ環境でタスクを実行できるエージェント基盤を構築したと発表しました。従来のプロンプト応答を超え、ファイル操作やAPI呼び出しなど幅広い業務を自動化できます。

シェルツールは従来のコードインタプリタがPython限定だったのに対し、Go・Java・Node.jsなど多言語に対応します。モデルがコマンドを提案し、Responses APIがコンテナ内で実行、結果をモデルに返すループで動作します。複数コマンドの並列実行にも対応し、処理速度を大幅に向上させています。

コンテナ環境は3つの文脈を提供します。第一にファイルシステムでデータを整理し、第二にSQLiteなどの構造化データベースで効率的にクエリを実行できます。第三にネットワークアクセスはサイドカープロキシ経由で制御され、許可リストとドメイン単位の認証情報注入により安全性を確保しています。

エージェントスキルは繰り返し発生するワークフローを再利用可能な部品として定義する仕組みです。SKILL.mdファイルとリソースをバンドルし、バージョン管理されたパッケージとしてAPI経由で管理できます。モデルはシェルコマンドでスキルを発見し、指示を解釈して同一ループ内で実行します。

長時間タスクではコンテキストウィンドウが枯渇する課題に対し、ネイティブのコンパクション機能を実装しました。モデルが会話状態を分析し、重要情報を暗号化されたトークン効率の高い表現に圧縮します。OpenAICodexもこの仕組みに依存しており、長時間のコーディングタスクを品質を落とさず継続できます。

OpenAIがClaude Code追撃へCodex開発を全社加速

コーディングAI競争の構図

Claude Codeが年間売上25億ドル超
Codex10億ドルで後塵を拝す
Cursor買収を試みるも断念

OpenAI社内の巻き返し策

2025年3月にスプリントチーム結成
Windsurf買収Microsoft介入で破談
GPT-5.2搭載でCodex利用者が急増

業界への波及と今後の課題

Claude Code1兆ドル株安誘発
安全性と開発速度の両立が焦点

OpenAIがAIコーディングエージェントCodex」の開発を全社的に加速させています。競合Anthropicの「Claude Code」が年間売上25億ドル超と急成長する一方、Codexは2026年1月時点で10億ドル超にとどまり、後発の立場に置かれています。

OpenAIは2021年にCodexの初期版を開発し、MicrosoftGitHub Copilotに技術を提供していました。しかし2022年末のChatGPTの爆発的成功により、社内リソースがチャットボットやマルチモーダルAIに集中し、専任のコーディング製品チームが長期間不在となりました。

Anthropicはこの間、実際のコードリポジトリを使ったモデル訓練に注力しました。2024年6月にClaude Sonnet 3.5がリリースされると、そのコーディング能力が開発者に高く評価され、Cursorの急成長にもつながりました。OpenAICursor買収を持ちかけましたが、創業者らは独立を選びました。

OpenAIは2025年3月にスプリントチームを結成し、同時にWindsurfを30億ドルで買収する計画も進めました。しかしMicrosoft知的財産へのアクセスを要求し、両社の関係が緊張する中で買収は破談しました。その後GPT-5.2を搭載したCodexは性能が大幅に向上し、2025年9月にはClaude Codeの5%だった利用量が2026年1月には40%まで急伸しました。

一方でAIコーディングの社会的影響も拡大しています。Wall Street JournalはClaude Codeが1兆ドル規模の株安を引き起こしたと報じ、IBMは25年ぶりの株価急落に見舞われました。安全性団体からはOpenAICodex開発を急ぐあまり安全性評価をおろそかにしているとの指摘もあり、開発競争の加速と責任あるAI開発の両立が問われています。

AnthropicとOpenAIがLLM脆弱性スキャナーを無償公開、従来SASTの限界を露呈

2社の独自スキャナー比較

Claude Code Securityが500件超の未知脆弱性を発見
Codex Securityが120万超コミットをスキャン
OpenAI14件のCVEを新規発行
両ツールとも現在無償提供
誤検知率が50%以上低減

企業セキュリティへの影響

従来SATSのパターンマッチング限界が明確化
デュアルユースリスクの深刻化
静的コードスキャンの商品化が加速
予算の重心が修復自動化へ移行
ボードへの30日パイロット実施を推奨

2026年2月20日にAnthropicClaude Code Securityを、3月6日にOpenAICodex Securityを相次いでリリースし、LLM推論を活用した脆弱性スキャナーが企業向けに無償提供された。

AnthropicClaude Opus 4.6を用い、数十年間の専門家レビューと数百万時間のファジングを経た本番OSコードベースで500件超の高深刻度ゼロデイ脆弱性を発見しました。従来のカバレッジ誘導型ファジングでは検出不能だったLZW圧縮アルゴリズムのヒープバッファオーバーフローも特定しています。

OpenAICodex SecurityGPT-5搭載の社内ツール「Aardvark」から発展し、ベータ期間中に120万件超のコミットをスキャン。OpenSSH・GnuTLS・Chromiumなど著名OSSで792件の致命的問題と1万561件の高深刻度問題を検出し、14件のCVEが新規付番されました。

Checkmarx Zeroの検証では、Claude Code Securityが8件中2件しか真陽性を返せない事例も確認されており、LLMスキャナーの精度限界と第三者監査の必要性が指摘されています。Enkrypt AI CSO Merritt Baer氏は「OSSの脆弱性発見はゼロデイ級として扱うべきで、CVSSスコアだけでトリアージすべきではない」と警告しました。

企業セキュリティ担当者には7つのアクションが推奨されています。代表リポジトリで両ツールを同時実行して既存SATSとの差分(盲点)を把握すること、ガバナンスフレームワークをパイロット前に整備すること、ソフトウェア構成分析・コンテナスキャン・DASTなど両ツールがカバーしない領域を明確にすること、そして30日間のパイロットで取得した実証データを調達判断の根拠とすることが特に重要です。

OpenAI、コード脆弱性を自動検出するCodex Securityを公開

製品の特徴と精度

脅威モデル自動生成と編集機能
サンドボックスで検証し誤検知削減
修正パッチ文脈付きで提案
フィードバック学習で精度向上

OSS貢献と実績

14件のCVEをOSSで発見・報告
OpenSSH・GnuTLS等の重大脆弱性修正
誤検知率50%以上削減を達成
OSS支援プログラムを無償提供

OpenAIは2026年3月、アプリケーションセキュリティエージェントCodex Security」のリサーチプレビューを開始しました。ChatGPT Pro・Enterprise・Business・Edu顧客向けに、初月は無料で提供されます。

Codex Securityは旧名「Aardvark」として昨年からプライベートベータを実施してきました。ベータ期間中にSSRFやクロステナント認証バイパスなどの重大脆弱性を発見し、セキュリティチームが数時間以内にパッチを適用した実績があります。

同ツールの最大の特徴は、リポジトリを分析して脅威モデルを自動生成し、プロジェクト固有の文脈に基づいて脆弱性を優先順位付けする点です。サンドボックス環境での自動検証により、誤検知率を50%以上削減し、重要度の過大報告も90%以上減少させました。

OSSコミュニティへの貢献も注目されます。OpenSSH、GnuTLS、GOGS、Chromiumなど広く使われるプロジェクトで14件のCVEを報告しました。過去30日間で外部リポジトリの120万コミット以上をスキャンし、792件の重大・1万561件の高深刻度の脆弱性を検出しています。

OpenAIはOSSメンテナー向けに「Codex for OSS」プログラムも開始し、無償のChatGPT ProアカウントやCodex Securityを提供します。vLLMなどのプロジェクトが既に活用を開始しており、今後数週間で対象を拡大する予定です。

Block社ドーシーCEO、AI理由に従業員半数を解雇

大規模レイオフの背景

従業員約5000人を一斉解雇
AI進化で企業構造の抜本改革が必要と主張
12月のOpus 4.6やCodex 5.3が転機
過剰採用ではなく先手の判断と説明

AI中心の新企業像

管理階層を撤廃し知能層を構築
会社全体をミニAGI化する構想
顧客が自ら製品をバイブコーディング
1〜2年で対応しなければ存亡の危機

X・分散化・政治への見解

Xのアルゴリズム選択に改善余地
Blueskyもイデオロギー偏向と批判
政府と民間企業の分離が必要

Block(旧Square)のジャック・ドーシーCEOは、約1万人の従業員のうちほぼ半数を解雇したことを明らかにしました。同社は直近四半期に約30億ドルの利益を計上し、時価総額390億ドルの好業績下での決断です。

ドーシー氏は解雇の理由について、2025年12月にAnthropicOpus 4.6OpenAICodex 5.3などのAIツールが大規模コードベースへの対応力を劇的に向上させたことを挙げました。これにより企業の構造そのものを根本から見直す必要が生じたと説明しています。

同氏が描く新たな企業像は、従来の管理階層を完全に撤廃し、会社全体に知能レイヤーを構築する「ミニAGI」型の組織です。全社員がこの知能層に問いかけ、意図を組み込み、顧客向けの機能を迅速にスケールできる体制を目指しています。

イーロン・マスク氏が率いるX(旧Twitter)については、私企業化とビジネスモデル変革を評価しつつも、アルゴリズムによるフィルターバブルやイデオロギー的分断を批判しました。自身が創設に関わったBlueskyについても、VC投資を受けて普通の企業化した点に失望を表明しています。

ドーシー氏は、AIに対応しない企業は1〜2年以内に存亡の危機に直面すると警告しました。政治については「超混乱している」と述べ、テクノロジー企業と政府の分離の重要性を強調。AI企業間のモデル切り替えコストがほぼゼロである点にも言及し、業界の競争構造への懸念を示しました。

OpenAI、教育機関向けAI活用支援ツールを大幅拡充

学生のAI活用格差

週9億人ChatGPT利用
学生層が最大の利用者層
上級者でも活用度は90〜99%不足
基本利用から高度応用への移行が課題

教育機関向け新施策

研究用Prism環境を無料公開
OpenAI認定資格を試験導入
学習成果測定スイートを近日提供

OpenAIは、教育機関AI活用の格差を解消するための新たなツール群とリソースを発表しました。毎週9億人ChatGPTを利用するなか、大学生が年齢層別で最大の利用者であることが明らかになっています。

同社の分析によると、大学生は文章作成や分析、コーディングなど11分野中5分野で主流ユーザーのトップに立つ一方、パワーユーザーと比較すると活用度は90〜99%低い水準にとどまっています。この「能力活用格差」の解消が教育分野における重要課題と位置づけられています。

具体的な施策として、コーディングエージェントCodex」を授業に導入し、学生がバグ修正やテスト実行などの実務経験を積める環境を提供します。また、LaTeX対応の研究協業環境「Prism」を無料で公開し、論文執筆からAI支援ワークフローまでを一元化します。

アリゾナ州立大学やカリフォルニア州立大学システムでは、OpenAI認定資格のパイロット運用が開始されました。学生・教職員が実践的なAIスキルを習得し、雇用主に対して能力を証明できる仕組みです。ギリシャ、エストニア、UAEなど各国の教育システムも導入を進めています。

教員支援にも注力しており、「ChatGPT for Teachers」は全米の主要学区で15万人以上の教職員が利用中です。米国教員連盟との連携やOpenAI Academyを通じたコミュニティカレッジ向け無料研修も展開し、AI教育の裾野拡大を図っています。

OpenAIがGPT-5.4発表、PC操作や100万トークン対応

モデル性能の飛躍

GDPval専門家超え83%達成
OSWorldでPC操作成功率75%
事実誤認が33%減少
推論トークン消費量の大幅削減

エージェント基盤の進化

コンピュータ操作のネイティブ対応
Tool Searchでトークン47%削減
APIで100万トークン文脈窓
Excel・Sheets連携プラグイン提供

OpenAIは2026年3月5日、最新AIモデルGPT-5.4ChatGPT、API、Codexで公開しました。推論コーディングエージェント機能を統合した同社史上最高性能のフロンティアモデルと位置づけています。

GPT-5.4は同社初の汎用モデルとしてネイティブコンピュータ操作機能を搭載しています。Playwrightによるコード実行やスクリーンショットに基づくマウス・キーボード操作が可能で、OSWorldベンチマークでは人間の72.4%を上回る75.0%の成功率を達成しました。

ビジネス用途ではスプレッドシートプレゼンテーション、文書作成の能力が大幅に向上しています。投資銀行業務のモデリングタスクでは平均87.3%のスコアを記録し、前モデルGPT-5.2の68.4%から約19ポイント改善されました。

API向けにはTool Search機能を新たに導入し、多数のツール定義を事前にプロンプトへ含める従来方式を刷新しました。MCP Atlasベンチマークでは同精度を維持しつつトークン使用量を47%削減する効果が確認されています。

価格は入力100万トークンあたり2.50ドル、出力15ドルに設定され、GPT-5.2より引き上げられました。一方で推論効率の向上により、タスク全体のコストは抑制される見込みです。APIでは最大100万トークンコンテキストウィンドウに対応しています。

LangChain、コーディングエージェント向けスキル評価手法を公開

評価パイプラインの要点

Dockerで再現性ある環境構築
制約付きタスクで採点精度向上
バグ修正型タスクが検証に有効
スキル有無で完了率を比較

スキル設計の知見

XMLタグでモジュール化推奨
AGENTS.mdで確実な呼び出し実現
スキル数は12以下で正確に選択
LangSmithで軌跡を可視化

LangChainは2026年3月、Claude CodeCodexなどのコーディングエージェントに与える「スキル」の評価手法とベストプラクティスをブログで公開しました。スキルとは、特定領域でエージェントの性能を高めるための指示・スクリプト・リソースの集合体です。

評価パイプラインの基本は、タスクを定義し、スキルの有無エージェントの成績を比較する手法です。テスト環境には軽量なDockerコンテナを用い、ディレクトリの初期状態を統一することで再現性を確保しています。

タスク設計では、オープンエンドな課題よりもバグ修正型の制約付きタスクが有効であると報告されています。採点が容易になるだけでなく、エージェントの設計空間を適切に限定できるためです。評価指標には、スキルの呼び出し有無、タスク完了率、ターン数、実行時間などを採用しています。

スキル設計においては、AGENTS.mdCLAUDE.mdにスキルの使用方法を記載することで呼び出し率が安定しました。スキルを単独でプロンプト任せにした場合の呼び出し率は最大70%にとどまる一方、事前読み込みファイルに案内を記載すると一貫した呼び出しが実現できたと報告されています。

実験の結果、スキルを搭載したClaude Codeのタスク完了率は82%に達した一方、スキルなしでは9%に低下しました。LangSmithのトレース機能でエージェントの全行動を記録・分析し、失敗原因の特定とスキル内容の反復改善を高速に回すワークフローが紹介されています。

ByteDance動画AI「Seedance 2.0」に計算資源と著作権の壁

技術と普及の現状

Seedance 2.0が業界に衝撃
映画監督級の映像生成能力
GPU不足で数時間待ちの状態
中国国内アプリ限定で提供中

著作権問題の深刻化

Disney等が差止め書簡送付
ユーザーが著名キャラ映像を大量生成
中国のIP保護制度の未整備が背景

米中AI格差の構図

動画AIでは中国米国に先行
コーディングAIでは米国が優位

ByteDanceは2025年2月、動画生成AI「Seedance 2.0」を発表しました。中国のゲーム開発者や映像クリエイターから「監督のように考える」と高い評価を受け、AI動画の品質に懐疑的だった層にも衝撃を与えています。

しかし現時点では計算資源の深刻な不足が普及の障壁となっています。利用者によると、5秒の動画生成に約9万人待ちの行列が発生し、数時間の待機が必要です。月額70ドル超の有料会員でも長時間待たされる状況で、深夜に生成リクエストを送るなどの裏技が共有されています。

Disney、Netflix、Paramountなど大手映画スタジオがByteDance著作権侵害を主張する差止め書簡を送付しました。ユーザーがウルヴァリンやトム・クルーズなど著名キャラクターの映像を生成・拡散しており、グローバル展開時の法的リスクが急速に高まっています。

中国のエンタメ業界はハリウッドとは対照的にAI動画を積極的に受容しています。カンヌ受賞の賈樟柯監督がSeedance 2.0で作品を制作し公開するなど、著名クリエイターの参入が相次いでいます。春節晩会の背景映像にも採用され、政府の後押しも見られます。

米中AI分野の棲み分けも鮮明になっています。動画AIではKling AIを含む中国勢が世界をリードする一方、コーディングAIでは中国開発者Claude CodeCodexに依存しています。Seedance 2.0のAPI価格は15秒動画で約2ドルと公表されており、今後のサードパーティ開放が注目されます。

Raycast、AIコーディング統合アプリ基盤「Glaze」を発表

Glazeの基本機能

プロンプト入力だけでアプリ生成
クラウド保存やAPI管理を自動化
他人のアプリを取得しカスタマイズ可能

事業戦略と展望

Mac版先行、Windows・モバイル展開予定
無料版と月額20〜30ドルの有料プラン
Glaze Storeでアプリ共有・発見
Mac・WindowsApp Storeへの挑戦を表明

Raycastは、Mac向けランチャーアプリの開発元として知られる企業です。同社は新製品Glazeを発表し、AIを活用した「バイブコーディング」によるアプリの構築・利用・共有・発見を一元化するプラットフォームを提供します。

Glazeの最大の特徴は、プロンプトを入力するだけでアプリを一発生成できる点です。基盤モデルにはClaude CodeOpenAICodexを採用しており、クラウドストレージやAPI連携、デザイン原則の適用といった技術的な作業をすべて自動で処理します。

共同創業者のトーマス・ポール・マン氏は「コードを触る必要があるなら、それは我々の失敗だ」と述べています。Glaze Storeというディレクトリでは、他のユーザーが作成したアプリを閲覧・取得でき、さらに自分好みにカスタマイズして使うことも可能です。

GlazeはRaycastのランチャー機能と深く統合されており、生成したアプリはRaycastの拡張機能として自動的に連携します。現在はMac版のみですが、今後Windowsやモバイルにも対応予定で、無料版に加え月額20〜30ドルの有料プランを計画しています。

マン氏は現在を「ソフトウェアのiTunesモーメント」と表現し、あらゆるアプリが一か所で手に入る時代の到来を予見しています。MacやWindowsApp Storeに挑戦する意欲を示しており、個人の小さなユーティリティからチーム専用ツールまで、ソフトウェアの在り方を根本から変える可能性を秘めています。

OpenAI、社内データエージェントを2名で構築し全社展開

エージェントの全容

GPT-5.2基盤で自然言語対応
70%のコードをAIが生成
600PB超・7万データセットに対応
問合せ1件あたり2〜4時間短縮

技術的工夫と課題

Codexがテーブル探索を自動化
6層のコンテキスト階層で精度向上
過信防止の発見フェーズ強制
少量精選データが大量投入に勝る結果

企業への示唆

製品化せず構築用APIを外部提供
データガバナンスが成否を左右

OpenAIは、社内のデータ分析エージェントをわずか2名のエンジニアが3カ月で構築したことを明らかにしました。このツールはSlackやWebインターフェースから自然言語で問い合わせると、チャートやダッシュボードを数分で返す仕組みです。

同社のデータ基盤責任者であるEmma Tang氏によると、600ペタバイト超のデータと7万のデータセットを扱う環境で、5000人の社員のうち4000人以上がこのエージェントを日常的に利用しています。財務チームの地域別売上比較からエンジニアのレイテンシ調査まで、部門横断で活用されています。

技術的な最大の課題は、7万のデータセットから正しいテーブルを見つけることでした。Codexを活用した「Codex Enrichment」プロセスが日次でテーブルの依存関係や結合キーを自動解析し、ベクターデータベースに格納することでこの問題を解決しています。

モデルの過信という行動上の課題に対しては、プロンプトエンジニアリングで発見フェーズに時間をかけるよう強制する手法を導入しました。また評価の結果、コンテキストは量より質が重要であり、厳選された少量の情報のほうが高精度な結果を生むことが判明しています。

OpenAIはこのツールの製品化は予定しておらず、Responses APIやEvals APIなど外部利用可能なAPIのみで構築したと強調しています。Tang氏は「データガバナンスこそがAIエージェント成功の前提条件」と述べ、データの整備と注釈付けの重要性を企業に訴えました。

VC投資家がAI SaaS企業への選別を強化、汎用ツール離れ鮮明に

投資家が避けるSaaS領域

薄いワークフローや汎用水平ツールの敬遠
UIと自動化だけの差別化では参入障壁が不十分
独自データのない垂直SaaSへの投資縮小

SaaS業界の構造変化

AIエージェント台頭で座席課金モデルが崩壊危機
ソフトウェア株から約1兆ドルの時価総額が消失
KlarnaがSalesforce CRMを自社AI系に置換

今後の投資トレンド

ワークフロー所有とドメイン専門性に資本集中
成果報酬型や従量課金モデルへの移行加速

複数のVC投資家がTechCrunchの取材に応じ、AI SaaSスタートアップへの投資基準が大きく変化していることを明かしました。汎用的な水平ツールや薄いワークフロー層、独自データを持たない垂直SaaS投資対象から外れつつあります。

645 VenturesのAaron Holiday氏は、投資家が現在注目するのはAIネイティブ・インフラ、独自データを持つ垂直SaaS、ミッションクリティカルなワークフローに深く組み込まれたプラットフォームだと説明しました。AltaIR CapitalのRyabenkiy氏も製品の深さが不可欠と強調しています。

AIエージェントの進化により、従来の座席課金モデルが根本から揺らいでいます。Claude CodeOpenAI Codexなどのツールにより、SaaS製品の中核機能を容易に再現できるようになり、企業は自社開発を選ぶケースが増加しています。KlarnaがSalesforce CRMを自社AIシステムに置き換えた事例がその象徴です。

公開市場では、Anthropicの新製品発表のたびにSaaS株が下落する現象が続いています。2026年2月初旬には約1兆ドルの時価総額がソフトウェア株から消失しました。専門家はこの動きを「SaaSpocalypse」と呼び、SaaS終局価値が史上初めて根本的に問われていると指摘しています。

一方で投資家らはSaaSの完全な終焉は否定しています。コンプライアンス対応や監査支援など企業の基幹業務を支えるソフトウェアへの需要は持続するとの見方です。今後は従量課金や成果報酬型への移行が進み、ワークフロー所有とドメイン専門性を持つ企業に資本が集中すると予測されています。

FigmaがCodexと提携しデザイン連携を実現

統合の技術的内容

Figma MCPサーバー経由でCodexと直結
コード→デザインの即時変換が実現
Dev Mode・FigJamとのネイティブ連携
先週のAnthropic統合に続くマルチAI戦略
設計・実装サイクルの大幅短縮が可能

開発ワークフローへの影響

エンジニアコーディング環境から離れず設計変更
プロダクト開発の反復速度向上
デザインシステムとの自動整合が可能

FigmaOpenAIは2026年2月26日、Figma MCPサーバーを通じてOpenAI Codexデザインプラットフォームを直接連携させる統合を発表しました。エンジニアコーディング環境から離れることなく、デザインキャンバスの変更・反復が行えるようになります。

この統合の核心はFigma MCPサーバーの活用で、CodexFigmaデザインツール、Dev Mode、FigJamに直接アクセスできる点です。先週発表されたAnthropicとのMCP統合に続き、Figmaはマルチ大手AIとのエコシステム構築を加速しています。

開発チームにとっての実質的な価値は、コード変更がデザインに即座に反映されるフィードバックループの短縮です。従来は別々のツールを往来していた作業が一元化されます。

この動きはソフトウェア開発ワークフローにおけるAIエージェントの役割が、コード生成から設計・実装の統合制御へと拡張していることを示しています。

FigmaOpenAIAnthropic双方と提携した事実は、AIコーディングアシスタント市場の競争が激化し、各プラットフォームが設計ツール統合を差別化要因として争っていることを示しています。

インドAI投資競争、8エクサフロップス配備へ

インドAIインフラへの巨大投資

UAE・G42とCerebras8エクサフロップスの計算資源をインドに配備
Peak XVが13億ドルインド・アジア特化ファンドを設立
India AI Impact SummitがグローバルAI大手を集めてニューデリーで開催
インドデータ主権・コンプライアンス要件に準拠した設計
インフラ先行投資でAIエコシステムの地盤固め

インドAI消費・スタートアップ市場

SarvamがインドNLP特化チャットアプリIndusを正式公開
OpenAI India利用者の80%が30歳未満という若年層集中
ChatGPTインド利用は業務用途35%でグローバル平均超え
OpenAIのCodingアシスタントCodexインドで世界平均の3倍利用
ローカル言語モデル需要とグローバルAIの競争が激化

インドは2026年、世界で最も注目されるAI市場となっています。India AI Impact Summitには、OpenAIAnthropicNVIDIAMicrosoftGoogleCloudflareなどの主要AI大手のエグゼクティブが集結し、インドへのAI投資を競うように発表しました。

インフラ投資では、アブダビのG42がAIチップメーカーCerebrasと組み、8エクサフロップスの計算能力を持つスーパーコンピュータをインドに設置します。この規模はインドのAI産業の基盤を大幅に強化するものです。Peak XVは13億ドルの新規ファンドを設立し、AI分野に重点を置いています。

スタートアップ面では、インドのAI企業Sarvamがインド人ユーザー向けに最適化したチャットアプリ「Indus」を公開しました。ヒンディー語など地域言語への対応を強みとして、OpenAIGoogleとの差別化を図っています。ローカルAIとグローバルAIの競争が本格化しています。

OpenAIのデータによると、インドでのChatGPT利用者の約80%が30歳未満で、業務用途での利用が全体の35%を占めています。特にAIコーディングアシスタントの利用がグローバル平均の3倍という数字は、インドのIT産業との強い親和性を示しています。

インドのAIブームは、大規模インフラ投資、若年層の高い採用率、ローカルスタートアップの台頭という三つの力が重なる特別な現象です。グローバル vs ローカルの競争がインドのAI市場の形を決定づける2026年が始まっています。

GitHubとOpenAIがCodexとSoraでエージェントコーディングを拡張

エージェントコーディングの進化

GitHubエージェントワークフローでリポジトリタスクを自動化
OpenAICodexSoraのスケールアクセスを拡大
AIエージェントが開発ライフサイクルに深く統合

GitHubはAgenttic Workflowsを発表し、AIエージェントがリポジトリのタスク(コードレビュー、PR作成、ドキュメント更新など)を自動化できる機能を提供します。開発プロセス全体のエージェント化が加速しています。

OpenAIは同時期にCodexSoraの利用上限引き上げとアクセス拡大を発表しました。コーディングとビジュアル生成という二つの重要なAI機能のスケールが多くの開発者に開放されます。

この組み合わせは、コード生成だけでなくUI/UXのプロトタイピングにも活用できる統合的な開発環境を示唆しており、ソフトウェア開発の未来像として注目されます。

CodexとClaudeがカスタムGPUカーネルを全ユーザーに解放

GPU最適化の民主化

カスタムカーネル生成がAI支援で一般開発者に解放
CUDA専門知識なしでGPU最適化を実現
AI推論コストの削減を広く可能に

CodexClaudeのコード生成能力を組み合わせて、専門知識なしでカスタムGPUカーネルを生成できる機能が全ユーザーに開放されました。これまでCUDA専門家のみが担えたGPU最適化がAIの力で民主化されます。

カスタムGPUカーネルは特定の計算ワークロードに対してGPU使用効率を大幅に改善できますが、その開発には深い専門知識が必要でした。AIによる生成でこの技術的障壁が大幅に下がります。

この機能はMLエンジニアや研究者が推論効率を最大化する際の重要なツールとなります。自社AI推論のコスト削減に取り組む企業にとって実務的な価値があります。

HarnessがCodexでエージェントファースト開発を5ヶ月実践した知見

実践から得た知見

5ヶ月間のCodex活用実験の成果を公開
エージェントファーストの開発体制への移行
実務での課題と成功パターンを詳説

CI/CDプラットフォームのHarnessは、OpenAICodexを活用したエージェントファースト開発の5ヶ月間にわたる実験結果を公開しました。実際の製品機能の構築・出荷にエージェントを活用した現場レポートとして注目されます。

実験から得られた主な知見として、エージェントは繰り返しのルーティン作業では高い効果を発揮する一方、複雑な依存関係のある機能開発では人間の監督が依然として必要であることが確認されました。

このような実践からの学びは、AI開発ツールの導入を検討する企業にとって非常に参考になります。理論ではなく実際の開発現場での課題と解決策が語られており、日本の開発チームにも応用可能な示唆が含まれています。

OpenAI Codexアプリが1週間で100万ダウンロード突破

成長と影響

Mac専用Codexアプリが1週間で100万DL達成
全体Codexユーザーが前週比60%増
Sam AltmanがX上で自らマイルストーンを発表
ChatGPT初期リリース時の爆発的成長を想起させる
AIコーディング市場での存在感を急速に拡大

競争環境への影響

GitHub CopilotCursorWindsurf等との競争激化
OpenAIコーディングツール市場に本格参入
月間アクティブユーザー3億人超のChatGPTを基盤に展開
開発者市場でのシェア争いが本格化
AI支援コーディングの主流化を加速

OpenAIのCEO Sam AltmanはX上で、Mac向けの独立したCodexアプリケーションがリリース後1週間で100万ダウンロードを突破したと発表しました。これは全体のCodexユーザー数の前週比60%増を反映しています。

この成長速度は2022年末のChatGPT初期公開時の爆発的普及を想起させます。AI コーディングツール市場はGitHub CopilotCursorWindsurfなどが激戦を繰り広げており、OpenAIChatGPTの巨大ユーザーベースを武器に参入しました。

Codexアプリは現在Mac限定ですが、複数の並行AIコーディングタスクを実行できる機能を提供しています。3億人超の月間アクティブユーザーを持つChatGPTエコシステムと連携した展開が今後の競争力の鍵となります。

AI支援コーディングの主流化は、ソフトウェアエンジニア生産性に直接影響を与える重要なトレンドです。1週間での100万DLという数字は、開発者コミュニティにおけるOpenAIへの信頼と需要の高さを示しています。

今後のWindows版展開やエンタープライズ機能の拡充が注目されます。コーディングツール市場でのシェア争いは、AI企業のデベロッパー戦略の試金石となりそうです。

OpenAIがGPT-5.3-Codexを発表、コーディング超えたエージェント戦略

GPT-5.3-Codexの特徴

コーディング以外にも対応拡大
エージェントタスク実行が強み
システムカードリスク開示
プログラミング自律完遂能力
Claude Opus 4.6と同日リリース
AI競争の激化を象徴

開発者・企業への影響

複雑な業務自動化が可能に
デプロイパイプラインへの統合
コスト対性能の比較検討が必要

OpenAIは2026年2月5日、新しいコーディングエージェントモデル「GPT-5.3-Codex」を発表した。AnthropicClaude Opus 4.6とほぼ同日のリリースとなり、AI競争の激化を示した。

GPT-5.3-Codexはコード生成に特化した従来のCodexシリーズを進化させ、コーディング以外のエージェントタスクにも対応する汎用性を持つ。

OpenAIはシステムカードでモデルの能力・制限・安全性評価を詳細に開示しており、エンタープライズ顧客が導入判断をしやすい体制を整えた。

Arstechnicaの報道によれば「Codexはもはやコードを書くだけではない」とされ、複雑な業務プロセス全体を自律的に遂行できる能力が確認されている。

GPT-5.3-Codexとプレスの発表はOpenAIのエンタープライズ向けエージェントプラットフォーム戦略の一環で、Frontierとの統合でさらなる相乗効果を狙っている。

AnthropicがClaude Opus 4.6を公開、100万トークンとエージェントチーム機能

Opus 4.6の主要機能

100万トークンコンテキストウィンドウ
エージェントチーム機能を初搭載
コーディング超えた汎用性を強調
OpenAI Codexに正面から対抗
推論速度の大幅改善も実現
複数エージェント協調動作が可能

市場・競合へのインパクト

AIコーディング市場の競争激化
エンタープライズ需要の取り込みを狙う
スーパーボウル直前の戦略的発表

Anthropicは2026年2月5日、最新の大型モデル「Claude Opus 4.6」を公開した。100万トークンのコンテキストウィンドウと、複数AIが協調する「エージェントチーム」機能が目玉だ。

100万トークンのコンテキストは従来の4〜8倍以上の情報を一度に処理できることを意味し、大規模コードベースの解析や長文書類の一括処理が現実的になった。

エージェントチーム」はClaude同士が役割分担して複雑なタスクを遂行する仕組みで、ソフトウェア開発・リサーチ・分析業務での生産性向上が期待される。

リリースのタイミングはOpenAIGPT-5.3-Codex発表とほぼ同日で、スーパーボウルの週という注目度の高い時期を両社が狙ったことが読み取れる。

Claude Opus 4.6の登場はコーディング特化モデルから汎用エージェントAIへのシフトを明確にしており、企業の業務自動化プロジェクトに直接応用可能な水準に達した。

GitHubがClaudeとCodexのAIコーディングエージェントを統合

統合の詳細と利用条件

GitHub・VS CodeでClaudeCodexが利用可能
Copilot Pro+または Enterprise向け
GitHub Mobileでもエージェント操作対応
Agent HQで一元管理が可能
OpenAI CodexのApp Server構築詳細公開
コンテキスト切り替え摩擦の削減が目的

開発者への影響

PR作成からコードレビューまで自動化
AIコーディング市場での競争激化

GitHubは2026年2月4日、AnthropicClaudeOpenAICodexを直接GitHub上で利用できるパブリックプレビューを開始した。対象はCopilot Pro+またはCopilot Enterpriseのサブスクリプションユーザーだ。

この統合によりGitHubGitHub Mobile、Visual Studio Codeの各環境からAIコーディングエージェントシームレスに呼び出せるようになり、開発ワークフローの断絶が大幅に解消される。

Agent HQと呼ばれる新インターフェースにより、ClaudeCodex一元的に管理し、タスクに応じて最適なエージェントを選択することができる。

OpenAICodexのApp Server構築の技術的詳細を公開し、複数サーフェス(Webアプリ、CLI、API)での一貫した動作を実現する仕組みを説明した。

GitHubへのAIエージェント統合は開発者生産性向上に大きく寄与すると期待されており、AIコーディングツール市場における競争の新たな軸になっている。

AppleのXcode 26.3がClaudeとCodexを統合しエージェントコーディング時代へ

Xcode 26.3の新機能

Claude Agent SDKの統合
OpenAICodexのネイティブ対応
MCPプロトコルでの接続

開発者への影響

Appleプラットフォーム向けエージェント開発
Xcodeが主要AIツールの窓口に
iOSmacOS開発の生産性向上

AppleはXcode 26.3でAnthropicClaude Agent SDKとOpenAICodexを統合し、Appleプラットフォーム向けアプリ開発に本格的なエージェントコーディング機能を追加しました。

この統合はModel Context Protocol(MCP)を介して行われており、開発者はXcode内から直接Claude CodeCodexエージェント機能を呼び出してコード生成・リファクタ・テストを自動化できます。

AnthropicClaude Agent SDK対応により、iOSmacOS向けアプリにAIエージェント機能を組み込む開発が格段に容易になり、Apple Intelligenceとの連携も視野に入ります。

Xcodeが複数のAIプロバイダーに対応することで、開発者は好みのAIモデルを選択でき、ベンダーロックインを回避しながらAI補助開発を享受できます。

この発表はAppleが独自AIモデルだけでなく、外部AIエコシステムとのオープンな統合戦略を採用していることを示す重要なシグナルです。

AlibabaのQwen3-Coder-Nextがバイブコーダー向けの強力なオープンソースモデルに

モデルの特徴

超スパースアーキテクチャ採用
オープンソースで無料利用可能

競争への影響

Claude CodeCodexへの対抗
中国AIオープンソースの躍進
開発者コスト削減効果

アリババのQwenチームは、バイブコーディングユーザー向けに最適化されたオープンソースの超スパースモデル「Qwen3-Coder-Next」を公開しました。高い性能と低い計算コストを両立する超スパースアーキテクチャが特徴です。

超スパースモデルは、活性化されるパラメータが全体の一部に限られるため、同等性能のデンスモデルより低コスト・低レイテンシーで動作し、ローカル実行も現実的になります。

Claude CodeOpenAI CodexGitHub Copilotなど有料コーディングAIに対し、高品質なオープンソース代替を提供することは、コスト重視の開発者や企業への強い訴求力を持ちます。

Qwen3の一連のリリースは、中国のAI研究コミュニティがグローバルなオープンソースAIリーダーとして台頭していることを改めて示しています。

開発者にとってQwen3-Coder-Nextは実用的な選択肢であり、コーディングAIの競争激化がすべての開発者に恩恵をもたらします。

OpenAIがmacOS向けCodexデスクトップアプリを発表、並列AIコーディングエージェントを実現

Codexアプリの機能

複数エージェントの並列実行
長時間タスクの管理
Claude Codeへの対抗

開発者への影響

コーディングパラダイムの転換
チーム型AI開発の実現
macOSネイティブ体験

OpenAIは2026年2月2日、macOS向けのCodexデスクトップアプリを発表しました。単一のAIアシスタントとの対話型開発から、複数のAIエージェントが並列で異なるタスクを実行する「チーム型開発」への転換を可能にします。

Codexアプリは長時間実行タスクの管理・複数エージェントへの作業分配・進捗の可視化などの機能を持ち、Anthropicの人気ツールClaude Codeへの直接的な対抗として位置付けられています。

開発者にとってこれは、単に作業速度が上がるだけでなく、アーキテクチャレベルで複数の問題を同時に解決するという新しい開発モデルへの移行を意味します。

ただしエージェント型開発は適切なテスト・コードレビュー・ロールバック計画なしには技術的負債を急増させるリスクもあり、エンジニアリング文化の成熟も必要です。

この発表はAIコーディングツール競争の激化を示しており、GitHub CopilotCursorWindsurf等との競争がさらに激しくなるでしょう。

OpenAIがCodexエージェントループの内部設計を公開

アーキテクチャの詳細

マルチステップコード生成
テスト・デバッグの自動化
自律的なコーディングの実現

開発者への示唆

エージェント型AIの設計パターン
ループ設計の考え方
失敗回復の仕組み
実装の参考事例

OpenAICodexコーディングAIエージェントのループ設計を詳細に解説したブログ記事を公開した。計画・実行・テスト・修正というエージェントループの全工程を明らかにした。

エージェントが自律的にコードを書き、テストし、失敗から学んで修正する過程の設計原則が示されており、AI開発者にとって重要なアーキテクチャ参考資料となる。

この公開は、エージェント型AIの設計パターンへの理解を深め、自律コーディングエージェントの次世代開発を加速させると見られる。

DatadogがOpenAI Codexでシステムレベルのコードレビューを実現

大規模コードレビューの自動化

DatadogがOpenAI Codexを使ったシステムコードレビューを展開
数百万行規模のコードベースを自動的にレビュー
セキュリティ脆弱性・品質問題・パフォーマンス改善を検出
人間の reviewer では見落としやすい問題を発見
CI/CDパイプラインに統合してプルリクエスト毎に自動実行
開発速度を落とさずにコード品質を維持

OpenAIが紹介したDatadogの事例では、Codexを使ってシステム全体のレベルでのコードレビューを自動化しています。個々のプルリクエストを審査するだけでなく、コードベース全体の整合性を評価する仕組みを構築しています。

Datadog社内のコードリポジトリは巨大であり、人間のレビュアーだけでは全体的な品質維持が困難です。Codexによる自動スキャンは、セキュリティ脆弱性、パフォーマンスのアンチパターン、コーディング規約違反などを一括してフラグアップします。

この事例はSREやプラットフォームエンジニアにとって参考になるAI活用パターンです。大規模なマイクロサービスアーキテクチャを持つ企業ほど、Codexのようなシステムレベルのコードレビュー自動化の価値が高まります。

CursorがGraphite買収でAI開発環境を強化

Graphite買収の意義

AIコードレビューツールGraphiteを買収
評価額2.9億ドル超の価格で取得
スタックPRで並行開発が可能
生成から出荷まで一貫環境構築

AIコーディング対決

4大エージェントマインスイーパー対決
音声・モバイル対応も同一課題で評価
盲検判定で公平な比較を実施
最前線モデルの精度向上を確認

AIコーディングアシスタントCursorは、AIを活用したコードレビューデバッグツールのGraphiteを買収したと発表しました。買収額は非公開ですが、Graphiteの直近評価額2.9億ドルを大幅に上回ると報じられています。

Graphiteの主要機能であるスタック型プルリクエストは、承認待ちなしに複数の依存変更を並行して扱えるワークフローを提供します。AIが生成したコードのバグ修正サイクルを大幅に短縮する可能性があります。

Cursorは11月にも採用戦略会社Growth by Designを買収するなど積極的なM&A;を展開しており、評価額290億ドルの同社がAI開発の全工程を統合した環境構築を目指していることがわかります。

Ars Technicaは4つの主要AIコーディングエージェントCodex/GPT-5Claude Code/Opus 4.5、Gemini CLI、Mistral Vibe)にマインスイーパーを再実装させる比較実験を行いました。音声エフェクト・モバイル対応・サプライズ機能付きの完全版ゲームが課題です。

エージェントはHTML/JavaScriptファイルを直接操作し、ブラインド評価で結果が審査されました。AIコーディングツールへの開発者の信頼が揺れるなかで、最前線モデルが着実に精度向上を遂げていることが示されました。

Claude 4コーデックスとReplit安全技術

コーデックス詳細

コーデックスがGAで正式提供開始
CVE-Benchで87%を記録
長期セッションも文脈維持
防衛用途に段階的解放

Replit安全基盤

スナップショットで即座にロールバック
並列サンドボックスで複数解法試行
エージェント暴走を技術的に防止

AnthropicはAIコーディングエージェントClaude 4 Codex」を正式リリースしました。複数ファイルにわたる複雑な実装タスクを高い精度で自律的にこなします。

コンテキスト圧縮技術により、大規模リポジトリを横断する長期セッションでも文脈を正確に保ちながら継続作業ができ、複雑なタスクの長時間自律実行を安定して実現しています。

サイバーセキュリティ評価のCVE-Benchでは87%のスコアを記録し、従来モデルを大幅に上回る性能を示すことで防衛的セキュリティ用途への適用可能性を証明しました。

OpenAIは信頼できるセキュリティ研究者向けに防衛的サイバーセキュリティのパイロットプログラムを開始し、審査を通過したパートナーから順次利用範囲を段階的に拡大していく方針を明示しています。

ReplitはAIエージェントを安全に運用するための「スナップショットエンジン」の技術詳細を公式ブログで公開し、オープンソースコミュニティへの知見共有に貢献しました。

このスナップショット技術により、AIエージェントが誤った変更を加えた場合でも即座に以前の正常な状態へロールバックすることが技術的かつ確実に保証されており、安全性が大きく高まります。

今後は並列サンドボックスで複数の解法を同時試行する「並列サンプリング」機能の拡充も開発ロードマップに含まれており、エージェントの問題解決精度のさらなる向上が幅広い領域で期待されています。

CodexでSora Androidを28日で開発

わずか4人のチームが実現した高速リリース

4人のエンジニアCodexと並走し28日で本番リリース
GPT-5.1-Codexモデルを使用、誰でも利用可能な同バージョン
Play Storeで初日1位、24時間で動画生成100万件超
クラッシュフリー率99.9%の高品質を維持
コード全体の約**85%**をCodexが生成
iOSコードをKotlinへ意味保持で翻訳、クロスプラットフォーム開発を代替

Codexを最大活用するための実践的ワークフロー

AGENT.mdでアーキテクチャ方針を明文化しセッション間の一貫性を確保
まず理解・計画フェーズを経てから実装を依頼する手順が安定稼働の鍵
複数セッションを並列実行し、playback・search・エラー処理を同時進行
大規模タスクでは計画書をファイル保存してコンテキスト超過に対処
コードレビューにもCodexを活用し、マージ前のバグ検出に貢献
ボトルネックはコード執筆からアーキテクチャ判断・フィードバックへ移行

OpenAIエンジニアリングチームは、AIコーディングエージェントCodex」を活用し、SoraAndroidアプリをわずか28日で開発・グローバルリリースしました。投入したエンジニアはわずか4名であり、従来の開発常識を大きく覆す成果となっています。

使用したモデルはGPT-5.1-Codexの早期版であり、現在は誰でも利用できるバージョンと同一です。リリース初日にGoogle Play Storeで1位を獲得し、Androidユーザーは24時間で100万本以上の動画を生成しました。クラッシュフリー率は99.9%を維持しており、品質面でも従来型の開発プロセスと遜色ありません。

開発全体を通じてコードの約85%をCodexが生成しました。チームはアーキテクチャ設計・依存性注入・ナビゲーション構造などの基盤を自ら実装し、その上でCodexにパターンを学習させる方針を採りました。「動くものを速く作る」のではなく「我々のやり方で動くものを作る」という考え方が成功の核心です。

Codexを安定運用するうえで重要だったのは、AGENT.mdファイルへのスタイルガイドやパターンの明文化です。セッションをまたいで同じ指針を適用できるため、複数の並列タスクが同一のコーディング規約に従って進行しました。

実装前に理解・計画フェーズを設けるワークフローも効果的でした。Codexに関連ファイルを読ませてデータフローを説明させ、チームが認識を修正したうえで設計書を作成し、その計画に沿って実装を指示する手順により、長時間の無監視実行が可能になりました。

また、iOSの既存コードベースをKotlinへ翻訳する作業にもCodexを活用しました。アプリケーションロジックはSwiftでもKotlinでも本質的に同じであり、Codexが意味を保持したまま変換することで、クロスプラットフォームフレームワーク不要の開発スタイルが実現しました。

OpenAIの内部では、Codex自体の開発にもCodexが活用されており、「CodexのほぼすべてがCodexで構築されている」とプロダクトリードが明かしています。AI支援開発はツールの改善にも帰還的に適用される段階に達しています。

今回の事例は、AI支援開発がエンジニアの仕事を省力化するのではなく、アーキテクチャ設計・意思決定・品質管理といった高付加価値の業務に集中させる方向へシフトさせることを示しています。明日のソフトウェアエンジニアに求められるのは、深いシステム理解とAIとの長期的な協働能力です。

GitHubが提唱するAI自動最適化の新概念

Continuous Efficiencyとは何か

グリーンソフトウェアとContinuous AIを融合した新概念
コードベースの継続的・自動的な効率改善を目指す取り組み
GitHub NextとGitHub Sustainabilityチームが共同で開発
自然言語(Markdown)でワークフローを記述できる実験的フレームワーク
Claude CodeOpenAI Codexなど複数のAIエンジンに対応
現在はオープンソースの研究プロトタイプとして公開中

実証された主な活用事例

グリーンソフトウェアルールをコードベース全体に自動適用
RegExp最適化PRがnpm月5億DL超プロジェクトでマージ済み
Web持続可能性ガイドライン(WSG)の自動適用も実施
「Daily Perf Improver」によるFSharp.Control.AsyncSeqのパフォーマンス改善を確認
リポジトリ構造に応じてビルド・ベンチマーク手順を自動推論
マイクロベンチマーク駆動の最適化PRが複数マージ済み

GitHubは「Continuous Efficiency」と呼ぶ新しいエンジニアリング手法を提唱しました。これはグリーンソフトウェアの知見とContinuous AIを組み合わせ、コードの効率を継続的かつ自動的に改善するアプローチです。

同手法の基盤となるのが「Agentic Workflows」と呼ばれる実験的フレームワークです。エンジニアはYAMLやスクリプトの代わりにMarkdownで意図を記述し、GitHub Actions上でAIエージェントが自律的にタスクを実行します。

グリーンソフトウェアに関しては、月間5億回以上ダウンロードされるnpmパッケージにRegExpのホイスティング最適化を適用し、プルリクエストが承認・マージされました。小さな改善でも、スケールすることで大きな効果をもたらすことが実証されました。

Web持続可能性ガイドライン(WSG)のワークフローでは、GitHubおよびMicrosoftのWebプロパティに対してスクリプト遅延読み込みやネイティブブラウザ機能の活用など複数の改善機会を発見・修正しました。

パフォーマンスエンジニアリングへの応用では、「Daily Perf Improver」が三段階のワークフローを通じてリポジトリのビルド・ベンチマーク手順を自動推論し、FSharp.Control.AsyncSeqで実測可能な改善を実現しました。

AIエージェントは自然言語で記述されたルールを解釈し、コード全体に横断的に適用できます。従来の静的解析やリンターを超えた意味的な汎用性と、PRやコメントとして実装まで行うインテリジェントな修正が特徴です。

現時点では研究デモンストレーター段階であり、変更や誤りが生じる可能性もあります。GitHubはアーリーアダプターやデザインパートナーの参加を呼びかけており、今後さらなるルールセットやワークフローの公開を予定しています。

Codex、HF Skills連携でOSSモデル訓練可能に

統合の機能

トレーニングメトリクスの監視
チェックポイント評価と報告作成
GGUF量子化とHub公開

意義と展望

Claude Codeに続く統合
AGENTS.mdでリポジトリ設定
OSS開発の民主化に貢献

Hugging Faceが、OpenAIコーディングエージェントCodex」にHugging Face Skillsリポジトリを統合しました。先行してClaude Codeで実現された機能に続くもので、Codexオープンソースモデルの訓練から公開まで一連のMLタスクを実行できるようになります。

HF Skillsにより、Codexは言語モデルのファインチューニング、RL整合の適用、Trackioからのリアルタイムメトリクス監視、チェックポイント評価、実験レポート作成、GGUF量子化、Hugging Face Hubへの公開が可能です。AGENTS.mdファイルによるリポジトリレベルの設定に対応しています。

この統合は、コーディングエージェントとMLOpsプラットフォームの融合における重要な進展です。ソフトウェア開発とML エンジニアリングの壁を低くし、専門的なMLインフラの知識がないチームでもオープンソースモデル開発に取り組める環境の実現に貢献します。

OpenAI、自律防衛AI「Aardvark」公開 脆弱性を自動修正

AIの攻撃・防御能力が急伸

GPT-5.1のCTFスコアが76%に到達
8月の27%から3ヶ月で約3倍に急成長
次期モデルはゼロデイ攻撃可能な水準を想定

自律型セキュリティAIの投入

コード全体の脆弱性を発見し修正パッチを提案
すでにOSSで新規CVEを発見する実績
一部OSSリポジトリには無償提供を計画

安全なエコシステムの構築

専門家によるフロンティア・リスク評議会を設置
防御目的の利用者に信頼されたアクセスを提供

OpenAIは2025年12月10日、AIのサイバーセキュリティ能力向上に対応する新戦略を発表しました。同時に、脆弱性を自律的に発見・修正するAIエージェント「Aardvark」のベータ版を公開。最新モデル「GPT-5.1」のCTFスコアが76%に達するなど能力が急伸する中、防御側の体制強化を急ぎます。

最新の評価では、AIのハッキング能力が劇的に向上しています。2025年8月時点で27%だった「GPT-5」のCTF(旗取りゲーム)スコアは、11月の「GPT-5.1-Codex-Max」で76%へと約3倍に跳ね上がりました。同社は次期モデルが未知の脆弱性を突く「ゼロデイ攻撃」も可能な水準に達すると予測しています。

防御力強化の切り札として投入されたのが、自律型セキュリティ研究エージェント「Aardvark」です。コードベース全体を推論して脆弱性を特定し、修正パッチまで提案します。すでにオープンソースソフトウェア(OSS)において新規の脆弱性(CVE)を発見する実績を上げており、一部の非営利OSSには無償提供される計画です。

技術提供に加え、組織的な安全対策も強化します。新たに「フロンティア・リスク評議会」を設置し、外部のセキュリティ専門家と連携してリスク境界を定義します。また、防御目的の研究者や企業に対して、より強力なモデル機能へのアクセス権を付与する「信頼されたアクセスプログラム」の導入も予定しており、エコシステム全体の強化を図ります。

Vercel、OpenAI最新「GPT-5.1 Codex Max」対応

長時間開発に特化した進化

現実の開発タスクで学習
長時間の文脈維持が可能
従来より高速・高効率

導入と運用のメリット

統一APIで即座に利用
詳細なオブザーバビリティ
自動リトライで障害対策

Vercelは2025年12月5日、同社のAI GatewayにおいてOpenAIの最新モデル「GPT-5.1 Codex Max」が利用可能になったと発表しました。開発者は個別のプロバイダー契約を結ぶことなく、即座にこの強力なモデルをアプリケーションに統合できます。

特筆すべきは「Compaction」技術による最適化です。現実世界の開発タスクで学習されたこのモデルは、複数の文脈にまたがる長時間のコーディング作業でも、セッションを中断することなく推論と文脈を維持し続けることができます。

性能面でも進化を遂げており、従来のCodexモデルと比較して処理速度とトークン効率が向上しました。AI SDKでモデル名を指定するだけで利用でき、複雑なエンジニアリングタスクの自動化において威力を発揮します。

AI Gatewayを経由することで、開発者は単なるモデル利用にとどまらず、使用量やコストの追跡、自動リトライによる安定性向上といった恩恵を受けられます。企業レベルの信頼性が求められる開発現場にとって、強力な選択肢となるでしょう。

OpenAI新モデル、長時間自律開発で生産性7割増を実現

コンテキスト制限を打破する技術

コンパクション」で数百万トークンを処理
24時間以上の長時間タスクを自律的に完遂
推論トークンを30%削減しコストを低減

競合を凌駕する圧倒的性能

SWE-benchで77.9%を記録し首位
GoogleGemini 3 Proを上回る
社内エンジニアのPR出荷数が約70%増加
CLIやIDEなどの開発環境で即利用可能

OpenAIは2025年11月19日、エージェントコーディングモデル「GPT-5.1-Codex-Max」を発表しました。数百万トークンの文脈を維持し、長時間にわたる開発タスクを自律遂行可能です。エンジニア生産性を劇的に高める革新的なツールとして注目されます。

最大の特徴は、新技術「コンパクション」の搭載です。作業履歴を圧縮して記憶を継承することで、コンテキスト制限を克服しました。これにより、大規模なリファクタリングや24時間以上続くデバッグ作業など、従来は不可能だった複雑な長期タスクを完遂できます。

性能面では、Googleの最新モデル「Gemini 3 Pro」を主要指標で上回りました。SWE-bench Verifiedでは77.9%の正答率を記録し、業界最高水準を達成。さらに推論プロセスの最適化によりトークン使用量を30%削減し、コスト効率も向上させています。

ビジネスへの貢献も実証済みです。OpenAI社内ではエンジニアの95%が日常的に利用し、導入後のプルリクエスト出荷数が約70%増加しました。単なる支援ツールを超え、開発速度と品質を底上げする「自律的なパートナー」として機能しています。

本モデルは現在、ChatGPT PlusやEnterpriseプラン等のCodex環境で利用可能で、API提供も近日中に開始されます。デフォルトでサンドボックス環境にて動作し、ネットワークアクセスも制限されるなど、企業が安心して導入できるセキュリティ設計も徹底されています。

OpenAI、企業顧客100万人突破 史上最速で成長

驚異的な成長スピード

企業顧客数が100万人を突破
史上最速のビジネスプラットフォーム
Enterprise版シート数は前年比9倍
Work版シート数は700万席を突破

生産性を高める新機能群

GPT-5搭載のAgentKitで業務自動化
Codexコードレビュー時間を半減
マルチモーダル対応で多様な業務へ
企業の75%がプラスのROIを報告

OpenAIは、法人向けサービスの利用企業が世界で100万社を突破し、史上最速で成長するビジネスプラットフォームになったと発表しました。ChatGPT for Workのシート数も700万席を超え、2ヶ月で40%増と急拡大しています。消費者向けChatGPTの普及を背景に、業務自動化を支援する新ツール群も投入し、企業のAI活用を後押しします。

企業向けサービスの勢いは数字にも表れています。有料の法人顧客は100万人を超え、特に大企業向けのChatGPT Enterpriseのシート数は前年比で9倍に達しました。この成長は、AIが単なる実験的ツールから、事業運営に不可欠な基盤へと移行している現状を明確に示しています。

この急成長の背景には、消費者向けChatGPTの圧倒的な普及があります。週に8億人が利用するサービスに慣れ親しんでいるため、従業員が抵抗なく業務でAIを使い始められます。これにより、企業は導入時の摩擦を減らし投資対効果(ROI)を早期に実現できるのです。

OpenAIは企業の本格導入を支援するため、新ツール群も発表しました。社内データと連携する「AgentKit」や、コード生成を支援する「Codex」の利用が急増。画像音声も扱えるマルチモーダル機能も強化し、より幅広い業務での活用を可能にしています。

実際に多くの企業が成果を上げています。ウォートン校の調査では、導入企業の75%がプラスのROIを報告。求人サイトIndeedは応募数を20%増加させ、シスコはコードレビュー時間を半減させるなど、具体的なビジネス価値を生み出しています。

自社ツールへの組み込みも進んでいます。CanvaやShopifyなどがChatGPTと連携し、新たな顧客体験を創出しています。OpenAIは、単なるツール提供者にとどまらず、「仕事のOS」を再定義するプラットフォームとなることを目指しており、その動きは今後さらに加速しそうです。

Sora、無料枠超過分の有料販売を開始

有料化の背景と価格

無料モデルは「持続不可能」と判断
パワーユーザーの強い需要に対応
10回の追加生成で4ドル
App Store経由で購入可能

今後の収益化計画

将来的な無料生成枠の削減を示唆
クリエイター向け収益化策を検討
権利者への収益分配も視野に

動画生成AI「Sora」を開発するOpenAIは、無料の動画生成枠を使い切ったユーザー向けに、追加クレジットの有料販売を開始しました。Soraチームを率いるBill Peebles氏は、現在の無料提供モデルの経済性は「完全に持続不可能」であると指摘。パワーユーザーの旺盛な需要に応えつつ、事業の持続可能性を確保する狙いです。

追加クレジットは、AppleApp Storeを通じて購入できます。価格は10回の追加生成あたり4ドルに設定されています。ただし、生成する動画の長さや解像度によって消費クレジット数は変動します。購入したクレジットの有効期限は12ヶ月で、OpenAIコーディングプラットフォーム「Codex」でも利用可能です。

有料化に踏み切った背景には、膨大な計算コストがあります。Peebles氏は「パワーユーザーは現在の無料生成枠に満足していないことは明らかだ」と述べ、有料で必要なだけ生成できる選択肢を提供する必要性を強調しました。これにより、ユーザーは制限を気にすることなく創作活動に打ち込めるようになります。

さらに同氏は、将来的には無料の生成枠を削減する必要があるとも警告しています。「成長に対応するため、いずれ無料生成数を引き下げる必要がある」と述べ、変更がある場合は事前に透明性を持って告知する方針です。現在の寛大な無料枠がいつまで続くか、動向が注目されます。

今回の動きは、Soraを中心としたAIクリエイターエコノミー構築に向けた、より広範な収益化戦略の一環です。OpenAIは近く、クリエイター向けの収益化プログラムを試験的に開始する予定であり、人気キャラクターなどの権利者が利用料を設定できる仕組みも構想しています。

独HYGH、ChatGPTで開発爆速化、週2MVP達成

開発プロセスの革新

MVP開発が月単位から週単位
会議録からPRDを自動生成
Codex活用で即時プロトタイピング
インフラ移行計画の工数を削減

全社的な生産性向上

従業員1人あたり週5.5時間を節約
広告モックアップ作成の高速化
毎週のベストプラクティス共有会
売上増、納期短縮を実現

ドイツのデジタルメディア企業HYGHが、OpenAIChatGPT Businessを導入し、開発速度とキャンペーン提供のあり方を根本から変革しています。同社はAI活用により、ソフトウェア開発のリードタイムを数ヶ月から数日に短縮。従業員一人あたり週平均5.5時間の労働時間を削減し、週に2つのMVP(実用最小限の製品)をリリースできる体制を構築しました。この取り組みは、生産性と収益性の向上に直結しています。

特に大きな変革を遂げたのが、ソフトウェア開発の現場です。かつては1〜2ヶ月を要したMVP開発は、今や週に2本リリースする驚異的なペースを達成しました。会議の録音から製品要求仕様書(PRD)をAIが自動生成し、開発者Codexを用いて即座にプロトタイプを構築します。これにより、アイデアから製品化までのサイクルが劇的に短縮されました。

AIの恩恵はクリエイティブ業務にも及びます。広告代理店部門では、これまで時間のかかっていた広告キャンペーンのモックアップ作成が大幅に高速化。ChatGPT広告コピーやビジュアルの草案を生成することで、顧客への提案速度と選択肢が向上し、チームはより創造的な業務に集中できるようになりました。

同社は全社的なAI活用を推進しています。ChatGPT Businessへの移行により、共有ワークスペースや管理機能、GDPRに準拠したデータ保護が確保されました。共同創業者のアントニウス・リンク氏は「売上は上がり、納期は縮まり、生産性は爆発した」と成果を語ります。この成功は、AIがもたらすビジネスインパクトの大きさを物語っています。

AI活用の文化を根付かせるため、HYGHは毎週「ワークフロー水曜日」と名付けた社内勉強会を開催。従業員が自作の自動化ツールやベストプラクティスを共有し、互いに学び合うことで、組織全体のAIリテラシーが向上しました。特に若手従業員がネイティブにAIを使いこなす姿が、他の社員にも良い刺激を与えているようです。

リンク氏は「AIを使わない企業は取り残されるだろう」と断言します。AIは単なる効率化ツールではなく、アイデアをぶつけ合える『思考のパートナー』であると位置づけています。HYGHの事例は、AIを組織の隅々にまで浸透させることが、企業の競争力をいかに高めるかを示す好例と言えるでしょう。

OpenAIの真の主役、Codex正式版が開発を革新

Codexの進化と能力

7時間超の長時間タスクも遂行
研究版から製品版へ完全移行
専用SDKでシステム統合が容易

驚異的な生産性向上

OpenAI社内で生産性70%向上
技術スタッフの92%が毎日利用
コードレビュー時間を半減
自社製品の開発もCodexで加速

OpenAIが年次開発者会議「DevDay 2025」で、AIコーディング支援ツール「Codex」の正式版リリースを発表しました。ChatGPTアプリストアなど華やかな発表の影に隠れがちですが、これがソフトウェア開発の常識を覆し、企業の生産性を飛躍させる最も重要な一手と見られています。Codexは単なるツールではなく、開発の未来を創るエンジンとなるのでしょうか。

今回の発表の核となるのが、最新モデル「GPT-5-Codex」です。これは単なるコード補完ツールではありません。まるで人間のチームメイトのように振る舞い、複雑なリファクタリング作業を7時間以上も自律的に実行できます。単純なタスクは迅速に、複雑なタスクにはじっくり取り組む「適応的思考」を備え、開発者を強力にサポートします。

その効果はOpenAI社内で実証済みです。技術スタッフの92%が日常的にCodexを利用し、コード貢献度を示すプルリクエスト数は週に70%も増加しました。自社の新製品やクリエイティブツールもCodexを用いて短期間で開発されており、この生産性向上のサイクルこそが、同社の急速なイノベーションの源泉となっているのです。

特にエンタープライズ向けに強化されたのが、コードレビュー機能です。Codexはプログラムの依存関係を深く理解し、人間のレビュアーが見逃しがちな質の高いバグを毎日数百件も発見します。これにより、開発者は品質への自信を深め、手戻りを減らすことができます。これは「より速く、より確実に出荷する」という企業の目標達成に直結します。

Codexの正式版リリースは、OpenAIのエンタープライズ市場攻略戦略の要です。サム・アルトマンCEOも「優れた製品で企業市場を勝ち取ることに大きく注力する」と明言しています。すでにCiscoのような大企業が導入し、コードレビュー時間を半減させるなどの成果を上げており、その実用性は証明されつつあります。

消費者向けのAIがまだ模索を続ける一方で、Codexは今日、企業に具体的なROI(投資対効果)をもたらす「実績あるAIエージェント」としての地位を確立しました。新たに提供されるSDKにより、各社の独自ワークフローへの組み込みも可能になります。Codexは、次世代のソフトウェア開発を静かに、しかし強力に牽引する存在となるでしょう。

OpenAI「Codex」一般提供開始、Slack連携とSDKで開発を加速

開発を加速する新機能

Slack連携によるタスクの直接委任
Codex SDKで独自のワークフローへ統合
環境制御・監視を行う管理者向けツール追加
CI/CD向けにGitHub Actionsも提供開始

実証された生産性向上

日常利用が8月以降10倍以上に急増
OpenAI社内PRマージ数が週70%増加
Ciscoは複雑なレビュー時間を最大50%削減
Instacartは技術的負債の自動クリーンアップを実現

OpenAIは、コード生成とレビューを支援するコーディングエージェントCodex」の一般提供(GA)開始を発表しました。これにより、新たなSlack連携機能やCodex SDKが提供され、開発チームは既存のワークフロー内でAIをシームレスに活用できるようになります。世界中のスタートアップや大企業で採用が進んでおり、開発効率の劇的な向上が期待されています。

Codexは研究プレビュー開始以来、飛躍的に進化し、日常利用は8月上旬から10倍以上に急増しました。OpenAI社内ではほぼ全てのエンジニアが利用しており、プルリクエスト(PR)のマージ数が週70%増加しています。さらに、Codexが自動でPRをレビューし、本番環境に到達する前に重大な問題点を検出するなど、コード品質維持にも貢献しています。

今回のGAにおける目玉は、エンジニアリングワークフローに直接組み込むための「Codex SDK」と「Slack連携」です。SDKを利用すれば、Codex CLIの核となる強力なエージェントを独自のツールやアプリに数行のコードで統合できます。また、Slackから直接Codexにタスクを委任できるため、チームコラボレーションを効率化します。

大規模導入を進める企業向けには、新しい管理者ツールが追加されました。これにより、ChatGPTワークスペース管理者は、クラウド環境の制御、ローカル利用における安全なデフォルト設定の適用が可能になります。加えて、利用状況やコードレビューの品質を追跡するための分析ダッシュボードが提供され、ガバナンスと監視が強化されます。

導入事例として、Ciscoでは複雑なプルリクエストのレビュー時間を最大50%削減し、エンジニアはより創造的な業務に集中できています。また、InstacartではCodex SDKを統合し、ワンクリックでのエンドツーエンドのタスク完了や、デッドコードなどの技術的負債を自動で解消し、コードベース全体のレイテンシ改善に役立っています。

Slack連携およびSDKは、ChatGPT Plus、Pro、Business、Edu、Enterpriseの各プランで利用可能です。管理者向け機能は、企業での利用を想定しBusiness、Edu、Enterpriseプランに限定されています。OpenAIは、Codexを通じて開発者生産性を根本から変革することを目指しています。

GPT-5-Codexが開発生産性を劇的に向上させる理由

エージェント能力の進化

複雑なタスクで最長7時間以上の独立稼働
タスクに応じた思考時間の動的な調整
迅速な対話と長期的な独立実行の両立
実世界のコーディング作業に特化しRL学習を適用

ワークフローへの密着

CLI、IDE拡張機能、GitHubへシームレスに連携
ローカル環境とクラウド間のコンテキスト維持
画像やスクリーンショットを入力可能

品質と安全性の向上

コードレビューの精度が大幅に向上
重大なバグを早期に発見しレビュー負荷を軽減
サンドボックス環境による強固なセキュリティ

OpenAIは、エージェントコーディングに特化した新モデル「GPT-5-Codex」を発表し、開発環境Codexを大幅にアップグレードしました。これはGPT-5を実世界のソフトウェアエンジニアリング作業に最適化させたバージョンです。開発者はCLI、IDE、GitHubChatGPTアプリを通じて、より速く、信頼性の高いAIアシスタントを活用できるようになります。

最大の進化は、タスクの複雑性に応じて思考時間を動的に調整する能力です。GPT-5-Codexは、大規模なリファクタリングデバッグなどの複雑なタスクにおいて、最長7時間以上にわたり独立して作業を継続できることが確認されています。これにより、長期的なプロジェクトの構築と迅速なインタラクティブセッションの両方に対応します。

モデルは、既存のコードベース全体を理解し、依存関係を考慮しながら動作検証やテスト実行が可能です。特にコードレビュー機能が強化されており、コミットに対するレビューコメントの正確性と重要性が向上。重大な欠陥を早期に特定し、人間のレビュー工数を大幅に削減します。

開発ワークフローへの統合も一層強化されました。刷新されたCodex CLIとIDE拡張機能(VS Codeなどに対応)により、ローカル環境とクラウド環境間でシームレスに作業を移行できます。コンテキストが途切れないため、作業効率が劇的に向上します。

さらに、Codex画像やスクリーンショットを入力として受け付けるようになりました。これにより、フロントエンドのデザイン仕様やUIバグなどを視覚的にAIへ共有し、フロントエンドタスクの解決を効率化します。また、GitHub連携によりPRの自動レビューや編集指示も可能です。

安全性確保のため、Codexはデフォルトでサンドボックス環境で実行され、ネットワークアクセスは無効です。プロンプトインジェクションリスクを軽減するとともに、開発者セキュリティ設定をカスタマイズし、リスク許容度に応じて運用することが可能です。