Anthropic、長期AIエージェントの「記憶」問題を解決

コンテキスト制限の壁

AIは長時間稼働で指示や文脈を忘却
複雑なタスクは単一窓で完了不能

2段階の解決アプローチ

環境設定を行う初期化エージェント

人間の作業フローを模倣

セッション間で構造化データを引き継ぐ
テスト自動化でバグ修正能力も向上

2025年11月28日、米AnthropicはAIエージェントが長時間稼働する際に文脈を失う問題を解決する新たな手法を発表しました。同社のClaude Agent SDKに実装されたこのアプローチは、エージェントが複数のセッションをまたいで記憶を保持し、大規模な開発プロジェクトなどの複雑なタスクを完遂できるようにするものです。

同社が提案するのは、役割を分担する「2段階アプローチ」です。まず「初期化エージェント」が開発環境をセットアップしてログを記録し、次に「コーディングエージェント」が実作業を行います。重要なのは、各作業セッションの終了時に構造化された更新情報(アーティファクト)を残し、次のセッションへ確実にバトンタッチする点です。

これまでAIエージェントは、基盤モデルの「コンテキストウィンドウ(扱える情報量)」の制限により、長時間稼働すると初期の指示を忘れたり、挙動が不安定になったりする課題がありました。Anthropicの新手法は、人間のソフトウェアエンジニアが日々の業務で行う「段階的な進捗管理」に着想を得ており、記憶の断絶を防ぐことに成功しています。

この手法により、エージェントは「一度にすべてをやろうとして失敗する」ことや「中途半端な状態で完了と誤認する」ことを回避できます。また、コーディングエージェントにはテストツールも組み込まれており、コード単体では発見しにくいバグの特定と修正能力も向上しています。

現在はWebアプリ開発での実証が中心ですが、Anthropicはこの手法が科学研究や財務モデリングなど、他の長期タスクにも応用可能であるとしています。AIエージェントが単なる対話相手から「長期的なプロジェクトを任せられるパートナー」へと進化するための、重要な技術的マイルストーンとなるでしょう。

2025年AI総括:GPT-5実用化と中国・小型モデルの台頭

OpenAIの進化と実用化加速

GPT-5と5.1が始動、ZenDeskで解決率9割事例も
Sora 2やブラウザAtlas、OSSモデルも全方位展開
コーディング特化モデルで長時間タスクが可能に

中国勢と多様なモデルの台頭

DeepSeekQwen3など中国OSSが世界を席巻
Google Gemma 3など超小型モデルが実用段階へ
MetaがMidjourneyと提携画像生成をSNS統合
Gemini 3やClaude Opus 4.5で競争激化

2025年11月、米VentureBeatは今年のAI業界を振り返る総括記事を公開しました。2025年は、特定の最強モデル一強ではなく、オープンソースや中国勢、エッジ向け小型モデルを含めた「エコシステムの多様化」が決定的となった年です。経営者エンジニアにとって、用途に応じて最適なAIを選択できる環境が整ったことが、今年最大の収穫と言えるでしょう。

OpenAIは待望のGPT-5およびGPT-5.1をリリースし、市場を牽引し続けました。初期の反応は賛否両論ありましたが、改良を経てZenDeskなどの企業導入が進み、顧客対応の自動解決率が80〜90%に達する事例も報告されています。さらに、動画生成AI「Sora 2」やブラウザ統合型「Atlas」、そして意外にもオープンウェイトモデルの公開など、全方位での攻勢を強めています。

特筆すべきは中国発のオープンソースモデルの躍進です。DeepSeek-R1やAlibabaのQwen3シリーズなどが、推論能力やコーディング性能で米国のフロンティアモデルに肉薄しています。MITなどの調査によれば、中国製モデルのダウンロード数は米国をわずかに上回る勢いを見せており、コストパフォーマンスを重視する企業にとって無視できない選択肢となりました。

「巨大化」へのカウンターとして、小型・ローカルモデルの実用性も飛躍的に向上しました。GoogleのGemma 3やLiquid AIのLFM2は、パラメータ数を抑えつつ特定タスクに特化し、エッジデバイスやプライバシー重視の環境での利用を可能にしました。すべての処理を巨大クラウドAIに依存しない、分散型のAI活用が現実味を帯びています。

画像生成や競合他社の動きも活発です。MetaはMidjourneyの技術ライセンスを取得し、自社SNSへの統合を進めるという驚きの戦略に出ました。一方、GoogleGemini 3に加え、ビジネス図解に強い画像生成モデル「Nano Banana Pro」を投入しています。AnthropicClaude Opus 4.5やBlack Forest LabsのFlux.2など、各領域でハイレベルな競争が続いています。

Supabase50億ドル評価、大型契約拒否の成長戦略

評価額50億ドルへの急騰

数ヶ月で評価額20億から50億ドル
AI開発トレンドVibe codingの基盤
LovableやReplit等の裏側で採用

「No」と言える経営哲学

100万ドルの大型契約も拒否する判断
顧客要望より製品ビジョンを優先
資金はPostgresの拡張へ投資
Oracleの市場代替を加速と予測

オープンソースDBプラットフォームのSupabaseは2025年11月、1億ドルを調達し、評価額50億ドルに達したと明らかにしました。AIによる開発手法「Vibe coding」の普及を背景に、わずか数ヶ月で評価額を2.5倍に伸ばす急成長を遂げています。

特筆すべきは、CEOのポール・コップルストーン氏がとる「断る経営」です。同氏は、100万ドル規模のエンタープライズ契約であっても、顧客の要求が自社のプロダクトビジョンから逸脱する場合は契約を拒否しています。目先の収益よりも製品の一貫性を優先する戦略です。

この「苦渋の決断」は、結果として市場からの信頼獲得に繋がりました。独自のビジョンを貫くことで、LovableやReplitといった有力スタートアップインフラとして選ばれ続けています。世界が自社製品に追いつくことを待つ、大胆な賭けが奏功しているのです。

調達した資金は、中核技術であるPostgresのスケーラビリティ向上に投じられます。コップルストーン氏は「Oracleの死は一世代もかからない」と述べ、データベース市場の覇権交代が予想以上の速さで進むとの見通しを示しました。

複雑実務に挑むAI学習基盤「Agent-R1」がRAGを凌駕

数学・コードから「現実世界」へ

従来の強化学習正解のある問題に特化
現実の業務は曖昧で動的な対応が必要
新手法は対話履歴と環境を全学習

中間評価で「過程」を磨く

最終結果だけでなく中間プロセスも評価
スパース報酬問題を解消し学習効率化
ツール実行と状況解釈を分離管理

既存手法を凌駕する実力

多段階推論従来のRAGを圧倒
DeepSeek系アルゴリズムで最高性能
企業利用の自動化レベルを向上

中国科学技術大学の研究チームが、複雑な実務タスクに対応可能なLLMエージェント強化学習フレームワーク「Agent-R1」を開発しました。従来の数学コーディングといった明確な領域を超え、曖昧さを含む現実世界の課題解決能力を大幅に向上させます。

これまでの強化学習は、正解が明確なタスクで威力を発揮してきましたが、変化し続けるビジネス環境や予測不能なフィードバックへの対応は苦手でした。エージェントが自律的にツールを使いこなし、複雑な工程を完遂するには、学習モデルの根本的な再定義が必要だったのです。

研究チームは「マルコフ決定過程」を拡張し、過去の対話履歴や環境反応を含めた学習を可能にしました。特筆すべきは、最終結果だけでなく中間の工程を評価する「プロセス報酬」の導入です。これにより、エージェントは正解に至るまでの「過程の良し悪し」を学習し、効率的にスキルを習得します。

Agent-R1は、行動を実行する「Tool」と、その結果を解釈する「ToolEnv」という2つのモジュールで構成されます。単にAPIを叩くだけでなく、その結果がタスク全体の進捗にどう意味を持つかを理解させることで、マルチターンの複雑な対話を制御します。

検証の結果、この手法で訓練されたエージェントは、従来のRAG(検索拡張生成)や基本的なツール利用モデルを大きく上回る性能を示しました。特にDeepSeek-R1などで採用されるアルゴリズム「GRPO」との相性が良く、企業の生産性を高める次世代エージェント開発の基盤として期待されています。

AIでGTM変革、効率化に加え「好奇心と精度」が成功の鍵に

リソース効率と不変の本質

「より少ないリソースで多く」を実現
マーケティングの目的理解は不可欠
顧客インサイトや創造性は依然として重要
従来の「定石」を知るドメイン知識も必須

採用基準の変化と精度の向上

専門性より好奇心と理解力を重視して採用
AIプロンプトで高精度なリード特定が可能
単なる効率化を超えたパーソナライズを実現

TechCrunch Disruptにて、Google CloudやOpenAIの幹部がAI時代のGo-To-Market(GTM)戦略について語りました。AIは単にリソースを削減するだけでなく、戦略の実行精度を高めるための強力な武器となりつつあります。

Google CloudのAlison Wagonfeld氏は、採用における視点の変化を強調します。かつては特定のサブスペシャリティを持つ専門家が求められましたが、現在はAIへの好奇心や全体理解を持つ人材こそが、組織にとって最も重要な資産となります。

OpenAIのMarc Manara氏は、AIによるパーソナライズの進化を指摘します。従来のデータベース検索とは異なり、AIプロンプトを活用することで、非常に具体的な要件に合致する見込み顧客を高精度で特定できるようになりました。

一方で、GTMfundのMax Altschuler氏は、マーケティングの「定石」は依然として有効であると説きます。AIで効率化は進みますが、なぜその施策が機能するのかというドメイン知識や、顧客への深い洞察といった本質的な要素は変わっていません。

Epic CEO「AI使用タグは撤廃すべき」制作の常識化を指摘

AIは制作工程で不可欠に

将来のほぼ全ての制作にAIが関与と予測
AIタグはゲームストアでは無意味
シャンプー銘柄の開示同様に不要と皮肉

業界動向と生産性への視点

Steamは現在開示を条件にAI許可
Nexon CEOも全社のAI利用を想定
生産性向上は品質向上に向けるべき
一部では「AIなし」を売りにする動きも

Epic GamesのTim Sweeney CEOは、Steamなどのゲームストアに対し、「Made with AI」タグの撤廃を提言しました。同氏はX上で、生成AIは将来的にほぼすべての制作プロセスに関与するようになり、ラベル付けは無意味になると主張しています。

Sweeney氏は、AIタグが権利確認が必要な素材市場などでは有用と認めつつ、ゲームストアでの適用は不適切だと指摘します。「開発者のシャンプー銘柄を開示させるようなもの」と皮肉り、技術の普及による情報の陳腐化を示唆しました。

この発言は、NexonのCEOが「すべてのゲーム会社がAIを利用していると想定すべき」と述べた見解とも一致します。Steamは当初AIに慎重でしたが、現在は開示を条件に容認しています。しかしSweeney氏は、その開示さえも不要な段階に来ていると考えます。

同氏は以前、AIが人間の生産性を数倍に高めると評価しています。その効果は人員削減ではなく、より高品質なゲーム開発に向けられるべきだとの持論を展開しており、AI活用をポジティブに捉え、開発者の創造性を拡張するツールとして位置付けています。

一方で、Microsoftエンジニアの多くがAI支援ツールを使うなど普及が進む中、あえて「AIフリー」を価値として訴求する開発者も存在します。AI利用が当たり前になる中で、透明性をどう確保するか、市場の議論は続きそうです。

米AI規制で連邦と州が衝突、業界は「州法無効化」へ圧力

州独自規制への反発と業界の主張

加州等の独自規制に対し業界はイノベーション阻害と反発
中国競争を理由に連邦レベルの統一基準を要望
OpenAI等が支援する団体が州法無効化へ資金投入

政治的駆け引きと今後の展望

議会は国防権限法を利用し州の規制権限を制限する動き
次期トランプ政権の大統領令案も州規制排除を示唆
一部議員は現実的な連邦法案による解決を模索

2025年11月、米国のAI政策において「誰がルールを作るか」を巡る主導権争いが激化しています。カリフォルニア州などが独自の消費者保護法案を先行させる中、シリコンバレーのテック企業群はこれに強く反発し、連邦政府による統一基準の策定を求めています。彼らの狙いは、州ごとの異なる規制に対応するコストを回避し、連邦法によって州法を無効化(プリエンプション)することにあります。

OpenAIやAndreessen Horowitzなどが支援する政治活動委員会(PAC)は、州による規制の乱立が「パッチワーク」のような複雑さを生み、イノベーションを阻害すると主張しています。業界団体は「中国とのAI開発競争に遅れをとる」というロジックを展開し、数億ドル規模の資金を投じて、州規制を排除する連邦法の成立や、規制反対派候補の支援に向けたロビー活動を加速させています。

この動きに呼応し、ワシントンでは州の権限を制限する具体的な政治的動きが見られます。連邦議会の一部では、国防権限法(NDAA)に州のAI規制を禁止する条項を盛り込むことが検討されています。また、次期トランプ政権のものとされる流出した大統領令案では、州法を法的に無効化し、連邦取引委員会(FTC)などに統一基準を設けさせる方針が示唆されています。

一方で、州政府や消費者保護団体は、連邦政府の対応の遅さを批判し、州こそが「民主主義の実験場」として迅速にリスクに対処できると反論しています。専門家からは、テック企業はすでに厳格なEUのAI規制に対応しており、州ごとの違いに対応できないというのは責任逃れの方便に過ぎないとの指摘もあがっています。

連邦議会ではテッド・リュウ下院議員らが、詐欺防止や透明性確保を含む包括的な連邦AI法案の準備を進めています。しかし、ねじれ議会や次期政権の方針を考慮し、極端な規制ではなく共和党とも合意可能な現実的なラインを模索しているのが現状です。日本企業にとっても、米国の規制が統一されるか分散するかは、グローバルなコンプライアンス戦略に直結する重要な指標となります。

「詩」にするだけでAI安全壁が崩壊、核製造法も回答

詩的表現で制限を回避

核やマルウェア作成も回答可能
手書きの詩で成功率62%
最新モデルでは9割が陥落

検知システムをすり抜け

隠喩や断片的な構文が混乱を誘発
安全監視の警告領域を回避
予測困難な低確率単語の列

全主要モデルに影響

OpenAIMeta対象
定型的な防御策の脆弱性が露見

欧州の研究チームは、AIへの指示を「詩」の形式にするだけで、本来拒否されるべき危険な回答を引き出せると発表しました。核兵器の製造法やマルウェア作成など、厳格な安全ガードレールが設けられている主要なAIモデルであっても、詩的な表現を用いることで制限を回避できることが実証されています。

この手法は「敵対的詩作(Adversarial Poetry)」と呼ばれ、OpenAIMetaAnthropicなどが開発した25種類のチャットボットで検証されました。人間が作成した詩を用いた場合、平均62%の確率でジェイルブレイクに成功し、最先端モデルでは最大90%という極めて高い成功率を記録しています。

なぜ突破できるのでしょうか。研究チームによると、AIの安全フィルターは特定の単語やフレーズを検知して作動しますが、詩に含まれる隠喩や断片的な構文までは十分に認識できません。意味内容は危険でも、スタイルが変化することで、AI内部のベクトル空間における「警告領域」をすり抜けてしまうのです。

AIにおける「温度」パラメータの概念も関係しています。通常の文章は予測しやすい単語の並びですが、詩は予測困難で確率の低い単語を選択します。この「予測しにくさ」が、定型的なパターンマッチングに依存する現在の安全対策を無力化していると考えられます。

本研究は、AIの高い解釈能力に対し、安全機構がいかに脆弱であるかを示唆しています。研究チームは悪用を防ぐため詳細なプロンプトの公開を控えていますが、AIを活用する企業や開発者は、非定型な入力に対する新たな防御策を講じる必要に迫られています。

OpenAIとGoogle、需要急増でAI生成回数を制限

主要ツールの制限内容

Sora無料版は1日6動画へ制限
Google画像生成1日2枚に縮小
背景にホリデー需要と負荷増大

企業側の対応と戦略

OpenAI追加課金で購入可能
Google予告なしの変更を示唆
有料プランの優位性が高まる

OpenAIGoogleは2025年11月28日、ホリデーシーズンの需要急増を受け、主要な生成AIツールの利用制限を開始しました。インフラへの過度な負荷を軽減しつつ、収益化を加速させる狙いがあります。

OpenAI動画生成AI「Sora」では、無料ユーザーの上限が1日6本に設定されました。責任者は「GPUが溶けそう」と状況を説明し、追加生成が必要な場合は都度購入するよう促しています。

Google画像生成AI「Nano Banana Pro」の無料枠を従来の3枚から1日2枚に縮小しました。Gemini 3 Proへのアクセスも制限されており、今後も予告なく条件が変更される可能性があります。

今回の措置は無料ユーザーが対象で、有料プランの制限変更には言及されていません。ビジネスで安定的にAIを利用するためには、有料版の活用やリソース状況の継続的な確認が不可欠です。

Google、メキシコ工芸のデジタル発信拡大 伝統保存と地域経済支援へ

デジタル技術で伝統工芸を可視化

メキシコ全土8つの新コミュニティを追加
32のストーリーで職人の技を紹介
地域経済と文化観光の活性化へ

職人の経済的自立と継承を支援

適正な対価による持続可能性を追求
伝統技術と革新の融合を示す
次世代への知識継承をデジタルで支援

Googleは2025年11月28日、メキシコの伝統工芸を紹介するデジタルプロジェクト「Crafted in Mexico」を拡大しました。新たに32のストーリーと8つのコミュニティを追加し、Google Arts & Cultureを通じて世界中に発信します。これは単なるアーカイブ活動にとどまらず、文化観光ルートの開拓や地域経済の活性化を狙った戦略的な取り組みであり、伝統産業に新たな光を当てています。

本プロジェクトは、Googleとメキシコ政府文化省との長年にわたる協力関係に基づいています。特に、400名以上のクリエイターが集う全国工芸フェア「Original」と連携し、北部コアウイラ州の繊維工房から南部オアハカ州の伝統技術まで、多様な職人技に焦点を当てています。デジタル技術を活用することで、物理的な距離を超えて工芸品の魅力を伝え、販路拡大とブランド価値向上を支援しています。

特筆すべきは、職人たちの「経済的自立」と「エンパワーメント」への視点です。例えば、ケレタロ州の人形作家は、自身の技術に対する正当な対価を再認識し、持続可能な生計を立てるビジネスモデルへと転換しました。また、トラスカラ州の織物職人は、完成に半年を要する精緻な絣(かすり)技術を守り抜いています。大量生産時代において、手仕事の希少価値を再定義する動きです。

Googleのこの取り組みは、伝統を「過去の遺物」ではなく「進化する資産」として捉えています。古代から続く知識と現代のプラットフォームが融合することで、文化遺産は新たな生命を宿します。ローカルな資源をグローバルな文脈で再評価し、収益性と持続可能性を高めるこの事例は、地域創生やブランド戦略を考えるビジネスリーダーに多くの示唆を与えています。

GitHub公式ホリデーギフトガイド公開、セールも開催中

開発者心をくすぐる多彩なアイテム

アグリーセーターやソックスで季節感を演出
GitHub Copilotモチーフの占いグッズ
デスクを彩るキーキャップやマウスパッド
Stanley等の高品質なドリンクウェア

期間限定セールと配送情報

12月7日までブラックフライデーセール開催
ホリデー休暇に向けた配送期限確認を推奨
子供向けアパレルもあり家族で楽しめる

GitHubが2025年のホリデーシーズンに向け、開発者とその家族のためのギフトガイドを公開しました。公式ショップにて、エンジニア文化を反映したユニークなグッズや実用品が多数紹介されています。12月7日までブラックフライデーセールも開催されており、年末の贈り物選びに最適な機会です。

特に注目すべきは、ホリデー気分を盛り上げるアパレル群です。「アグリーセーター」やビーニー、高品質なメリノウール混紡のソックスなどが登場しました。また、GitHub Copilotを模した「Amazeball」は、開発の合間に遊び心を提供するユニークなアイテムとして紹介されています。

ワークスペースを充実させる実用的なアイテムも豊富です。特製のキーキャップセットや、デスク全体を覆うリサイクル素材のマウスパッド、Stanleyなどの有名ブランドとコラボしたタンブラーがラインナップされています。長時間の作業を快適にし、デスク環境へのこだわりを満たす品揃えです。

11月26日から12月7日まで、対象商品がお得になるセールが実施されています。ホリデー期間中に確実に商品を受け取るため、早めの配送期限確認と注文が推奨されています。子供向けのTシャツやパーカーも用意されており、次世代のエンジニアである子供たちへのギフトにも適しています。