Cohere(企業)に関するニュース一覧

NVIDIA、米国AI製造に最大5000億ドル投資

国内製造への回帰

米国内で最大5000億ドル投資
半導体供給網の国内回帰加速
アリゾナでBlackwell量産開始

雇用と経済効果

43州に及ぶ部品供給網
2026年に10万人超の雇用支援
GDP押し上げ4850億ドル試算

AIの実用展開

医療・科学での実装拡大
エネルギー配慮の責任ある建設

半導体大手NVIDIAは2026年6月30日、パートナー企業と共に米国内でAI基盤の製造を大規模に拡大する計画を明らかにしました。TSMCやFoxconn、Wistronなどと連携し、最大5000億ドル規模のAIインフラ米国内で生産する方針です。同社創業者ジェンスン・フアンCEOは「AIは米国の製造業と供給網を再活性化する、世代に一度の好機だ」と述べました。

計画の中核は、先端半導体国内回帰にあります。すでにアリゾナ州フェニックスのTSMC工場ではNVIDIAのBlackwellチップが量産段階に入り、テキサス州ヒューストンのFoxconn、フォートワースのWistronでもAIシステムの製造拠点が計画されています。供給網は43州に広がり、半導体から基板、ラック、冷却まで幅広い部品を担う体制が整いつつあります。

経済への波及効果も大きいと見込まれています。調査会社Public Firstの試算では、2026年だけでNVIDIA主導のAI需要が米国のGDPを4850億ドル押し上げ、10万人を超える雇用を支えるとされます。電気工事士や配管工、建設作業員など直接雇用に加え、供給網全体で間接雇用も生まれます。テキサス州シャーマンでは、光部品大手Coherentが1000人規模の雇用を生む新工場を着工しました。

この基盤整備の目的は、チップそのものではなく、AIが可能にする成果の加速にあります。医療分野ではAbridgeが300超の医療機関で臨床記録を自動化し、科学分野ではNVIDIAOracle、米エネルギー省がアルゴンヌ国立研究所で新たなスーパーコンピューターを構築しています。フアン氏は「AIは究極の汎用技術であり、あらゆる産業に影響する」と語りました。

一方で同社は、エネルギー供給や送電網の信頼性、水利用、地域への配慮といった責任ある建設も重視しています。最新のRubin世代インフラは世界で初めて100%液冷を実現し、電力需要を柔軟に調整するデータセンターの開発も進めています。米国の製造業復権とAI活用の両立が、今後10年の焦点となりそうです。

米輸出規制が欧州のAI主権論を加速

規制が招いた警鐘

Claude Fableの輸出規制
外国籍開発者の利用も遮断
欧州の主権論を再燃させる契機

欧州の対抗策

仏マクロン氏の独自路線表明
SoftBank750億ユーロ投資
Cohereとアレフ・アルファの提携

残る課題

米国の巨額投資との資金格差
20カ国超の連携と規制緩和が前提

トランプ政権が今月、Anthropicの高性能モデルClaude Fableを厳しい輸出規制の対象とし、外国人によるアクセスを禁じました。これを受け欧州では、米国製AIへの依存が事業継続のリスクだという認識が一気に広がっています。米中がAI開発競争を繰り広げるなか、自国の技術力に自負を持つフランスやドイツは締め出されたと感じ、独自路線を模索し始めました。

規制の影響は深刻でした。今回の指定はAnthropicで働く外国籍の従業員、つまりFableの開発に関わった当事者のアクセスまで禁じる内容だったためです。同社は急ぎモデルを市場から取り下げましたが、米政府がいつでもアクセスを遮断できる以上、欧州企業は米国モデルの上に安定した事業を築けないという教訓が残りました。

欧州側の動きも具体化しています。フランスのマクロン大統領はG7の場でAI幹部に主権問題を説き、米国が国家主義的なAI政策を続けるなら独自路線を進むと表明しました。同氏の「Choose France」構想は1000億ユーロを超えるAIインフラ投資の確約を集め、その中核をSoftBankの750億ユーロデータセンター建設計画が担います。ただし当局の承認が前提です。

企業間の連携も進んでいます。カナダ拠点のCohereドイツのアレフ・アルファとの協業を起点に、多国間の主権優先のパートナー網を築こうとしています。元Metaの著名研究者ヤン・ルカン氏は、各国が自国の言語や文化に合わせて使えるオープンな基盤モデルを共同開発する「Project Tapestry」を推進しています。

とはいえ課題は大きく残ります。Anthropicが直近で調達した650億ドルは、昨年の欧州英国のAI新興企業への投資総額を上回るとされ、米欧の資金格差は依然として歴然です。欧州が世界二番手のAIを築くには、20カ国超の緊密な連携と過剰な規制の見直し、そしてリスク回避からの発想転換が欠かせません。

それでも2026年には新しい要素が加わりました。米政権の不器用な政策が、現状維持を耐え難いものにしている点です。チップ新興企業Qantのフェルチュ氏は「今の欧州の注目はトランプ氏なしには得られなかった」と語り、Fableの輸出規制が主権をめぐる新たな議論を呼んだと指摘します。欧州はAI主権を追求するほかない局面に立っています。

Hugging Faceが遠距離音声認識の公開ベンチマーク公開

ベンチマークの狙い

遠距離音声認識の初の公開基準
残響・雑音・距離を再現
クリーン環境との性能差を可視化
Treble主導でHugging Faceが共催

評価手法と所見

9条件で評価、主要4条件で順位
WERとRTFxを併記
低SNRで誤りが数倍に悪化

Treble TechnologiesとHugging Faceは6月24日、遠距離音声認識(Far-Field ASR)の精度を実環境に近い音響条件で測る初のオープンなベンチマークFFASRリーダーボード」を公開しました。残響や背景雑音、マイクとの距離を再現し、コミュニティが自由にモデルを投稿して結果を比較できます。音声エージェントや会議室の文字起こしなど、遠隔マイク利用の増加が背景にあります。

従来のASR評価は、マイクを口元に近づけたクリーンな音声を前提としてきました。しかしLibriSpeechなどの近接環境で高得点を出すモデルでも、実際の部屋の音響が加わると精度が大きく落ちることが知られています。FFASRはこの性能差を標準化した形で継続的に計測することを目的に設計されました。

評価は9条件で行われ、順位を決める主要4条件は、無響室で測ったクリーン音声と、高・中・低の3段階のSNR(信号対雑音比)下での遠距離音声です。音響データはTrebleのハイブリッドシミュレーションエンジンで生成し、回折や散乱といった現実の現象を再現します。浴室から教室、レストランまで20〜470立方メートルの14室を用意し、咳などの突発音とHVACなどの連続音を加えています。

精度を示すWERに加え、リーダーボードはNVIDIA L4 GPU上で測った処理速度の指標RTFxも併記します。精度と速度の両方が実運用では重要だとして、両者のトレードオフをパレートフロントとして可視化し、用途に合うモデルを選べるようにしています。

公開後に浮かび上がった共通の傾向は、近接環境と遠距離環境の性能差が大きく、SNRが下がるほど急拡大する点です。低SNRの遠距離WERは近接時の数倍に達することも多く、従来は社内評価でしか見えにくかった劣化が比較可能になりました。

投稿はSubmitタブにHugging FaceのモデルIDを貼るだけで、サーバー側で非公開の評価データに対して実行されます。WhisperやIBM Granite Speech、Cohere Transcribeなど主要なASRアーキテクチャに対応し、複数話者やマイクアレイ、エコー除去への対応を今後のロードマップに挙げています。

G7首脳が懸念、米AIの遮断リスク

首脳の懸念

マクロン氏の遮断警告
モディ氏も無制限アクセス要求
米企業自身への打撃も指摘

発端と対応

米政府がAnthropic輸出停止
Mythos・Fable5が凍結
「信頼できる相手」枠組み協議

6月17日に開かれたG7首脳会議で、フランスのマクロン大統領やインドのモディ首相らが、米国が自国の最先端AIモデルへのアクセスを突然遮断できるリスクに懸念を示しました。昼食会にはAnthropicのアモデイCEOやOpenAIのアルトマンCEO、トランプ大統領も同席していました。マクロン氏は、米国が「ある日突然スイッチを切れる」状態は欧州の顧客経済だけでなくAI企業自身も傷つけると警告しました。

今回の発言は、トランプ政権が安全保障を理由にAnthropicの最新モデルMythosとFable5の輸出を差し止めた数日後に出ました。AmazonがホワイトハウスにAnthropicの安全機構を回避できる可能性を指摘したことが発端でした。ただサイバーセキュリティ専門家は、政府が挙げた能力はOpenAIなど自由に使えるモデルにも存在すると反論しており、それでもAnthropicのモデルは凍結されたままです。

この一件は、多くの国際企業が抱える根深いリスクを浮き彫りにしました。米国のAI基盤の上に事業を築く企業や政府は、理由を知らされないまま一夜にしてアクセスを奪われる可能性と向き合わざるを得ません。モディ首相も、重要インフラを守るため民主主義国は最先端モデルへの自由なアクセスを持つべきだと述べ、米国の措置への懸念を表明しました。

カナダの企業向けAI企業CohereのゴメスCEOは、今回の制限は「少数の巨大テック企業に依存し続けることが危険だと示した」と指摘しました。同氏はデジタル主権は単なる市場競争の問題ではなく、経済安全保障と国家主権を左右する基盤技術を誰が握るかの問題だと強調しました。経営者にとっては、調達先のAIが事業継続リスクそのものになり得る局面です。

G7首脳は、米国の制限を迂回し非米国の国々にAnthropicOpenAIの先進モデルへのアクセスを与える「信頼できる相手」枠組みの創設も協議しました。中国などへの防御強化に使うことを条件に、国も企業も対象となる構想です。ただパリやバンガロールの新興企業まで救えるかは不透明で、欧州などが進めるAI主権の主張も、米国モデルが性能で先行し続ける中で難しさを増しています。

Cohereがコーディング特化の30Bオープンモデルを公開

モデルの設計と性能

30BパラメータのMoE構造
トークンあたり3Bが稼働
単一H100で動作可能
Apache 2.0ライセンスで公開

訓練手法と実用性

3種のエージェント足場で訓練
7万超の検証可能タスクで強化学習
出力トークン量は競合の約3倍
高頻度運用時のコスト増に注意

Cohereは2026年6月9日、エージェント型ソフトウェア開発に特化したオープンソースモデルNorth Mini Code」を発表しました。30億パラメータが実際に稼働する300億パラメータのMixture-of-Experts(MoE)モデルで、256Kトークンのコンテキストウィンドウを備え、Apache 2.0ライセンスのもとHugging Faceで公開されています。単一のH100 GPUやMac Studio上でも動作する軽量さが特徴です。

技術的には128個のエキスパートのうちトークンごとに8個が活性化する疎なMoE構造を採用しています。訓練では2段階の教師あり微調整の後、約5,000リポジトリから収集した7万件超の検証可能タスクを使った強化学習(RLVR)を実施しました。SWE-BenchやTerminal-Bench v2との重複を排除し、評価の公正性も確保しています。

注目すべきは、単一のエージェント足場に最適化するのではなく、SWE-Agent、mini-SWE-Agent、OpenCodeの3種類のハーネスで訓練した点です。これにより、OpenCode評価で10ポイントの性能向上を達成しつつ、SWE-Agent上の性能も維持しています。異なるツール環境間でのスキル転移が正の効果を生むことが示されました。

一方、独立評価機関Artificial Analysisのテストでは、出力速度で127モデル中8位にランクインしたものの、同等モデルと比較して約3倍の出力トークンを生成する傾向が確認されました。大量のエージェントパイプラインを運用する場合、この冗長性が推論コストとレイテンシに直結する課題となります。

共同創業者のNick Frosst氏は「小さく、コスト効率が高く、オープンソースでローカル展開可能。これがLLMの進むべき方向だ」と述べ、Claude Fable 5の100万出力トークンあたり50ドルという価格設定との対比を強調しました。企業にとっては、マネージドサービスの利便性とオンプレミス運用によるコスト管理・データ主権の間で、実際のワークロードに基づいた選択が求められます。

Cohere、218B言語モデルをOSSで初公開

高効率なMoE構造

218B中25Bのみ稼働
4bit量子化でほぼ性能劣化なし
H100わずか2基で推論可能

企業向け実用機能

出典を明示する引用生成
48言語対応の新トークナイザ
128Kコンテキストで文書処理

完全オープンソース化

Apache 2.0で商用利用自由
自社環境での独立運用が可能

カナダのAI企業Cohereは2026年5月20日、218億パラメータの大規模言語モデルCommand A+を発表しました。同社として初めてApache 2.0ライセンスで公開され、企業や開発者が商用目的で自由に利用・改変・再配布できます。「Attention Is All You Need」の共著者でもあるCEOのAidan Gomez氏が主導した今回のリリースは、企業が自社環境でAIを完全に制御する「ソブリンAI」構想の具体化です。

Command A+の最大の特徴は、Sparse Mixture-of-Experts(MoE)アーキテクチャにあります。218Bの総パラメータのうち、推論時に稼働するのはわずか25Bです。これにより、OpenAIAnthropicの数兆パラメータ規模のモデルと比較して、大幅に少ない計算資源で動作します。

さらに注目すべきはロスレス量子化技術です。MoEエキスパート部分のみを4bitに圧縮し、注意機構は高精度のまま維持する手法により、ほぼ性能を損なわずに圧縮を実現しました。その結果、NVIDIA B200 1基またはH100 2基で動作可能となり、出力速度は前世代比で最大63%向上、レイテンシは17%低減しています。

ベンチマーク性能も大幅に改善されています。複雑な推論テストτ²-Bench Telecomで37%から85%へ、数学のAIME 25で57%から90%へと飛躍しました。エージェントコーディングではDeepSeekやGLMに後れを取るものの、25Bの稼働パラメータでこの成績は際立っています。

企業利用で重要なネイティブ引用生成機能も搭載されています。外部ツールから取得した情報について、出典元を明示的にリンクする仕組みです。金融・医療・法務など規制の厳しい業界では、ハルシネーションリスク低減に直結します。マルチモーダル対応や128Kトークンのコンテキスト長、48言語対応の新トークナイザにより、グローバル企業の多様なニーズに応えます。

Apache 2.0での公開は、これまでCC-BY-NC 4.0で非商用に限定していたCohereの方針転換を意味します。企業は自社サーバーやエアギャップ環境でモデルを自由にファインチューニングデプロイでき、ベンダー依存から完全に解放されます。Hugging FaceやvLLMとの即日連携も実現しており、オープンソースAIエコシステムの成熟を示すリリースといえます。

Adaption、AI微調整自動化ツールを発表

自動微調整の仕組み

データとモデルの同時最適化
従来の微調整プロセスを自動化
既存製品Adaptive Dataと連携

性能と事業展開

勝率2倍超の改善を主張
30日間の無料トライアル提供
タスク特化型で汎用評価は困難

業界への影響

大手ラボ外での先端AI訓練に道
多分野でのイノベーション加速

AI研究企業Adaptionは5月13日、AIモデルの微調整を自動化する新ツール「AutoScientist」を発表しました。共同創業者でCEOのSara Hooker氏によると、このツールはデータとモデルを同時に最適化し、あらゆる能力を効率的に学習する手法を実現するものです。同氏はCohere元AI研究VPという経歴を持ちます。

AutoScientistは同社の既存製品「Adaptive Data」を基盤としています。Adaptive Dataが高品質なデータセットの継続的な改善を支援する一方、AutoScientistはその改善されたデータをモデルの継続的な向上に直結させます。Hooker氏は「スタック全体が完全に適応可能であるべきだ」と語り、タスクに応じてリアルタイムで最適化する設計思想を強調しています。

性能面では、異なるモデルにおいて勝率を2倍以上に引き上げたと同社は主張しています。ただし、AutoScientistは特定タスクへの適応に特化しているため、SWE-BenchやARC-AGIといった汎用ベンチマークでの評価は難しいとされています。成果の客観的な検証方法は今後の課題です。

Adaptionはツールの実力に自信を持ち、リリース後30日間は無料で提供する方針です。Hooker氏は「コード生成が多くのタスクを解放したように、AutoScientistはさまざまな分野のフロンティアでイノベーションを解放する」と語っています。巨大ラボに集中してきたフロンティアAI訓練の裾野が広がるか、業界の注目が集まります。

CohereがAleph Alphaと合併、主権AI企業を設立へ

合併の構造と資金

Cohere主導で新会社設立
Schwarz Groupが5億ユーロ出資
評価額は約200億ドル
Series Eの主幹事も兼務

主権AIの狙い

カナダとドイツの政府が支援
規制業種と公共部門が対象
米国AI大手への代替を提供
STACKIT基盤のクラウド活用

カナダのAIスタートアップCohereドイツAleph Alphaを統合し、大西洋をまたぐ主権AI企業を設立すると発表しました。両社はそれぞれ自国のAI企業として注目を集めてきましたが、OpenAIなど米国勢に対抗するため、合併による規模拡大を選びました。新会社はCohereが主導し、当局と株主の承認を経て発足します。

資金面では、Aleph Alphaの主要株主であるスーパーマーケットチェーンLidlの親会社Schwarz Groupが全面的に支援します。同社は5億ユーロ(約6億ドル)の構造化融資を提供するとともに、CohereのSeries Eラウンドの主幹事として参画します。独経済紙Handelsblattによれば、評価額は約200億ドルに設定されました。Cohereの2025年ARRは2億4000万ドル、Aleph Alphaの収益は限定的であり、合算収益だけでは説明しにくい水準です。

新会社は防衛、エネルギー、金融、医療、製造、通信といった高度規制業種と公共部門をターゲットにします。プライバシーと独立性の要件を満たせない米国AI大手への代替として、企業の需要を取り込む戦略です。Schwarz GroupのIT部門が運営する主権クラウドサービスSTACKITの活用も見込まれています。

カナダとドイツの両政府もこの動きを歓迎しています。両国は最近「主権技術同盟」を立ち上げ、AI能力の強化と戦略的な技術依存の低減を掲げました。記者会見にはドイツのデジタル大臣とカナダのカウンターパートも登壇しています。ただし、欧州の組織がカナダを含む枠組みを十分に「主権的」とみなすかどうかは今後の課題です。

技術面では、Aleph Alphaの小規模言語モデル欧州言語向けトークナイザーの専門性が、大規模言語モデルに強みを持つCohereと補完関係にあるとCEOのAidan Gomez氏は説明しました。Aleph Alphaの約250名のチームも新会社に合流する見通しです。一方で、IPOの可能性が残る中、将来的な所有構造がどうなるかは不透明な部分もあります。

Cohere、オープンウェイト音声認識モデルを公開

モデルの性能

WER 5.42%で業界最高精度
Whisper Large v3の7.44%を大幅に上回る
14言語対応(日本語含む)
20億パラメータ、Apache-2.0ライセンス

企業導入の優位性

自社GPUでのローカル運用が可能
データ残留リスクなしの音声処理
RAGエージェント構築に即戦力
商用利用を前提とした設計

Cohereは、オープンウェイトの自動音声認識モデル「Transcribe」を公開しました。20億パラメータのこのモデルは、平均単語誤り率(WER)5.42%を達成し、企業の音声パイプラインに直接組み込める精度を実現しています。

TranscribeはHugging FaceのASRリーダーボードで首位を獲得しました。OpenAIのWhisper Large v3(WER 7.44%)、ElevenLabs Scribe v2(5.83%)、Qwen3-ASR(5.76%)をいずれも上回り、商用レベルの音声認識における新たな基準を打ち立てています。

最大の特徴は、Apache-2.0ライセンスによる商用利用と自社インフラでのローカル運用が可能な点です。従来のクローズドAPIではデータの外部送信が避けられず、オープンモデルでは精度が不十分という課題がありましたが、Transcribeはその両方を解決しています。

対応言語は英語、フランス語、ドイツ語、日本中国語、韓国語など14言語です。会議理解を測るAMIデータセットで8.15%、多様なアクセントを評価するVoxpopuliで5.87%と、幅広い音声タスクで高い性能を示しています。

企業のエンジニアリングチームにとって、RAGパイプラインエージェントワークフロー音声入力を組み込む際、データ残留リスクやレイテンシの問題なく本番運用できる選択肢が加わりました。早期導入企業からは、精度とローカル展開の両立が高く評価されています。

Cohereが音声認識モデルをオープンソースで公開

モデルの特徴

20億パラメータの軽量設計
消費者向けGPUで自己運用可能
14言語対応(日本語含む)
1分間で525分音声処理

性能と展開

WER 5.42で業界最高精度
人間評価で勝率61%達成
企業向け基盤Northに統合予定
API無料提供を開始

エンタープライズAI企業のCohereは2026年3月26日、同社初の音声モデル「Transcribe」をオープンソースで公開しました。議事録作成や音声分析などの用途を想定した自動音声認識モデルで、APIを通じて無料で利用できます。

Transcribeは20億パラメータと比較的軽量に設計されており、消費者向けGPUでの自己ホスティングが可能です。英語、日本語、中国語、韓国語など14言語に対応し、1分間で525分の音声を処理できる高いスループットを実現しています。

Hugging FaceOpen ASRリーダーボードでは、平均単語誤り率(WER)5.42を達成し、Zoom Scribe v1やIBM Granite 4.0、ElevenLabs Scribe v2などの競合モデルを上回りました。人間評価者による精度・一貫性・実用性の評価でも平均勝率61%を記録しています。

一方で、ポルトガル語、ドイツ語、スペイン語の文字起こしでは競合に後れを取る課題も残っています。Cohereは今後、同モデルを企業向けエージェント統合基盤「North」やマネージド推論プラットフォーム「Model Vault」にも展開する計画です。

音声認識モデル市場は、GranolaやWispr Flowなどの議事録・ディクテーションアプリの需要拡大に伴い急成長しています。Cohereは2025年の年間経常収益が2億4000万ドルに達したとされ、IPOの可能性も示唆されており、今回の音声モデル投入で事業領域の拡大を図ります。

Nvidia、フォトニクス企業2社に総額40億ドル投資

大型投資の概要

Lumentumに20億ドル投資
Coherentにも20億ドル投資
光トランシーバーや回路スイッチが対象
複数年の非独占的パートナーシップ契約

狙いと業界動向

AIデータセンターの帯域幅不足に対応
光ファイバーは銅線より低遅延・省電力
DARPAもフォトニクス研究を公募開始
AMDも昨年Enosemi買収済み

Nvidiaは2026年3月2日、フォトニクス技術を開発するLumentumCoherentの2社にそれぞれ20億ドル、合計40億ドルを投資すると発表しました。AIデータセンターの高速データ通信を支える光学技術の確保が目的です。

両社との契約は複数年にわたる非独占的なもので、先進レーザー部品の大規模購入契約と将来の生産能力へのアクセス権が含まれます。研究開発や製造拡大の支援も盛り込まれており、Nvidiaの長期的な光学戦略が明確になりました。

背景には、AnthropicClaude CoworkMicrosoftCopilot Tasksなどエージェント型AIの普及があります。複数タスクの同時実行に必要な帯域幅が急増しており、銅線ケーブルでは対応が困難になりつつあります。

光ファイバーは銅線と比べて大幅に高い帯域幅と低遅延を実現でき、消費電力も少ないという利点があります。Nvidiaは2020年に買収したMellanoxネットワーク技術でNVLinkを強化した実績があり、今回の投資はその延長線上にあります。

フォトニクスへの注目はNvidiaに限りません。DARPAは先月、AI向けフォトニックコンピューティングの研究提案を公募しました。競合のAMDも2025年にシリコンフォトニクス企業Enosemiを買収しており、業界全体で光学技術への投資が加速しています。

Cohereが年商240億円達成でIPOを視野、エンタープライズAIで躍進

Cohereの成長

年商2億4000万ドル(約360億円)を達成
エンタープライズAIに特化した差別化戦略が奏功
IPOへの布石として財務基盤を強化

CohereはエンタープライズAI特化の戦略で年間売上高2億4000万ドルを達成し、IPOに向けた基盤を固めたと報告されています。OpenAIAnthropicとは異なるB2Bエンタープライズに絞った戦略が功を奏しています。

Cohereは自社APIの提供だけでなく、企業が自社環境にAIモデルを展開できるプライベートデプロイメント機能を重視しており、データプライバシーを重視する金融・医療・政府系顧客に支持されています。

IPOに向けた動きはAI企業の株式市場への参入が本格化する流れの一部です。純粋なエンタープライズAI企業の評価がどのように設定されるかが注目されます。

Cohere、Rerank 4を発表

主要な技術改善

コンテキストウィンドウが4倍の32Kに
長文ドキュメントの処理が向上
セクション間の関連性を捕捉
ランキング精度が大幅改善

2つのバリアント

Fast:EC・CS向け高速モデル
Pro:深い推論・分析向け
エージェントのエラー削減に貢献
エンタープライズ検索の高度化

Cohere検索ランキングモデルの最新版「Rerank 4」を発表しました。前バージョンの3.5から約1年ぶりのアップデートで、コンテキストウィンドウが4倍の32Kに拡大されています。これにより長文ドキュメントの処理や複数パッセージの同時評価が可能になりました。

Rerank 4はFastとProの2つのバリアントで提供されます。Fastはeコマースやカスタマーサービスなど速度重視のユースケースに最適化され、Proはリスクモデル生成やデータ分析など深い推論と精度が求められるタスク向けに設計されています。

AIエージェントが複雑なタスクを遂行する際、正確な情報検索への依存度が高まっています。Rerank 4の改善されたランキング能力は、エージェントのエラーを削減し、エンタープライズRAGパイプラインの信頼性向上に大きく貢献します。

AIはバブルか?巨額投資が招く熱狂と懸念

過熱するAI投資

数ヶ月で3倍に高騰する企業価値
3億ドル規模のシード資金調達
1000億ドル規模の巨額コミットメント

事業モデルの行方

インフラ分野への意外な参入者
スケール競争に逆らう創業者

持続可能性への問い

デモの成功が事業になる危うさ
実際のビジネスモデル構築の難しさ

米TechCrunchのイベントで、現在のAI市場がバブル状態にあるかどうかが議論されました。企業価値が数ヶ月で3倍になるなど、異例の規模の資金が急速に動いており、市場の過熱感を指摘する声が上がっています。多くの企業がAIデータセンターを中核的なビジネスモデルと見なしており、インフラ投資が活発化しています。

現在のAI市場には、バブルの兆候が明確に現れています。一部のスタートアップ数ヶ月で企業価値が3倍に跳ね上がり、シードラウンドで3億ドルもの資金を調達する事例も出てきました。1000億ドル規模の投資コミットメントも飛び交い、資金の動きは「速すぎる」との見方も出ています。

この熱狂の中で、多くの企業が事業モデルの核としてAIデータセンターに賭けています。AIの計算能力を支えるインフラへの投資が活発化しており、これまで予期されなかった業界からの新規参入も目立ちます。これは、AIの収益化が不透明な中で、確実な需要が見込める分野へ資金が集中していることを示しています。

一方で、こうしたスケールアップ競争に疑問を呈する動きもあります。例えば、AI研究の著名企業であるCohereの元研究リーダーは、大規模化だけを追求する流れに逆行するアプローチを提唱。また、バイラルに成功したデモがそのまま事業モデルとなってしまうことの持続可能性も問われています。

AI業界は巨額の資金流入によって急速な発展を遂げていますが、その一方で市場の過熱感や持続可能性への懸念も高まっています。経営者投資家は、この「バブル」とも言える状況を冷静に分析し、本質的な事業価値を見極めることが求められるでしょう。

元Cohere幹部、巨大AI競争から離脱し新会社

巨大化路線の限界

計算資源投入による性能向上の鈍化
専門家からも上がる懐疑論
巨額のコストとエネルギー消費

新会社は「適応」で勝負

新会社Adaption Labs設立
実世界から学ぶAIシステム
継続的かつ効率的な自己改善

AI開発の未来像

高価な再調整からの脱却
AIの民主化と多様化の可能性

AIユニコーン企業Cohereの元AI研究責任者サラ・フッカー氏が、新会社「Adaption Labs」を設立しました。同社は、計算資源を大量に投下する巨大AIモデル開発競争に異議を唱え、実世界の経験から継続的に学習する、より効率的な「適応型AI」の開発を目指します。この動きは、業界で主流となっているスケーリング一辺倒の方針に一石を投じるものとして注目されています。

フッカー氏は、現在のAI開発を「魅力的だが退屈」と指摘。計算能力を増強するだけでは、世界と対話できる真の知能は生まれないとの考えです。性能向上のためのコストが非効率なレベルに達し、限界が近いと警鐘を鳴らしています。

Adaption Labsが目指すのは、導入後もリアルタイムで間違いから学ぶAIです。現在のAIは本番環境での自己改善が難しく、高額な再調整が必須でした。同社はAIが環境から効率的に学習できることを証明し、この課題を解決します。具体的な技術は非公開です。

業界全体でも、スケーリング信仰は揺らぎ始めています。MITの研究では巨大AIモデルの「収穫逓減」が指摘され、著名研究者からもLLMの限界を問う声が上がっています。AI開発は新たなブレークスルーを模索する時期に差し掛かっているのかもしれません。

Adaption Labsは、最大4000万ドルのシードラウンドを完了したと報じられています。フッカー氏はCohere在籍時、特定用途向けの小型モデルで高い性能を出す実績があります。サンフランシスコを拠点に、世界中から人材を集める方針です。

フッカー氏の挑戦が成功すれば、AI開発の主導権が巨大企業から分散するかもしれません。誰もがAIを安価に、そして継続的に賢くできる時代の到来です。Adaption Labsは、AIが誰のために存在するのかという根源的な問いを投げかけています。

AWS、AIエージェント運用基盤AgentCoreをGA

エージェント運用基盤

AIエージェントの本番運用を支援
開発から運用まで包括的サポート

主要な機能と特徴

任意のフレームワークを選択可能
コード実行やWeb操作などのツール群
文脈維持のためのメモリ機能
監視や監査証跡などの可観測性

企業導入のメリット

セキュリティとスケーラビリティを両立
インフラ管理不要で迅速な開発

AWSは10月13日、AIエージェントを本番環境で安全かつ大規模に運用するための包括的プラットフォーム『Amazon Bedrock AgentCore』の一般提供を開始したと発表した。開発者は任意のフレームワークやモデルを選択し、インフラ管理なしでエージェントを構築、デプロイ、運用できるようになる。企業がAIエージェントにビジネスの根幹を委ねる時代を加速させる。

AIエージェントは大きな期待を集める一方、プロトタイプの段階で留まるケースが多かった。その背景には、エージェントの非決定的な性質に対応できる、セキュアで信頼性が高くスケーラブルなエンタープライズ級の運用基盤が不足していた問題がある。AgentCoreはまさにこの課題の解決を目指す。

AgentCoreの最大の特徴は柔軟性だ。開発者はLangGraphやOpenAI Agents SDKといった好みのフレームワーク、Amazon Bedrock内外のモデルを自由に選択できる。これにより、既存の技術資産やスキルセットを活かしながら、エージェント開発を迅速に進めることが可能になる。

エージェントが価値を生み出すには具体的な行動が必要だ。AgentCoreは、コードを安全に実行する『Code Interpreter』、Webアプリケーションを操作する『Browser』、既存APIをエージェント用ツールに変換する『Gateway』などを提供。これらにより、エージェントは企業システムと連携した複雑なワークフローを自動化できる。

さらに、企業運用に不可欠な機能も充実している。対話の文脈を維持する『Memory』、行動の監視やデバッグを支援する『Observability』、microVM技術でセッションを分離する『Runtime』が、セキュリティと信頼性を確保。これらはエージェントをビジネスの中心に据えるための礎となる。

すでに多くの企業がAgentCoreを活用し、成果を上げている。例えば、Amazon Devicesの製造部門では、エージェント品質管理のテスト手順を自動生成し、モデルの調整時間を数日から1時間未満に短縮。医療分野ではCohere Healthが、審査時間を3〜4割削減するコピロットを開発した。

AgentCoreは、アジア太平洋(東京)を含む9つのAWSリージョンで利用可能となった。AWS Marketplaceには事前構築済みのエージェントも登場しており、企業はアイデアからデプロイまでを迅速に進められる。AIエージェントの時代を支える確かな基盤として、その活用がさらに広がりそうだ。

PropHero、BedrockでAI投資顧問開発 業務効率化とコスト60%削減

不動産投資管理サービスのPropHero社が、AWSと協業し、生成AIサービス「Amazon Bedrock」を用いてインテリジェントな不動産投資アドバイザーを開発しました。このシステムは、顧客に合わせた投資戦略を自然言語で提案し、業務効率化と大幅なコスト削減を両立した事例として注目されます。 導入によるビジネスインパクトは顕著です。AIアドバイザーの投資目標達成率は90%に達し、有料ユーザーの70%以上が積極的に利用しています。また、一般的な問い合わせ対応を30%自動化し、スタッフはより複雑な業務に集中できるようになりました。戦略的なモデル選択により、AIコストも60%削減しています。 高い性能とコスト効率はどのように両立したのでしょうか。その鍵は、複数のAIエージェントが協調動作する「マルチエージェント・アーキテクチャ」にあります。各エージェントは、質問の分類、専門的な助言、最終応答の生成など、特定のタスクに特化しており、LangGraphというツールでその連携を制御しています。 同社は、タスクの複雑さに応じて最適な基盤モデル(FM)を選択する戦略を採用しました。例えば、簡単な応答には高速で安価な「Amazon Nova Lite」、専門的な投資助言には高性能な「Amazon Nova Pro」を割り当てることで、コストパフォーマンスを最大化しています。 高品質な応答を維持するため、継続的な評価システムを組み込んでいます。会話データから「文脈との関連性」や「回答の正確性」といった指標をリアルタイムで測定します。これにより、AIアドバイザーの品質を常に監視し、迅速な改善サイクルを回すことが可能になっています。 専門知識の提供には「Amazon Bedrock Knowledge Bases」を活用しています。FAQ形式のコンテンツに最適化されたセマンティックチャンキングや、Cohere社の多言語モデルを採用することで、スペイン語圏の利用者にも正確で文脈に沿った情報を提供できる体制を整えました。 開発の背景には、不動産投資における情報格差やプロセスの煩雑さという課題がありました。PropHero社はこれらの障壁を取り除くため、誰でも専門的な知見にアクセスできるAIシステムの開発を目指しました。特にスペインとオーストラリアの市場に合わせた対応が求められていました。 本事例は、生成AIが具体的なビジネス価値を生み出すことを明確に示しています。モジュール化されたアーキテクチャと堅牢な評価基盤を組み合わせることで、顧客エンゲージメントを継続的に向上させるソリューションを構築できるのです。

Cohere、企業価値70億ドルに到達、AMDと提携でNvidiaに対抗

企業向けAIモデル開発のCohereは9月24日、1億ドルを追加で調達し、企業価値が70億ドルに達したと発表しました。これは8月の5億ドル調達に続くものです。同時に半導体大手AMDとの提携も締結し、NvidiaOpenAIの連合に対抗する動きを見せています。この提携は、AI市場の勢力図に変化をもたらす可能性を秘めています。 今回の提携の核心は、CohereのAIモデル群がAMDのGPU「Instinct」で動作可能になる点です。これは市場を独占するNvidiaGPUへの依存を減らす動きと言えるでしょう。さらに、AMD自身もCohereの顧客となり、自社内でAIモデルを活用します。CohereNvidiaGPUのサポートも継続するとしています。 Cohereは2019年、生成AIブームの火付け役となった論文「Transformer」の共著者によって設立された有力企業です。しかし、OpenAI(企業価値5000億ドルとの報道)やAnthropic(同1830億ドル)といった競合に比べると、企業価値の規模では後塵を拝しているのが現状です。 Cohereは特に「AI主権」を重視する企業をターゲットにしています。これは、自社のデータやAIモデルを外部の事業者に委ねず、自国・自社内で管理したいというニーズに応える戦略です。今回のラウンドに国際的なネットワークを持つ投資家が新たに参加したことも、この戦略を裏付けています。