NVIDIAがAIエージェント基盤と強化学習で攻勢

Hermesエージェントの急成長

GitHub星14万超で世界最多利用
自己改善スキルで継続的に性能向上
RTX・DGX Sparkで常時稼働に最適化
Qwen 3.6が120Bモデル超えの効率実現

強化学習基盤の共同開発

AlphaGo設計者Silver氏の新会社と提携
Grace BlackwellからVera Rubinへ展開
試行錯誤型学習に特化したパイプライン構築
人間データを超えた自律的知識発見が目標
詳細を読む

NVIDIAAIエージェント基盤強化学習インフラの両面で大型の取り組みを発表しました。Nous Research開発のエージェントフレームワーク「Hermes Agent」はGitHub星14万超・世界最多利用エージェントとなり、NVIDIAのRTX PCおよびDGX Sparkでの常時稼働に最適化されています。同時に、AlphaGo設計者David Silver氏が設立したIneffable Intelligenceとの強化学習基盤の共同開発も始動しました。

Hermes Agentの最大の特徴は自己改善能力です。複雑なタスクに直面するたびに学習内容をスキルとして保存し、継続的に性能を向上させます。サブエージェントを短命の独立ワーカーとして扱う設計により、300億パラメータ級のローカルモデルでも安定動作を実現しています。Nous Researchがスキルやツールを厳選・テストしているため、他のフレームワークにありがちなデバッグの手間が大幅に削減されています。

ハードウェア面では、Qwen 3.6 35Bモデルが約20GBのメモリで1200億パラメータモデルを上回る性能を発揮し、DGX Sparkの128GB統合メモリ・1ペタフロップスのAI性能と組み合わせることで、高度なエージェントワークフローを終日実行できます。LM StudioやOllamaとの統合もすぐに利用可能で、ローカルAIの導入障壁を下げています。

一方、Ineffable Intelligenceとの提携強化学習の次世代インフラ構築を目指すものです。事前学習が固定データセットを処理するのに対し、強化学習はデータをリアルタイムに生成するため、インターコネクトやメモリ帯域に独自の負荷がかかります。NVIDIAJensen Huang CEOは「超学習者 - 経験から継続的に学ぶシステム」のインフラを共同設計すると表明しました。

技術的にはGrace Blackwell上での開発を皮切りに、次世代プラットフォームVera Rubinへの展開も視野に入れています。Silver氏は「人間が既に知っていることを学ぶAIの問題は概ね解決された。次は自ら新しい知識を発見するシステムが必要だ」と述べており、シミュレーションと経験を通じた学習で科学的ブレークスルーを実現する構想です。NVIDIAはエッジからデータセンターまで、AI基盤の全領域で存在感を強めています。