Meta、新AIモデルMuse Sparkを公開し最前線に復帰

Muse Sparkの特徴

マルチモーダル推論を標準搭載
視覚的思考連鎖で画像理解が突出
思考圧縮で競合比半分以下のトークン消費
1000人超の医師協力で医療分野に強み

Llamaとの決別と今後

クローズドソースで提供開始
Llama 4の不振がAI部門再編の契機に
将来的にオープンソース版の公開を予告

競合との比較

Artificial Analysis指標でトップ5入り
エージェント性能は依然課題
詳細を読む

Metaは2026年4月8日、新AIモデルMuse Sparkを発表しました。これは2025年夏に設立されたMeta Superintelligence Labs(MSL)が初めて公開するモデルで、Llama 4の不振を受けてAI戦略を根本から刷新した成果です。MSLを率いるのは、Scale AI共同創業者Alexandr Wang氏。マーク・ザッカーバーグCEOは「質問に答えるだけでなく、ユーザーの代わりに行動するAIエージェント」の実現を目標に掲げています。

Muse Sparkの最大の技術的特徴は、テキスト・画像音声動画を統合的に処理するネイティブマルチモーダル設計です。従来のように視覚とテキストを後付けで結合するのではなく、ゼロから再設計されました。「視覚的思考連鎖」により、複雑な画像の論理的推論が可能になっています。CharXiv Reasoningでは86.4点を記録し、Claude Opus 4.6やGPT-5.4を大幅に上回りました。

もう一つの注目点は思考圧縮技術です。強化学習の過程で過剰な「思考時間」にペナルティを課すことで、精度を維持しながら推論トークンを削減しています。Artificial Analysisの知能指数テストでは、出力トークン数がClaude Opus 4.6の約3分の1、GPT-5.4の約半分で済んでいます。同指数のスコアは52で、Gemini 3.1 Pro Preview(57)やGPT-5.4(57)に迫るトップ5圏内に入りました。

医療分野では、1000人超の医師と協力してトレーニングデータを整備し、HealthBench Hardで42.8点という突出した成績を達成しています。一方で、エージェント性能にはまだ課題が残ります。SWE-Benchではリーダー勢に及ばず、長期的なワークフロー処理は発展途上です。Meta自身も「長期的エージェントシステムとコーディングワークフローには改善の余地がある」と認めています。

注目すべきは、これまでオープンソースAIの旗手だったMetaが、Muse Sparkをクローズドソースで公開した点です。当面はMeta AIアプリとウェブサイト、一部パートナーへのAPI限定提供となります。ザッカーバーグ氏は将来的にオープンソース版を提供する意向を示していますが、12億ダウンロードを誇るLlamaエコシステムの今後については明言を避けており、開発者コミュニティの間で議論を呼んでいます。