Stability AIが6分超の楽曲生成モデルを公開

2026年05月20日 Google 音楽生成オープンウェイトオンデバイス著作権音声

モデルの全体像

4モデルを同時公開

最大27億パラメータの大規模構成

小型版はオープンウェイトで提供

6分20秒の長尺楽曲に対応

ライセンスと事業戦略

Warner・Universalと提携済み

学習データは完全ライセンス取得

プロ向け音楽制作ツールを開発中

音楽業界幹部の採用を加速

出典：TechCrunch

詳細を読む

Stability AIは2026年5月20日、音声生成モデルの新シリーズ「Stable Audio 3.0」を発表しました。最上位モデルは6分20秒のプロ品質の楽曲を生成でき、2024年リリースの前世代モデルが対応していた長さの2倍以上を実現しています。

今回公開されたのは、小型SFX（4.59億パラメータ）、小型（同）、中型（14億パラメータ）、大型（27億パラメータ）の4モデルです。小型2モデルは最大2分の音楽をデバイス上で生成でき、中型・大型は楽曲構造やメロディの一貫性を保った長尺生成が可能です。小型SFX・小型・中型の3モデルはオープンウェイトで公開され、誰でも利用・改変できます。

大型モデルはAPIとセルフホスティング経由のみの提供で、売上100万ドル超の企業はエンタープライズライセンスが必要となります。Stability AIは学習データがすべて正規にライセンスされたものであると説明しており、Warner Music GroupおよびUniversal Music Groupとの提携がその基盤となっています。

AI音楽生成の分野ではGoogleやElevenLabsも参入していますが、SunoやUdioが著作権訴訟に直面するなど、学習データのライセンスが事業継続の鍵となっています。Stability AIはライセンス問題をクリアした点で競合との差別化を図っています。

同社はプロのミュージシャン向けに新たな製品群を開発中で、Universal AudioやFenderで最高デジタル責任者を務めたEthan Kaplan氏をプロ向け音楽事業の責任者として迎えました。AI音楽企業が音楽業界の経験者を積極的に採用する動きは業界全体のトレンドとなっています。