Stability AIが6分超の楽曲生成モデルを公開
出典:TechCrunch
詳細を読む
Stability AIは2026年5月20日、音声生成モデルの新シリーズ「Stable Audio 3.0」を発表しました。最上位モデルは6分20秒のプロ品質の楽曲を生成でき、2024年リリースの前世代モデルが対応していた長さの2倍以上を実現しています。
今回公開されたのは、小型SFX(4.59億パラメータ)、小型(同)、中型(14億パラメータ)、大型(27億パラメータ)の4モデルです。小型2モデルは最大2分の音楽をデバイス上で生成でき、中型・大型は楽曲構造やメロディの一貫性を保った長尺生成が可能です。小型SFX・小型・中型の3モデルはオープンウェイトで公開され、誰でも利用・改変できます。
大型モデルはAPIとセルフホスティング経由のみの提供で、売上100万ドル超の企業はエンタープライズライセンスが必要となります。Stability AIは学習データがすべて正規にライセンスされたものであると説明しており、Warner Music GroupおよびUniversal Music Groupとの提携がその基盤となっています。
AI音楽生成の分野ではGoogleやElevenLabsも参入していますが、SunoやUdioが著作権訴訟に直面するなど、学習データのライセンスが事業継続の鍵となっています。Stability AIはライセンス問題をクリアした点で競合との差別化を図っています。
同社はプロのミュージシャン向けに新たな製品群を開発中で、Universal AudioやFenderで最高デジタル責任者を務めたEthan Kaplan氏をプロ向け音楽事業の責任者として迎えました。AI音楽企業が音楽業界の経験者を積極的に採用する動きは業界全体のトレンドとなっています。