音楽(マルチモーダル)に関するニュース一覧

Foursquare創業者、AI音声ガイドBeeBotを発表

新感覚のソーシャル音声ガイド

友人・地域の情報を音声で取得
AIが関心事を自動で通知
Wazeとゴシップガールの融合
徒歩での都市散策に最適化

利用シーンと今後の展開

ヘッドフォン装着で自動起動
音楽やポッドキャストを阻害しない
現在は米国iOS限定のベータ版
CarPlay版も開発中

位置情報共有サービスFoursquareの共同創業者デニス・クロウリー氏が、新作アプリ「BeeBot」を発表しました。これは、ユーザーの位置情報に基づき、AIが近隣の出来事や友人の動向などを音声で伝えるソーシャルアプリです。ヘッドフォンを装着するだけで、まるでパーソナルDJがいるかのように、街歩きをしながらリアルタイムの情報が得られます。現在は米国限定でiOS向けに提供されています。

BeeBotのコンセプトは「パーソナライズされたラジオDJ」です。友人が近くにいること、地域のニュース、話題のイベントなど、ユーザーの興味やソーシャルグラフに合わせてカスタマイズされた短い音声アップデートを提供します。開発者はその雰囲気を「Wikipediaを耳で聞くのではなく、Wazeとゴシップガールを融合させたような体験」と表現しています。

このアプリは、ユーザー体験のシームレスさが特徴です。AirPodsをはじめとするあらゆるヘッドフォンやBluetoothオーディオ機器に対応し、装着すると自動的に起動します。音楽やポッドキャストを聴いている際は音量を下げて情報を伝え、終了後は自動で元に戻ります。電話やビデオチャットを中断することはありません。

ユーザーが情報過多にならないよう、アップデートの頻度は1日に数回程度に抑えられています。情報源は、他のBeeBotユーザーの位置情報やステータス更新のほか、ユーザー自身が設定した興味関心の「キーワード」を活用し、ローカルの店舗やイベントを提案します。

BeeBotは現在「ベータ版」と位置付けられており、特に徒歩での利用者が多い米国の都市部で最適な体験が得られるよう設計されています。利用は米国iOSユーザーに限定されていますが、将来的にはCarPlay版の開発も進められており、今後の展開が期待されます。

英AI著作権裁判、Stability AIが実質勝소

判決の要点

商標権侵害は認定
著作権侵害は棄却
AI学習の合法性は判断せず
Stability AIが実質勝訴

今後の焦点

米国での同種訴訟の行方
クリエイターとAI企業の対立
法整備の遅れが浮き彫りに
和解や提携の動きも活発化

英国高等法院は11月5日、画像生成AI「Stable Diffusion」を巡り、ストックフォト大手ゲッティイメージズが開発元のStability AIを訴えていた裁判で、Stability AI側に有利な判決を下しました。ゲッティのウォーターマーク(透かし)を再現したことによる商標権侵害は認定されたものの、AIの学習データ利用という核心的な著作権問題については判断が回避され、法的な不透明さが残る結果となりました。

判決の焦点は、著作権と商標権の侵害の有無でした。裁判所は、Stable Diffusionがゲッティの透かし入り画像を生成した点を商標権侵害と認定しました。一方で、著作権の二次的侵害については「AIモデルは著作権物を保存・複製していない」としてゲッティの主張を退け、Stability AIが実質的に勝訴した形です。

しかし、今回の裁判で最も注目された「著作権で保護された画像のAI学習への利用」という根幹的な論争に決着はつきませんでした。これは、ゲッティ側が証拠不十分を理由に裁判の途中でこの主要な訴えを取り下げたためです。結果として、英国におけるAIと著作権の明確な法的指針は示されないままとなりました。

この問題は、舞台を米国に移して争いが続きます。ゲッティはカリフォルニア州でもStability AIを相手に同様の訴訟を起こしており、そちらの判決が次の焦点です。一方で、AI企業と権利者の間では対立だけでなく、音楽業界のように戦略的提携に至るケースも出てきており、その動向は一様ではありません。

AI開発者経営者にとって、今回の判決は一安心材料かもしれません。しかし、AIの学習プロセスにおける著作権リスクが完全に払拭されたわけではない点に注意が必要です。各国の司法判断や法整備の動向を注視し、自社のAI開発・利用戦略を慎重に検討し続ける必要があるでしょう。

ささやき声で思考記録、元Meta社員のAIリングStream

思考を捉える新体験

ささやき声でアイデアを即記録
タッチ操作でマイクを起動
スマホ不要で思考に集中
専用アプリでノートを自動整理

多機能なスマートデバイス

音楽再生も指先でコントロール
AIがユーザーの声で応答
ハプティクスで静かにフィードバック

製品概要と価格

価格は249ドルから
2026年夏に出荷開始予定

Metaの社員が設立したスタートアップSandbarが、AI搭載スマートリング「Stream Ring」を発表しました。このデバイスは、ささやき声でも思考を瞬時に音声メモとして記録し、AIと対話できるのが特徴です。価格は249ドルからで、2026年夏の出荷を予定。激化するAIウェアラブル市場に、新たな選択肢を投じます。

Stream Ringは「声のためのマウス」というコンセプトを掲げています。開発の背景には、歩行中や移動中に浮かんだアイデアを、スマートフォンを取り出すことなくシームレスに記録したいという創業者自身の課題がありました。ユーザーが思考の流れを中断せずに、アイデアをその場で捉えることを目指しています。

使い方は直感的です。人差し指に装着したリングのタッチパッドを押さえている間だけマイクが起動し、音声を記録。高感度マイクにより、周囲に人がいる場所でもささやき声でメモを取ることが可能です。記録された内容は専用アプリで自動的に整理され、AIが要約や編集を補助します。

本製品のAIは、単なるメモツールにとどまりません。ユーザーの記録内容に基づいて問いを投げかけ、思考の深掘りを助けます。さらに、応答するAIの声をユーザー自身の声に似せてパーソナライズする「Inner Voice」機能を搭載。あたかも自分自身と対話しているかのような体験を提供します。

音声メモ機能に加え、音楽の再生・停止、音量調整といったメディアコントローラーとしても機能します。価格はシルバーモデルが249ドル、ゴールドモデルが299ドル。月額10ドルのProサブスクリプションでは、無制限のチャット機能などが提供されます。

AIハードウェア市場では多くの製品が登場しては消えていきました。Sandbar社は、Stream Ringを「アシスタント」や「友人」ではなく、あくまでユーザーが主導権を握る「思考拡張ツール」と位置づけています。この明確なコンセプトで、先行する競合製品との差別化を図る考えです。

Amazon Music、対話型AIで音楽発見を革新

Alexa+の主な機能

自然な対話での楽曲検索
歌詞や気分での曲探し
複雑な条件でプレイリスト作成
アーティスト情報の深掘り

導入の背景と狙い

競合Spotifyへの対抗策
ユーザーエンゲージメント向上
自社AI技術のショーケース化
音楽発見体験のパーソナライズ

Amazonは11月4日、同社の音楽配信サービス「Amazon Music」のモバイルアプリに、対話型AIアシスタント「Alexa+」を統合したと発表しました。これにより、ユーザーはより自然な会話を通じて、新たな音楽を発見したり、複雑なリクエストに応じたプレイリストを作成したりすることが可能になります。

新しいAlexa+は、従来の単純なコマンド応答型アシスタントとは一線を画します。「マドンナのような90年代のポップスで、ボーイバンドは除外して」といった、曖昧で複雑な指示を理解し、ユーザーの意図を汲み取った楽曲推薦やプレイリスト生成を実現。音楽発見の体験をより直感的でパーソナライズされたものへと進化させます。

特筆すべきは、その高度なプレイリスト作成能力です。例えば「ニッキー・ミナージュの曲から始まる、気分が上がる2010年代のヒット曲でプレイリストを作って」といった、複数の条件を含むリクエストにも対応。ユーザーの気分や状況に合わせた、オーダーメイドの音楽体験を提供します。

さらに、楽曲やアーティストに関する深い知識も提供します。「この曲は何について歌っているの?」や「このアーティストが影響を受けたのは誰?」といった質問に答えることで、ユーザーは音楽への理解を深めることができます。単なる音楽再生ツールから、知的好奇心を満たすパートナーへと進化しているのです。

先行アクセスユーザーのデータでは、新機能利用者は従来のAIアシスタントに比べ、楽曲探索が3倍に増加。また、推薦機能を試したユーザーの音楽再生時間も約70%増加しており、エンゲージメント向上に大きく貢献していることが示唆されています。

この動きは、ChatGPTを統合した競合のSpotifyを強く意識したものと見られます。Amazonは自社のAI技術をサービスの中核に据えることで、競争の激しい音楽ストリーミング市場での優位性を確立する狙いです。Alexa+の展開は、同社のAI戦略における重要な一歩と言えるでしょう。

Google、全製品で先住民文化を称える祭典

多様なプラットフォーム活用

Doodleで伝統的な笛を紹介
Playストアで推薦図書を公開
YouTubeでクリエイターを特集
検索と地図で先住民経営の店を支援

継続的な取り組み

Chromeアーティスト作品を展示
U.S.桂冠詩人による選書企画
ゲーム内での特別イベント開催
文化・物語との接点を創出

Googleは2025年11月の「アメリカ先住民文化遺産月間」を記念し、同社の様々な製品を通じて先住民の創造性や文化に触れる新たな取り組みを開始しました。DoodleやYouTubeなど、多岐にわたるプラットフォームを活用し、ユーザーと先住民の物語をつなぐことを目指します。

中でも目を引くのは、チカソー族のアーティストが手掛けたGoogle Doodleです。このDoodleは、アメリカ先住民の伝統的な笛を称え、その豊かな文化遺産と音楽の伝統を表現しています。

コンテンツ面では、Google Playで米国の桂冠詩人ジョイ・ハージョ氏が選んだ推薦図書コレクションを公開。YouTubeでは、先住民クリエイターやアーティストを特集し、その活動を広く紹介します。

さらに、ビジネス支援の観点から、Google検索とマップ上で先住民が経営するビジネスをハイライト表示する機能も継続しています。これにより、ユーザーは地域コミュニティのビジネスを支援しやすくなります。

これらの取り組みは、Chromeのアーティストシリーズなど、既存の活動とも連携しています。Googleは自社のプラットフォームを社会貢献に活用し、企業の多様性推進への姿勢を明確に示していると言えるでしょう。

UMGとStability AI、AI音楽ツールの共同開発で提携

提携の目的

音楽大手UMGとStability AIが提携
アーティスト中心のAIツール開発
次世代の音楽制作プロセスを支援
著作権を尊重したモデルを推進

開発されるツールの特徴

完全ライセンス音源のみで学習
商業的に安全な利用を保証
アーティストのフィードバックを最優先

大手音楽会社ユニバーサルミュージックグループ(UMG)と生成AI企業のStability AIは10月30日、戦略的提携を発表しました。両社は、アーティストの創造性を支援するため、責任ある形で学習された次世代AI音楽制作ツールを共同開発します。

今回の提携の最大の特徴は、アーティストを開発プロセスの中心に据える点です。UMG所属のアーティストやプロデューサーから直接フィードバックを収集し、現場のニーズを反映させることで、完全にライセンスされ、商業的にも安全なAIツールの創出を目指します。

UMGは、AI技術の活用において「アーティスト第一」の姿勢を明確にしています。同社のマイケル・ナッシュ最高デジタル責任者は、「責任を持って学習されたモデルに基づくAIツールのみを推進する」と述べ、著作権侵害のないクリーンなAI開発へのコミットメントを強調しました。

一方、Stability AIは商用利用可能な安全な生成オーディオのリーダーです。同社の音声生成モデル「Stable Audio」は、ライセンス契約を締結したデータのみで学習されており、高品質で責任ある音楽・サウンド生成を可能にします。この技術基盤が今回の提携を支えます。

Stability AIは、ゲーム会社のElectronic Artsや広告大手WPPとも提携しており、各業界でプロ向けAIツールの開発を進めています。今回のUMGとの提携は、そのビジョンを音楽業界に拡大するものです。人間の芸術性を損なうことなく、創造プロセスを加速させることを目指します。

UMG、AIのUdioと和解し公式音楽生成基盤へ

訴訟から提携への転換

音楽大手UMGとAIのUdioが和解
大規模な著作権訴訟が背景

新AI音楽プラットフォーム

正規ライセンスに基づく新サービス
2026年にサブスクで提供予定
ユーザーによる音楽カスタマイズが可能

アーティストへの新たな機会

UMG所属作家への収益機会を創出
AIとクリエイター共存モデルを構築

音楽業界大手のユニバーサル・ミュージック・グループ(UMG)は、AI音楽生成スタートアップのUdioと著作権侵害訴訟で和解し、業界初となる戦略的提携を発表しました。両社はUMGの楽曲を正規にライセンス利用する新たなAI音楽生成プラットフォームを2026年に立ち上げ、AIと音楽業界の共存に向けた大きな一歩を踏み出します。

この和解は、UMGが昨年、ソニー・ミュージックなどと共にUdioを大規模な著作権侵害で提訴していた中での電撃的な方針転換です。対立構造にあった音楽業界とAI企業が、創造的なパートナーシップへと舵を切った象徴的な動きであり、業界全体に大きな影響を与える可能性があります。

来年開始予定の新プラットフォームは、サブスクリプション形式で提供されます。ユーザーはUMGが権利を持つ豊富な楽曲カタログを活用し、音楽を自由にカスタマイズ、ストリーミング、共有することが可能に。ファンエンゲージメントの新しい形が生まれると期待されています。

UMGは、この提携がテイラー・スウィフト等の所属アーティストに新たな収益機会を提供すると強調しています。ライセンス契約を通じて、AIによる創作活動がアーティストへ公正に還元される仕組みを構築することが、今回の合意の核です。

一方、Udioの既存サービスは、移行期間中も利用可能ですが、コンテンツは外部から隔離された「walled garden」で管理されます。さらに、フィンガープリント技術などのセキュリティ対策が導入され、無許可の利用を防ぐ措置が講じられます。

Adobe、声の感情をAIで自在に操る新技術を発表

声の感情をテキストで修正

既存ナレーションをAIで感情修正
テキスト選択とプリセットで簡単操作
AI音声合成ではなく既存音声を加工
撮り直しの手間とコストを削減

音声トラックをAIで分離

1つの音声から複数トラックを抽出
背景ノイズや不要な音楽を除去
著作権侵害リスク未然に防止

AIによる効果音の自動生成

映像をAIが解析し効果音を自動生成
チャット形式で自然言語による編集

アドビは2025年10月29日、ロサンゼルスで開催中の年次カンファレンス「Adobe MAX」で、開発中の最新AI技術を披露しました。発表されたのは、録音済みのナレーションの感情をテキスト編集のように後から変更できる「Corrective AI」や、音声トラックから声や背景音を分離する「Project Clean Take」などです。これらの技術は、クリエイターの編集作業を劇的に効率化し、撮り直しの手間やコストを削減することを目的としています。

特に注目されるのが「Corrective AI」です。デモでは、平坦で単調なナレーションが、テキストを選択して「自信を持って」などの感情プリセットを選ぶだけで、瞬時に生き生きとした声に変わりました。再録音なしで声のトーンや感情を自在に調整できるこの機能は、映像制作の現場に大きな変革をもたらすでしょう。

同時に披露された「Project Clean Take」は、単一の音声トラックから声、環境音、効果音などをAIが正確に分離する技術です。例えば、街頭での撮影時に混入した騒音や、背景で流れる著作権で保護された音楽だけを除去し、別の音に差し替えることが可能になります。予期せぬノイズによる撮り直しや著作権侵害のリスクを、大幅に低減できるようになるのです。

さらに、映像をAIが解析し、シーンに合った効果音を自動で生成・追加する機能も紹介されました。驚くべきは、その編集方法です。ChatGPTのような対話型インターフェースを使い、「このシーンに車の音を加えて」と指示するだけで、AIが適切な効果音を生成し、完璧なタイミングで配置します。直感的な操作で、より高度な音響デザインが誰でも実現できるようになるでしょう。

これらのAI機能は、動画編集者やクリエイターが日々直面する課題を解決するために設計されています。音声の撮り直しという時間とコストのかかる作業を不要にし、壊れたオーディオデータの修復も可能にします。クリエイターは技術的な制約から解放され、より創造的な作業に集中できるようになるでしょう。

今回披露された機能はまだプロトタイプ段階ですが、アドビは例年「Sneaks」で発表した技術を数ヶ月から1年程度で製品に組み込んでいます。2026年頃には実用化される見込みです。こうした技術革新は、声優業界などにも影響を与え始めており、クリエイティブ産業とAIの共存のあり方が、改めて問われることになりそうです。

Google家庭用AI、Gemini搭載で対話能力が飛躍

Geminiへの進化点

既存アシスタントから無料アップグレード
より自然で高性能な会話能力を実現
複雑な質問や文脈の理解が向上

2つの対話モード

「Hey Google」でタスクを直接指示
「Let's chat」で自由な連続対話

高度機能は有料プラン

連続対話機能Gemini Live
カメラ履歴の音声検索や自動化作成
サブスクGoogle Home Premium必須

Googleは2025年10月28日、新しい家庭用音声アシスタントGemini for Home」の早期アクセス版を米国で提供開始しました。既存のGoogleアシスタントがAIモデル「Gemini」にアップグレードされ、より自然で高性能な対話が可能になります。この基本機能は追加費用なしで利用できますが、連続対話機能「Gemini Live」などの高度な機能は、有料サブスクリプション「Google Home Premium」への加入が必要です。2026年には提供国を拡大する計画です。

今回のアップデートの核心は、基盤となるAIが従来のGoogleアシスタントからGeminiに刷新される点です。これにより、ユーザーはより複雑な質問を投げかけたり、文脈を維持したまま会話を続けたりすることが可能になります。例えば、専門的な知識に関する質問や、複数の条件を組み合わせたスマートホームの操作など、これまで以上に高度な要求に応えられるようになります。

Gemini for Homeには、主に2つの対話モードが用意されています。一つは従来の「Hey Google」という呼びかけで、リマインダー設定やスマートホーム機器の操作といった具体的なタスクを指示するモードです。もう一つは「Hey Google, let's chat」と話しかけて起動する「Gemini Live」で、相づちを挟んだり質問を重ねたりできる自由な連続対話が特徴です。

ビジネスモデルは、基本無料と有料サブスクリプションのハイブリッド型です。Geminiへのコアなアップグレードは無料で提供される一方、前述の「Gemini Live」や、カメラの録画履歴を音声検索する機能、音声による自動化(オートメーション)作成といった高度な機能は、新たに導入される「Google Home Premium」の加入者に限定されます。

具体的な活用例として、Googleは100項目を挙げています。単なる天気予報や音楽再生にとどまらず、「量子コンピュータの最新動向を教えて」といった情報収集、「プロジェクトのアイデアを壁打ちしたい」といったブレインストーミング、「来週の出張に向けた準備リストを作って」といったタスク管理など、ビジネスシーンでの生産性向上にも貢献する機能が満載です。

今回の提供は早期アクセス版という位置づけであり、Googleはユーザーからのフィードバックを積極的に募集しています。「Hey Google, send feedback」と話しかけるだけで意見を送れる仕組みを用意し、製品の改善に役立てる方針です。家庭用AIアシスタント市場における競争が激化する中、ユーザーと共に製品を磨き上げる戦略がうかがえます。

OpenAI、音楽生成AIを開発中 競合追撃へ

新ツールの概要

テキストや音声から音楽を生成
動画へのBGM追加などを想定
ボーカルにギター伴奏を追加

開発と競合状況

提供形態やリリース時期は未定
ジュリアード音楽院と協力か
先行するGoogleやSuno
市場競争の激化は必至

ChatGPTを開発したOpenAIが、テキストや音声から音楽を生成する新しいAIツールの開発に取り組んでいることが報じられました。動画のBGM作成や既存の楽曲への伴奏追加などを可能にするもので、生成AIの応用範囲を音楽分野へ本格的に拡大する動きとして注目されます。

このツールは、ユーザーが入力したテキストや既存の音声データをもとに、全く新しい音楽を創り出す能力を持つとみられています。例えば、制作した動画に合わせた雰囲気のBGMを自動で追加したり、録音したボーカルにギターの伴奏を付けたりといった活用法が想定されています。

現時点で、このツールがいつ、どのような形で提供されるかは明らかになっていません。独立した製品としてリリースされるのか、あるいは対話型AI「ChatGPT」や動画生成AI「Sora」に機能として統合されるのか、今後の発表が待たれます。

開発の興味深い点として、AIの訓練データに関する報道が挙げられます。一部の情報筋によると、OpenAIは名門ジュリアード音楽学生と協力し、楽譜の注釈付け作業を進めているとのことです。質の高いデータが、生成される音楽の品質を左右する鍵となりそうです。

OpenAIは過去にも音楽生成モデルを手がけていましたが、近年は音声合成などに注力していました。音楽生成AI市場では、すでにGoogleや新興企業のSunoなどが先行しておりOpenAIの参入は市場競争をさらに激化させる可能性があります。

Google、ポーランド文化1.5万点をデジタル公開

デジタルで旅するポーランド

Google Arts & Cultureの新企画
ポーランドの文化的なタペストリーを体験

圧巻のデジタルアーカイブ

80以上のパートナーが参加
400の専門家監修ストーリー
1.5万点超の高解像度アセット

芸術から自然、食文化まで

ショパンなど著名芸術家の作品
豊かな自然景観や生態系の宝
伝統的な民族衣装や郷土料理

Googleは2025年10月21日、文化遺産をデジタルで紹介する「Google Arts & Culture」上で、ポーランドの文化に特化した新コレクション「Picture Poland」を公開しました。80を超える現地の博物館や団体と連携し、1万5000点以上の高解像度アセットや400のストーリーを通じ、ポーランド文化への没入体験を提供します。

この公開は、世界的な注目を集めるショパン国際ピアノコンクールの開催時期に合わせたものです。ヨーロッパの中心に位置するポーランドは、美しい自然、多様な伝統、豊かな歴史を誇ります。このプロジェクトは、その文化の多様性を世界に発信する狙いです。

コレクションでは、ポーランドが誇る芸術の神髄に触れられます。ショパンら著名な作曲家の音楽はもちろん、近代への道を切り開いた19世紀の巨匠から前衛芸術家の作品までを網羅。10世紀の銀装飾品といった歴史的遺産を3Dモデルで鑑賞することも可能です。

芸術だけでなく、人々の暮らしに根付いた伝統文化も深く掘り下げています。各地方の鮮やかな民族衣装や祝祭の様子、精巧なペーパーカットのような伝統工芸を紹介。また、地域の女性団体が守り続けるポーランドの郷土料理の魅力にも迫ります。

息をのむような自然景観や貴重な生態系も大きな見どころです。湿地帯に生息する希少な鳥類や、環境変化に敏感な湖など、ポーランドの自然の宝庫を探訪できます。ストリートビューを使えば、歴史的建造物や魅力的な街並みをバーチャルで散策することも可能です。

「Picture Poland」は、テクノロジーで文化遺産を保存し、世界中の人々がアクセスできるようにするGoogleの取り組みの一環です。旅行者のみならず、研究者や教育者にも貴重なリソースとなるでしょう。公式サイトやアプリから誰でも無料で楽しむことができます。

Spotify、大手レーベルと提携しAI音楽の公正化へ

大手レーベルとの協業

ソニーなど大手レーベルと提携
「責任あるAI」製品の開発
著作権の尊重を明確化
AIスパムへの対策強化

アーティスト・ファーストの原則

AI利用はアーティストが選択
新たな収益源の創出
公正な報酬と透明性の確保
人間による芸術性の尊重

音楽ストリーミング最大手のSpotifyは16日、ソニー・ミュージックやユニバーサル・ミュージックなど大手レコード会社と提携し、AI(人工知能)音楽ツールの開発に乗り出すと発表しました。この提携は、アーティストの著作権を保護し、公正な報酬を確保する「責任あるAI」の実現を目指すものです。AIによる音楽制作が広がる中、業界の秩序形成を主導する狙いがあります。

近年、AIが生成した楽曲がサービス上で拡散し、著作権侵害や人間の創造性を脅かすとの懸念が強まっていました。Spotifyは先月、AIが生成したスパムコンテンツを削減する新方針を発表したばかりです。今回の提携は、こうした課題に対応し、技術とクリエイターの共存を探る具体的な一歩と言えるでしょう。

提携の最大の柱は「アーティスト・ファースト」の思想です。新たなAIツールでは、アーティスト自身が自分の楽曲をAIの学習に利用させるか否かを選択できる「オプトイン方式」を採用します。これにより、アーティストの意思を尊重し、創作活動への主体的な関与を保証するとしています。

Spotifyは、AIツールを通じて全く新しい収益源を権利者やアーティストにもたらすとしています。楽曲がAIによって利用された場合に、透明性の高いクレジット表示と共に、公正な対価が支払われる仕組みの構築を目指します。具体的な製品内容はまだ明かされていませんが、新たなビジネスモデルへの期待が高まります。

この構想を実現するため、Spotifyは社内に生成AI専門の研究ラボと製品チームを新設したことも明らかにしました。アーティストの権利保護を最優先する原則に基づき、ファンとアーティストの繋がりを深める革新的な体験の創出を目指し、すでに最初の製品開発に着手しているとのことです。

SpotifyのAI DJ、テキスト入力に対応し利便性向上

AI DJの主な新機能

テキスト入力での選曲リクエスト
従来の音声コマンドと併用可能
スペイン語でのリクエストにも対応

向上したユーザー体験

公共の場でも気兼ねなく操作
AIによるパーソナライズされた提案
気分や活動の複雑な組合せも可能

提供範囲

世界60以上の市場で提供
Premium会員向けの限定機能

音楽ストリーミング大手のSpotifyは10月15日(現地時間)、Premium会員向けに提供する「AI DJ」機能をアップデートし、新たにテキスト入力による選曲リクエストに対応したと発表しました。これまでの音声コマンドに加え、チャット形式での操作が可能になり、公共の場など声が出しにくい環境での利便性が大幅に向上します。この機能は英語とスペイン語に対応し、世界60以上の市場で展開されます。

今回の機能拡張の背景には、ChatGPTなどに代表されるAIチャットボットの急速な普及があります。ユーザーがAIとの対話においてテキスト入力を使い慣れてきたことを受け、Spotifyも自然な流れとしてこの方式を導入しました。通勤中の電車内や静かなオフィスといった、音声コマンドが使いづらい様々な利用シーンを想定しており、ユーザー体験の向上を狙いとしています。

新機能の利用は簡単です。アプリ内で「DJ」と検索して機能を起動後、画面右下のDJボタンをタップすると、音声またはテキストでリクエストを送信できます。ジャンル、気分、アーティスト、活動などを自由に組み合わせて指示することが可能です。例えば「仕事に集中できるインストゥルメンタル」といった、より具体的でパーソナライズされた選曲を実現します。

さらに、次に聴く曲に迷ったユーザーをサポートするため、AIが個人の好みに合わせてパーソナライズされたプロンプト(リクエストの提案)を表示する機能も追加されました。また、スペイン語版のAI DJ「Livi」も音楽リクエストに対応し、グローバルなユーザー層への対応を強化しています。

Spotifyの今回の動きは、AIアシスタント機能が単なる音声操作から、テキストを含むマルチモーダルな対話へと進化している現在のトレンドを象徴しています。AppleSiriがテキスト入力に対応したのと同様の流れであり、ユーザーの状況に応じて最適な入力方法を選択できる柔軟性が、今後のサービス競争における重要な要素となるでしょう。

AI音楽教育の母、バンバーガーMIT名誉教授逝去 100歳

AIと音楽教育の融合

1980年代にAIラボで研究
独自の音楽学習言語を開発
人間の音楽学習プロセスを解明

先駆者としての歩み

MITで初の女性テニュア教員
著名音楽家との共同研究
90代まで続けた教育と研究

後進への多大な影響

現役教授陣が語る多大な貢献
多くの学生を指導しキャリア支援

マサチューセッツ工科大学(MIT)は、音楽教育とテクノロジーの融合を切り拓いたジャンヌ・シャピロ・バンバーガー名誉教授が、2024年12月12日にカリフォルニア州バークレーの自宅で100歳で逝去したと発表しました。バンバーガー氏は、MITのAIラボで研究を行い、コンピュータ言語を用いて音楽学習の方法に革新をもたらしたことで知られています。その功績は現代のAIと教育の分野にも大きな示唆を与えています。

バンバーガー氏の最大の功績は、テクノロジーを音楽教育に応用した点にあります。1980年代には、当時最先端であったMITの人工知能(AI)ラボに所属し、子供たちが音楽を直感的に学べる独自のコンピュータ言語「MusicLogo」や「Impromptu」を開発。これは、人間がどのように音楽を学び、理解するのかという根源的な問いを探求する彼女の生涯の研究の中核をなすものでした。

彼女は学問の世界における真のパイオニアでした。MIT音楽・演劇芸術部門で初めてテニュア(終身在職権)を獲得した女性教員となり、後進の女性研究者に道を拓きました。また、その活動は学内に留まらず、ジャズ界の巨匠ハービー・ハンコック氏と共同研究を行うなど、分野の垣根を越えて音楽と知性の可能性を追求し続けました。

彼女の情熱と探究心は、多くの同僚や学生に深い影響を与えました。同僚のエヴァン・ジポリン教授は「彼女がいなければ今日のMIT音楽部門はなかった」と語ります。また、教え子の一人で現在はキングス・カレッジ・ロンドンの教授を務めるエレイン・チュー氏は「彼女は自分で考える力、主体性を育むよう導いてくれた」と振り返っており、その教育者としての姿勢が高く評価されています。

2002年にMITの名誉教授となった後も、カリフォルニア大学バークレー校で教鞭を執るなど、90代まで精力的に活動を続けました。彼女が長年提唱してきた新しい音楽棟の建設や大学院プログラムの設立は、近年ついに実現。バンバーガー氏が遺した先進的なビジョンは、今もなおMITで息づき、未来の音楽とテクノロジーの発展を支えています。

MIT、AI音楽でメンタルヘルスに新境地

AI・神経科学・音楽の融合

非薬物的なメンタルヘルスツール開発
音楽が心身に与える影響を解明
音楽薬理学「ファーマミュージコロジー」
AI生成音楽の感情的効果を検証

実社会への応用と連携

カーネギーホールなどと連携
大規模ライブでの感情への影響分析
企業とAI音楽の臨床応用を研究
周産期ケアへの子守唄の効果を評価

マサチューセッツ工科大学(MIT)の研究者が、AI、神経科学、音楽を融合させ、メンタルヘルス向上を目指す革新的な研究を進めています。自身の音楽家としての経験から着想を得て、音楽が心身に与える強力な影響を科学的に解明。非薬物的な治療法として、AIを活用した音楽ツールの臨床応用や実用化に挑んでいます。

研究の中心人物は、計算論的神経科学者で音楽家でもあるキマヤ・レカムワサム氏です。同氏は、音楽が不安などに与える生理的・心理的影響を研究する「ファーマミュージコロジー」という概念を提唱。自身の経験から音楽が自己表現や精神的安定にいかに重要かを実感し、その科学的根拠の解明を志しました。

研究の鍵を握るのがAI技術の活用です。レカムワサム氏は、AIが生成した音楽と人間が作曲した音楽が、人々の感情にどのような違いをもたらすかを比較分析しています。これにより、人間の創造性を尊重しつつ、個人の感情に寄り添う音楽を生成・推薦する倫理的なシステムの構築を目指します。

研究は学内にとどまりません。カーネギーホールと協力し、音楽がウェルビーイングに与える影響を評価するコンサートを実施。また、企業と連携し、スタジアム規模のライブ音楽体験が観客の感情に与える効果を、インタラクティブ照明などの技術を用いて測定するプロジェクトも進行中です。

この研究は、音楽を単なる娯楽から、科学的根拠に基づく「処方箋」へと昇華させる可能性を秘めています。将来的には、心理療法や薬物療法と組み合わせた新たな治療介入としての確立が期待されます。AIと音楽の融合が、私たちの心の健康を支える未来は、そう遠くないのかもしれません。

Google新イヤホン、AI連携とANCで体験を刷新

AIとANCで進化

Aシリーズ初のANC搭載
ハンズフリーでGeminiを起動

操作性と音質を最適化

左右のタッチ操作を個別設定
イコライザーで音質を微調整
プリセットやカスタム保存も可能

複数端末との連携

2台同時接続のマルチポイント
PCとスマホ間を自動で切り替え

Googleは2025年10月15日、新型ワイヤレスイヤホン「Pixel Buds 2a」の多彩なカスタマイズ機能を公開しました。Tensor AIを搭載した本製品は、Aシリーズで初めてアクティブノイズキャンセリング(ANC)を搭載し、AIアシスタントGemini」へのハンズフリーアクセスも可能です。ユーザーが自身の使い方に合わせて体験を最適化できる設定方法が紹介されており、ビジネスパーソンの生産性向上に貢献します。

最大の注目点は、Aシリーズ初となるANC機能です。これにより、騒がしい環境でも集中して作業や通話に臨めます。また、イヤホンをタッチするだけでAIアシスタントGemini」を呼び出せ、スマホを取り出さずに音声でタスクを完結できるのは大きな利点と言えるでしょう。

操作性もユーザーに合わせて最適化できます。左右のイヤホンの「長押し」操作に、それぞれ異なる機能を割り当てることが可能です。例えば、右耳でANCをオンにし、左耳でGeminiを起動するといった設定ができます。使用頻度の高い機能を直感的かつ素早く呼び出せるようになります。

音質へのこだわりも満たせます。専用アプリのイコライザー機能を使えば、低音や高音のバランスを自由に調整可能です。「ボーカルブースト」などの便利なプリセットも用意されており、音楽鑑賞からウェブ会議まで、用途に応じた最適なサウンドを手軽に設定できる点も魅力です。

複数のデバイスを使いこなす現代のビジネスパーソンにとって、マルチポイント接続は欠かせない機能でしょう。PCとスマートフォンなど2台の端末に同時接続し、音声ソースを自動で切り替えます。PCでの作業中にスマホへ着信があっても、イヤホンはシームレスに通話へ移行し、デバイス間の手間を省きます。

このように「Pixel Buds 2a」は、高度なカスタマイズ性によってユーザー一人ひとりの使い方に寄り添います。AI、ANC、そしてシームレスな接続性を組み合わせることで、仕事の生産性向上から日々の楽しみまで、幅広いシーンで活躍する強力なパートナーとなりそうです。

AIアプリ基盤戦争、AppleがSiri刷新で反撃

挑戦者OpenAIの戦略

ChatGPT内で直接アプリ実行
旅行予約やプレイリスト作成
アプリストア陳腐化を狙う野心

王者Appleの対抗策

AIでSiriを大規模刷新
音声でアプリをシームレスに操作
開発者向けの新フレームワーク

Appleが持つ優位性

15億人の巨大な利用者基盤
ハードとOSの垂直統合エコシステム

OpenAIが、対話AI「ChatGPT」内で直接アプリを実行できる新機能を発表し、Appleが築いたアプリ市場の牙城に挑んでいます。これに対しAppleは、AIで大幅に刷新した音声アシスタントSiri」と新しい開発フレームワークで迎え撃つ構えです。AI時代のアプリ利用体験の主導権を巡り、巨大テック企業間の覇権争いが新たな局面を迎えています。

OpenAIが打ち出したのは、ChatGPTの対話画面から離れることなく、旅行の予約や音楽プレイリストの作成などを完結できる「アプリプラットフォーム」です。一部では、これがAppleApp Storeを時代遅れにする未来の標準になるとの声も上がっており、アプリ業界の勢力図を塗り替える可能性を秘めています。

一方、Appleは「アプリアイコンをなくし、アプリ自体は生かす」というビジョンを掲げています。AIで賢くなったSiriに話しかけるだけで、複数のアプリ機能をシームレスに連携させ、操作を完了させることを目指します。これは、従来のタップ中心の操作からの脱却を意味し、より直感的なユーザー体験の実現を狙うものです。

この競争において、Appleは圧倒的な強みを持ちます。世界で約15億人ともいわれるiPhoneユーザー基盤に加え、ハードウェア、OS、App Storeを自社で一貫して管理する強力なエコシステムです。ユーザーは既に使い慣れたアプリを所有しており、この牙城を崩すのは容易ではありません。

OpenAIのプラットフォームにも課題はあります。ユーザーはChatGPTのチャット形式のインターフェースに慣れる必要があり、アプリ利用には初回認証の手間もかかります。また、一度に一つのアプリしか操作できない制約や、アプリ独自のブランド体験が失われる点も指摘されています。

もちろんAppleも安泰ではありません。Siriはこれまで性能の低さで評判を落としており、汚名返上が不可欠です。しかし、開発者向けに提供される新しいフレームワーク「App Intents」により、既存アプリも比較的容易にAI機能に対応できる見込みで、巻き返しの準備は着々と進んでいます。

OpenAIは独自のハードウェア開発も模索していますが、今のところスマートフォンを超える体験は提示できていません。当面は、Appleが築いたプラットフォーム上で競争が続くとみられます。AppleSiriの刷新を成功させれば、AI時代のアプリ覇権を維持する可能性は十分にあるでしょう。

Google Play、音楽祭と連携し顧客体験を強化

オンラインでの限定特典

Gold会員向けサプライズ特典
ポイントで交換可能な限定コラボグッズ
人気ゲームの限定アイテム提供
人気アーティストのツアーグッズも展開

音楽祭でのリアル体験

巨大タワーでのゲームチャレンジ
時間限定の対戦モードで豪華賞品
Silver会員以上の優先入場特典
アーティストとのミート&グリート

Googleは2025年10月3日、ロイヤルティプログラム「Google Play Points」の会員向けに、オンラインとリアルイベントを融合させた新たな顧客体験の提供を開始しました。米テキサス州で開催されるオースティン・シティ・リミッツ音楽祭と連携し、限定グッズの提供や体験型イベントを実施。デジタルとリアルの接点を組み合わせることで、顧客エンゲージメントの深化とブランドロイヤルティの向上を狙います。

オンラインでは、特にロイヤルティの高い会員層をターゲットにした施策が展開されます。Gold会員以上は、デジタル上の「ロードケース」を開けることでサプライズ特典を獲得可能。さらに、貯めたポイントを使い、人気デザイナーとの限定コラボグッズや、人気アーティストのツアーグッズと交換できる仕組みも用意されています。

人気モバイルゲームとの連携も特徴です。今回は世界的な人気を誇る「Candy Crush Saga」と提携し、ゲーム内で使える限定アイテムやブースターをPlay Pointsで提供。既存の強力なIP(知的財産)を活用することで、幅広いユーザー層へのリーチとプログラム利用の促進を図っています。

一方、音楽祭の現地では、高さ約6メートルの巨大なタワーを使った体験型ゲームが設置されます。参加者はゲームに挑戦して景品を獲得できるほか、1時間に1度の対戦モードでは、より豪華な賞品を狙うことも可能です。こうしたゲーミフィケーション要素が、来場者の参加意欲を刺激します。

さらに、Silver会員以上のメンバーには、イベントへの優先入場や、現地でしか手に入らない限定グッズが提供されます。オースティン市内のGoogle Storeで開催されるアーティストとのミート&グリート(交流会)への優先アクセス権も付与。上位顧客への特別な待遇で、さらなるロイヤルティ向上を目指します。

今回の施策は、デジタル完結型のポイントプログラムをリアルな体験価値に繋げることで、顧客との感情的な結びつきを強化する好例と言えるでしょう。Googleは今後、人気のミニゲーム「Diamond Valley」の復活も予定しており、継続的なエンゲージメント施策で顧客を囲い込む戦略がうかがえます。

音楽大手、AIライセンス契約間近。新時代へ

大手レーベルのAI戦略

ユニバーサル、ワーナーが交渉
相手はGoogleやAI新興企業
数週間以内に契約締結見込み
AI時代の新たな収益モデル構築

ストリーミング型報酬モデル

AI学習での楽曲利用を許諾
再生ごとのマイクロペイメントを要求
AIによる音楽生成も対象
楽曲使用を追跡する技術開発

ユニバーサル・ミュージックやワーナー・ミュージックといった世界の音楽大手レーベルが、AI技術に関するライセンス契約の締結に近づいています。フィナンシャル・タイムズによると、GoogleやSpotifyなどのテック大手やAIスタートアップと交渉を進めており、数週間以内にも合意する見込みです。この動きは、AI時代における音楽業界の収益モデルを再定義する可能性があります。

交渉の焦点は、AIモデルの学習データとしてレーベルが保有する膨大な楽曲カタログをどのようにライセンス供与するか、そしてAIが生成する音楽からいかにして収益を得るかという点です。これは、著作権保護と技術革新の両立を目指す音楽業界にとって、極めて重要な一歩と言えるでしょう。

レーベル側が推進しているのは、音楽ストリーミングサービスから着想を得た報酬モデルです。AIによる楽曲の使用一回ごとに、権利者へ少額の支払い(マイクロペイメント)が発生する仕組みを求めています。これにより、AI利用の拡大を新たな収益源とすることを目指します。

この新たなモデルを実現するには、技術的な課題も残ります。AI企業は、どの楽曲が、いつ、どのように使用されたかを正確に追跡・報告するソフトウェアを開発する必要があります。この技術的基盤の構築が、契約の成否を分ける鍵となりそうです。

交渉相手は多岐にわたります。GoogleやSpotifyといった巨大プラットフォーマーに加え、Klay VisionやElevenLabsなどのAIスタートアップも含まれています。一方で、音楽生成AIのSunoやUdioのように、レーベル側と著作権侵害で係争中の企業もあり、業界全体の対応が注目されます。

YouTube、AIが曲解説する新機能を音楽配信で試験

AIホストが曲を解説

AIが楽曲の背景や豆知識を提供
ラジオDJ風の面白いコメント
ミックスやラジオ再生時に機能
リスニング体験の深化が目的

Spotify追撃とAI戦略

競合SpotifyのAI DJに対抗
新設の実験プログラムで提供
米国内の限定ユーザーが対象
YouTube全体のAI活用戦略の一環

YouTubeは2025年9月26日、音楽配信サービス「YouTube Music」において、AIが楽曲の合間に解説や豆知識を提供する新機能「AIホスト」の試験導入を発表しました。この機能は、ユーザーの音楽体験をより豊かにすることを目的としています。まずは米国内の限定されたユーザーを対象に、新設された実験的プログラム「YouTube Labs」を通じて提供されます。

AIホストは、ユーザーがミックスやラジオステーションを再生している際に、曲と曲の間に自動で介入します。まるでラジオのDJのように、再生中の楽曲に関するストーリーやファンの間で知られる豆知識、そして軽快なコメントを提供し、リスニング体験に深みを与えることを目指します。これにより、単に音楽を聴くだけでなく、その背景まで楽しめるようになります。

この動きは、競合であるSpotifyが2023年に導入した「AI DJ」機能を彷彿とさせます。SpotifyのAI DJは、ユーザーの好みに合わせて選曲し、音声で解説を加える人気の機能です。YouTubeのAIホストは現時点でプレイリスト作成機能は含みませんが、音楽ストリーミング市場での差別化とユーザーエンゲージメント向上を狙う、重要な一手と言えるでしょう。

今回の試験は、AI関連のプロトタイプを試すための新プログラム「YouTube Labs」を通じて行われます。これは親会社Googleの「Google Labs」と同様の取り組みで、YouTube Premium会員でなくても参加可能ですが、アクセスは米国内の少数ユーザーに限定されます。ユーザーからのフィードバックを収集し、今後の本格導入を検討する方針です。

YouTubeはクリエイター向けAIツールやAIによる動画検索機能の強化など、プラットフォーム全体でAI活用を積極的に進めています。今回のAIホストも、コンテンツとユーザーの新たな接点を創出する戦略の一環です。一方で、AIが生成するコンテンツの品質や、ユーザー体験を損なわないかといった課題もあり、今後の展開が注目されます。

AI作曲Suno v5、技術は進化も『魂』なき響き

v5の技術的な飛躍

v4.5+からの明確な音質向上
楽器間のクリアな分離を実現
より複雑で多彩な曲構成が可能に

残された芸術的課題

人間味に欠ける完璧すぎるボーカル
ジャンルや年代指定の理解度が不安定
感情を伝える「不完全さ」の再現は困難
指示を無視し画一的な仕上がり

AI音楽生成ツールSunoが最新モデルv5を公開しました。前モデルから音質や楽曲構成の複雑さが飛躍的に向上するなど、技術的な進化は目覚ましいものがあります。しかし、その一方で、人間の感情の機微を表現するには至らず、「魂のない」音楽という課題も浮き彫りになっています。本記事では、Suno v5の技術的到達点と、芸術的表現における限界をレビューします。

v5の最も顕著な改善点は音質です。v4.5+では不明瞭になりがちだった楽器の音がクリアに分離され、ミックス全体の透明感が向上しました。また、楽曲構成も単調な繰り返しから脱却し、より複雑でダイナミックな展開を見せるようになりました。モデルが個々の音を立体的に認識し、忠実に再現する能力が向上した結果と言えるでしょう。

しかし、v5のボーカルは「完璧すぎる」がゆえに人間味に欠けるという皮肉な問題を抱えています。生成される歌声は常に音程が正確で、リバーブやハーモニーが過剰にかかっています。これは「エフェクトなしで」と指示しても無視される傾向にあり、AIの解釈が画一的であることを示唆しています。結果として、どの楽曲も似たような、感情の乗らない仕上がりになりがちです。

特定のジャンルや時代背景を正確に再現する能力にも課題が残ります。「90年代のローファイ・インディーロック」といったニッチな指示を与えても、出てくるのは現代的でクリーンなサウンドでした。AIは「ローファイ」や「音痴風」といった意図的な不完全さのニュアンスをまだ理解できず、プロンプトの表面的な特徴をなぞるに留まっています。

音楽が人の心を打つのは、完璧さだけではなく、声の震えや息遣いといった「不完全さ」にこそ感情が宿るからです。Suno v5は悲しい歌詞を認識できても、その背景にある感情そのものを経験していないため、表層的な模倣しかできません。技術的にどんなに精巧になっても、アーティストが持つ実体験に基づいた表現の深みには、まだ遠いのが現状です。

Suno v5は、AI音楽生成技術の目覚ましい進歩を示す一方、創造性の本質とは何かを問いかけます。現段階では、プロトタイピングやBGM制作など、特定の用途で強力なツールとなり得ますが、人間のアーティストが持つ独自の「魂」を代替するまでには至っていません。今後の進化が、この芸術的限界をどう乗り越えるか注目されます。

Meta、AI動画の新フィード『Vibes』を開始

AI動画の発見と創作

AI生成の短尺動画専用フィード
クリエイター作品からの着想を促進
プロンプト表示で制作過程を可視化

リミックスとSNS連携

音楽画像・アニメーションの変更機能
Instagram等への簡単クロス投稿
MetaのAIエコシステム拡大戦略

Metaは9月26日、AIが生成した短尺動画を発見・共有するための新フィード「Vibes」を、Meta AIアプリ内で公開しました。この機能は、クリエイターやコミュニティが作成したAI動画をユーザーがリミックス(再編集)し、新たな創作活動を促すことを目的としています。

「Vibes」は、以前ユーザーがAIとの対話やプロンプトを共有していた「Discover」フィードに代わるものです。テキスト中心の共有から、動画コンテンツの創作と発見に焦点を移したことは、MetaのAI戦略における重要な転換点と言えるでしょう。

フィード上の動画には、生成に使用されたプロンプトが併記されており、ユーザーは制作の裏側を覗くことができます。さらに、音楽画像、アニメーションを変更する「リミックス機能」を活用し、独自の作品をVibesやInstagramFacebookに手軽にクロス投稿できます。

この動きは、Metaが全社的に進めるAI機能統合の一環です。同社はFacebookInstagramなど主力製品にAI画像生成機能を組み込むほか、先日には画像生成AIの有力企業Midjourneyとの提携も発表しました。MetaはAIによるコンテンツ制作エコシステムの構築を加速させています。

Spotify、AI生成音楽にラベル表示導入へ 不正利用対策も強化

音楽配信大手Spotifyは9月25日、AI生成音楽に関する新方針を発表しました。AI利用の透明性を高め、不正なスパムやなりすましからアーティストとリスナーを保護することが目的です。創造的なAI活用は支援しつつ、プラットフォームの健全性を維持する構えです。 新方針の柱は、AI使用を明記するラベル表示の導入です。音楽業界の標準化団体DDEXと協力し、楽曲制作のどの過程でAIが使われたかを詳細に示すメタデータ標準を開発。すでに主要レーベル15社が採用を表明しており、業界標準となる可能性があります。 AIによるスパム行為への対策も強化します。今秋から、再生数稼ぎを目的とした短尺曲の大量アップロードなどを検出する新しいスパムフィルターを順次展開。同社は過去1年間で既に7,500万ものスパム楽曲を削除したと公表しており、対策を一層強化します。 アーティストの声を無断で複製する「AI音声クローン」やディープフェイクといった、なりすまし行為も明確に禁止します。許可なく他者の声を使用した楽曲はプラットフォームから削除する方針を改めて示し、アーティストの権利保護を徹底する姿勢を強調しました。 Spotifyは、アーティストがAIを創造的なツールとして責任を持って利用することは罰しないと明言しています。「我々はシステムを悪用する者を阻止する」と同社幹部は述べ、AIの利点を享受するためにも、不正行為の防止が不可欠であるとの考えを示しました。 この動きの背景には、誰でも簡単に音楽を生成できるAIツールの急速な普及があります。一部のサービスでは、毎日数万曲のAI生成楽曲がアップロードされるなど、コンテンツの急増が課題となっています。Spotifyは業界に先駆けて対応することで、市場の混乱を防ぐ狙いです。

AI生成アーティストのレコード契約、著作権保護の壁が浮き彫りに

AIで生成されたR&B;アーティスト「Xania Monet」が人気を集め、その作詞家であるTelisha Jones氏が米レコード会社Hallwood Mediaと契約しました。Monetの楽曲はSpotifyで100万回以上再生されていますが、その容姿、ボーカル、楽曲は全てAIによって生成されています。 この契約は、著作権に関する根本的な問題を提起します。米国の現行法では、AIが自律的に生成した作品に著作権は認められません。保護されるのは、Jones氏が創作した「歌詞」のように、人間による表現的要素がある部分に限られる可能性が極めて高いのです。 では、レコード会社は一体何に価値を見出し、契約したのでしょうか。楽曲の大部分が著作権で保護されない場合、他者が無断で商業利用しても権利主張は困難です。専門家は、著作権がないものに対価を支払うビジネスモデルの危うさを指摘しています。 楽曲制作に使われたのは、AI音楽生成ツール「Suno」です。Sunoは現在、大手レコード会社から「大規模な著作権侵害」で提訴されています。AIモデルの学習に、インターネット上の膨大な既存楽曲を無許諾で使用したと認めており、生成物そのものに法的なリスクが内包されています。 米国著作権局は「著作権保護は人間の創作活動にのみ与えられる」との方針を明確にしています。AIへの指示(プロンプト)だけでは作者とは見なされません。専門家も「人間が作ったものは保護され、AIが作ったものは保護されない。これが現在の境界線だ」と断言しています。 今回の事例は、テクノロジーの進化に法整備が追いついていない現状を象徴しています。専門家は、現在の法制度を「未整備な状態」と表現します。米国議会ではAIの学習データの透明性を求める法案も提出されていますが、法律が技術の進歩に追いつくには時間がかかります。 AIでコンテンツを制作・販売する企業やクリエイターは、どこまでが人間の創作物として法的に保護されるのかを慎重に見極める必要があります。契約を結ぶ際には、権利の範囲を明確に定義しなければ、将来的に深刻な紛争に発展するリスクを抱えることになるでしょう。

レコード会社、AIのSuno提訴 YouTube楽曲の不正コピーを主張

全米レコード協会(RIAA)は9月19日、AI音楽生成のSunoに対する訴訟で、同社がYouTubeから違法に楽曲をコピーしAI学習に利用したと主張する修正訴状を提出しました。Sunoがコピー防止技術を不正に回避し楽曲を大量入手したと指摘。AI開発におけるデータ収集の適法性が厳しく問われています。 RIAAの新たな主張の核心は、SunoがYouTubeの暗号化技術を破る「ストリームリッピング」を行ったという点です。これはストリーミングコンテンツをダウンロード可能なファイルに変換する行為を指します。この技術的な回避は、米国のデジタルミレニアム著作権法(DMCA)が禁じる行為に違反する可能性が高いとされています。 これまでSunoは、学習データの入手方法を明確にせず、著作物を利用したAIの学習は「フェアユース(公正な利用)」にあたると主張してきました。しかし、フェアユース成立の前提として元データの合法性が問われるため、今回の指摘はSunoの主張を根底から揺るがしかねません。AI開発におけるデータ収集のプロセスに大きな影響を与えるでしょうか。 今回の修正訴状は、Sunoの学習データが違法に収集された可能性を示す音楽出版社団体ICMPの調査結果を根拠にしています。データ入手の違法性が立証されれば、フェアユースの主張は弱まります。AI開発企業にとって、学習データの出所と収集プロセスの透明性の重要性を示す事例と言えるでしょう。 RIAAは、侵害された1作品につき最大15万ドル、技術的回避行為1件につき2500ドルの法定損害賠償を求めています。AIと著作権を巡る議論は、利用の是非からデータ収集の適法性へと、より深刻な段階に入りました。企業のAI活用においてもリーガルリスクの精査が不可欠です。

YouTube、生成AIで動画制作を革新 創造性の拡張目指す

YouTubeは、動画制作に生成AIツールを本格導入する新機能を発表しました。テキストから動画を生成するGoogleの技術などを活用し、誰でも簡単に動画を作れる環境を目指します。ニール・モハンCEOはこれを「創造の民主化」を加速させる一手と位置づけ、プラットフォームの次なる飛躍に繋げたい考えです。 新機能を使えば「月面で踊る100人のダンサー」といったテキストから即座に動画を生成できます。また、ポッドキャストの音声から関連映像を自動で作り出すことも可能です。これにより、誰もが簡単に質の高い動画コンテンツを制作できるようになります。 モハンCEOはAI導入を、創業以来の「テクノロジーで人々の声を届ける」という理念の延長線上にあると説明します。彼はAIをデジタル音楽のシンセサイザーに例え、ツールは人間の独創性や創造性を引き出す新たな機会になるとの考えを示しました。 一方で、AIによるコンテンツ制作の容易さは、プラットフォームの強みである「真正性」を損なうリスクも指摘されます。人間の創造性がどこまで介在するのかという根本的な問いと共に、AI生成物と人間による制作物の境界が曖昧になることへの懸念が浮上しています。 YouTubeは対策として、AI生成動画にはラベルを表示する方針です。しかし、視聴者がAIコンテンツを除外するフィルター機能は提供されません。モハンCEOは今後AIツールの影響はさらに拡大すると予測しており、YouTubeが常に最先端であり続けることが重要だと強調します。

Google、映画で「AIの死後世界」描く 新たな倫理的対話促す

AIオン・スクリーン始動

GoogleRange Media Partnersが共同
AIの社会浸透を前提とした物語創作を支援
科学小説から日常へのAI移行を促進

第1作『Sweetwater』の核心

テーマは「デジタルな死後の世界(digital afterlife)」
ホログラフィックAIによる亡き母の再現
中心概念は「生成された亡霊(generative ghosts)」
未解決の悲嘆とテクノロジーの関係性を考察

Googleは先ごろ、短編映画プログラム「AI on Screen」の第1作目となる『Sweetwater』を公開しました。これは、AIが日常生活に浸透する中で、人間とAIの複雑な関係、特に「デジタルな死後の世界」という倫理的なテーマを深く掘り下げた作品です。エンターテイメントを通じて、技術の進歩が社会に及ぼす影響について、重要な議論を促しています。

このプログラムは、SFの世界から現実へと移行しつつあるAIのあり方に対し、映画制作者の視点から物語を創造することを目的としています。映画は人々の想像力を形成し、技術との共存について社会的な対話を喚起する強力なツールです。Google多様な声を支援し、技術とストーリーテリングの重要な岐路を探ります。

『Sweetwater』の中心的な概念は、「生成された亡霊(generative ghosts)」です。これは、AI技術によって亡くなった愛する人のデジタルな人格を保存・再現する試みを指します。作中では、故人の息子がホログラフィックAIとして再現された母親と遭遇し、テクノロジーが人間の悲嘆や感情を予期せぬ形で増幅させる様を描いています。

第1作は、マイケル・キートン・ダグラス氏が監督・主演を務め、息子のショーン・ダグラス氏が脚本・音楽を担当しました。著名な映画人との協業は、AI技術の話題を一般層に広げ、倫理や家族の力学といった普遍的なテーマに落とし込む上で大きな意義を持ちます。

経営層やエンジニアにとって、この種のコンテンツは単なる娯楽に留まりません。AIが人間の感情や社会構造に深く関わる未来において、倫理的なフレームワークや規制の必要性を具体的に示唆します。技術開発だけでなく、その社会的受容性を高める上での視点を提供しているのです。

Amazon、出品者向けAIエージェント拡充 在庫管理から広告生成まで自動化

Agentic AI「Seller Assistant」進化

アカウント状態と在庫レベルを常時監視
売れ行き不振商品の価格変更や削除を推奨
需要パターンに基づき出荷を自動提案
新製品安全規制などコンプライアンスを自動チェック

AI広告チャットボットの導入

テキストプロンプト静止画・動画広告を生成
ブランドガイドラインを反映したクリエイティブの自動作成
タグライン、スクリプト、ボイスオーバーの生成
Amazon外のメディア(Prime Video等)への広告展開

Amazonは2025年9月、プラットフォーム上のサードパーティ出品者向けに、自律的に業務を代行するエージェントAI機能の導入・拡張を発表しました。既存の「Seller Assistant」を強化し、さらにAI広告作成チャットボットを提供します。これにより、在庫管理、コンプライアンス遵守、広告クリエイティブ制作などの広範な業務が自動化され、出品者の生産性と収益性の最大化を図ります。

拡張されたSeller Assistantは「常時稼働」のAIエージェントとして機能します。これは単なるツールではなく、セラーに代わってプロアクティブに働きかけることを目的としています。ルーティン業務から複雑なビジネス戦略までを自動で処理し、出品者は商品開発や事業成長といったコア業務に集中できる体制を構築します。

特に注目されるのが在庫管理の最適化機能です。エージェントは在庫レベルを継続的に監視し、売れ行きの遅い商品を自動的に特定します。これにより、長期保管料が発生する前に価格の引き下げや商品の削除を推奨。また、需要パターンを分析し、最適な出荷計画を立てるサポートも行います。

複雑化する規制への対応も自動化します。Seller Assistantは、出品リストが最新の製品安全性ポリシーに違反していないかをスキャンするほか、各国で販売する際のコンプライアンス要件への適合を自動で確保します。これはグローバル展開を志向するセラーにとって大きなリスク低減となります。

同時に導入されたAI広告チャットボットは、クリエイティブ制作の時間とコストを大幅に削減します。出品者が求める広告の概要をテキストで入力するだけで、AIがブランドガイドラインや商品詳細に基づき、静止画や動画のコンセプトを自動で生成します。

このチャットボットは、タグラインや画像だけでなく、スクリプト作成、音楽追加、ボイスオーバー、絵コンテのレイアウトまでを完結できます。生成された広告は、Amazonのマーケットプレイス内だけでなく、Prime VideoやKindle、TwitchといったAmazonの広範なプロパティに展開され、露出を最大化します。

これらの新機能は、Amazon独自の基盤モデルであるNova AI、およびAnthropicClaudeを活用しています。今回の発表は、AIが商取引を主体的に推進する「エージェント主導型コマース」の流れを加速させています。Googleなども同様にエージェントによる決済プロトコルを公開しており、AIによる業務代行競争が本格化しています。

YouTube、クリエイター向けAIを全面強化 Veo 3 Fastやリップシンク導入

<span class='highlight'>Veo</span>連携と動画編集

テキストから動画生成Veo 3 Fast」統合
会話から楽曲自動生成「Speech to Song」
生素材から初稿を自動編集「Edit with AI」

チャンネル成長支援

AIチャットボットAsk Studio」でインサイト分析
タイトル/サムネイルの最大3種A/Bテスト
無断利用された顔を検出・削除(YPP向け)

ポッドキャスト/多言語対応

多言語吹き替えにリップシンクを導入
音声コンテンツからプロモーション動画生成

YouTubeは「Made on YouTube 2025」にて、クリエイター生産性向上と収益拡大を目的とした大規模なAIツール群を発表しました。Shorts制作効率化のほか、チャンネル運営分析、著作権保護、そして多言語展開を支援する機能が焦点です。これにより、クリエイターコンテンツ制作における高い生産性とグローバルな収益機会を得られると期待されます。

特に注目すべきは、ショート動画(Shorts)向けにGoogle動画生成モデル「Veo 3 Fast」が統合された点です。これは低遅延の480p動画をテキストプロンプトから生成でき、静止画に動画の動きを適用する機能も搭載されます。クリエイターアイデアを即座に映像化でき、トレンドへの対応速度が飛躍的に向上します。

編集作業の負担も大幅に軽減されます。「Edit with AI」は、カメラロールの生素材から最適な場面を抽出し、音楽やトランジション、ボイスオーバーを自動で付与し、初稿を生成します。また、会話の内容をキャッチーな楽曲に変換する「Speech to Song」も導入され、より手軽なリミックス文化を推進します。

チャンネル運営の効率化のため、YouTube StudioにはAIチャットボット「Ask Studio」が導入されます。これはチャンネルのパフォーマンス分析や視聴者の反応に関する実用的なインサイトを提供し、収益化戦略を支援します。タイトルやサムネイルのA/Bテストも最大3パターンまで比較可能となり、最適化を促進します。

グローバル展開とブランド保護も重要なテーマです。自動吹き替え機能はさらに進化し、翻訳された音声に合わせたリップシンク技術(口の動きの同期)をテストすることで、翻訳動画のリアリティを大幅に高めます。視聴者が違和感なく視聴できる環境を提供します。

さらに、YouTubeパートナープログラム(YPP)参加者向けには、自身の顔の無断利用を検知し、削除を管理できる「肖像検出」機能がオープンベータ展開されます。これはクリエイターが自身のイメージや評判を守り、デジタル著作権を管理する上で重要なリスク管理ツールとなります。

ポッドキャスト領域への注力も見逃せません。AIは既存のビデオポッドキャストからプロモーション用のShortsやクリップを自動で提案・生成します。また、音声のみのポッドキャストに対しても、カスタマイズ可能な映像を自動で生成可能となり、オーディオクリエイターの新規開拓と視聴時間増に貢献します。

Google、全プラットフォームで「ヒスパニック文化月間」を推進

プラットフォーム横断の施策

Google Arts & Cultureでドミニカの歴史的偉人を紹介
Google Playストアにラテン系クリエイター作品を集約
YouTube Musicでサルサ音楽のプレイリストを特集
Google TVで無料テレノベラ等を提供開始

クリエイター・ビジネス支援

YouTubeで著名なラテン系クリエイターを積極登用
Google検索・マップでラテン系企業属性を継続表示
Chromeテーマでラテン系アーティスト作品を提供

テック大手Googleは、米国で9月15日から10月15日まで実施される「ヒスパニック・ヘリテージ月間」に合わせて、全プラットフォーム横断の大規模な文化貢献イニシアティブを展開しています。これは、ラテン系コミュニティの歴史と多様な文化、貢献を称えるD&I;戦略の根幹をなす取り組みであり、Googleの製品全体でコンテンツをキュレーションし、新たな視聴体験を提供します。

特に文化・教育コンテンツに力を入れており、Google Arts & Cultureでは、CUNYドミニカン研究機関と提携し、サルサ音楽家や著名シェフなど、影響力のあるドミニカの歴史的人物の物語を特集しています。また、Google Playストアには、ラテン系クリエイターが制作したアプリやゲーム、書籍を集めた専用ハブを設置し、文化的な深掘りを促しています。

YouTubeやYouTube Musicといったエンターテイメント領域では、クリエイターエコノミーの活性化に貢献します。YouTubeでは、著名なラテン系インフルエンサーやアーティストを大々的にフィーチャーし、彼らの露出を強化。YouTube Musicでは、サルサやトロピカル音楽のプレイリストを提供し、ジャンルの再評価と新しい才能の発掘を支援しています。

Google TVでは、メキシコなどで人気のテレノベラ(メロドラマ)のクラシックチャンネルを広告付き無料(FAST)で提供するなど、多様なコンテンツ視聴を可能にしました。これらの取り組みは期間限定ではなく、Google検索やマップでの「ラテン系オーナービジネス属性」の表示など、年間を通じたコミュニティ支援の一環として位置づけられています。

Google対メディア、AI検索巡る対立激化 補償要求と「ユーザー需要」の溝

AI検索を巡るGoogleの論理

AIサマリーはユーザー嗜好の変化に対応
従来の10個の青いリンクも引き続き重要視
健全なエコシステム構築が目標

パブリッシャーの危機感と反発

AI要約によるトラフィックの大幅減少を指摘
著作物利用への数十億ドルの補償を要求
ペンスキー・メディアなど大手企業が訴訟を提起
Gannettは独自チャットボットで対抗策を模索

米国ニューヨークで開催されたWIRED AI Power Summitにて、Googleの幹部が検索結果に表示されるAI要約機能「AI Overviews」を強く擁護しました。一方で、大手パブリッシャーのトップらは、AI要約によるサイトトラフィックの激減と収益への打撃を主張し、Googleとの対立が明確になっています。

Googleの政府渉外・広報担当バイスプレジデントであるマーカム・エリクソン氏は、AIサマリーの提供は「ユーザー嗜好の変化」に対応したものだと説明しています。利用者は事実だけではなく文脈的な要約を求めるようになっており、AI Overviews導入後も従来の「10個の青いリンク」モデルを維持し、健全なエコシステムを目指す方針です。

しかし、GannettのCEOであるマイク・リード氏らは、この主張を全面的に否定しています。AI Overviewsの存在により、コンテンツ制作者やパブリッシャーへのトラフィック流入が著しく減少しているという明確なデータがあると指摘し、Googleの説明は事実と反すると強く反発しました。

特に焦点となっているのは、AIモデルの学習における著作物の利用に対する補償問題です。Condé NastのCEOであるロジャー・リンチ氏は、AIの最も重要なインプットであるコンテンツに対し、メディア業界全体で数十億ドル規模の補償が必要になると主張。ストリーミング時代の音楽業界との類似点を指摘しました。

AI Overviewsによる収益減を巡っては、すでにRolling Stoneの親会社であるペンスキー・メディアなどがGoogleに対し訴訟を提起するなど、法的な動きも活発化しています。また、Gannettは外部AIに依存せず、読者に答えを提供する独自チャットボット「DeeperDive」を開発し、対抗戦略を始めています。

このメディア対AIプラットフォームの構図は、政治的な規制議論も加速させています。リチャード・ブルーメンソール上院議員(民主党)は、AIによる著作権侵害などの「防護柵」を社会的な被害が拡大する前に確立すべきだと提言。AIを巡る法整備の必要性が高まっています。

USA Todayが自社チャットボット導入、GoogleのAI概要に反撃

出版業界の危機感

Google AI Overviewでトラフィック激減
検索エンジン依存モデルの将来リスクを指摘
著作権侵害への数十億ドルの補償を要求

独自AI「DeeperDive」

Gannettが独自チャットボットDeeperDive発表
220紙以上の自社記事を回答ソースに限定
事実確認を重視し意見記事を除外

技術と収益戦略

開発はTaboolaと連携しOSSを活用
検索ボックスを代替し読者の関心を捕捉
将来的に購買支援エージェント化を目指す

米大手新聞社Gannett(USA Today Network)は、GoogleのAI概要(AI Overview)機能によるウェブトラフィック激減に対抗するため、独自AIチャットボット「DeeperDive」を導入しました。同社CEOのマイク・リード氏は、WIRED AI Power Summitにて発表し、AIがコンテンツを要約することで、出版社へのトラフィックフローが劇的に減少している現状を強く批判しました。この動きは、AIによるメディア業界の収益モデル破壊に対する具体的な反撃策として注目されています。

DeeperDiveは、USA Today Networkの220紙以上の出版物から得たジャーナリズム記事のみに基づいて読者の質問に答える、「AI回答エンジン」です。従来の検索ボックスを置き換え、ユーザーに直接的な回答と関連性の高い記事を提供します。これは、読者が外部のAI企業に行かずとも、信頼できる情報源内で完結させることを目的としています。

DeeperDiveの最大の特徴は、回答の事実正確性を重視している点です。同CEOは、意見記事は参照せず、「実際のジャーナリズム」のみを参照源とすることを強調しました。このツールは広告技術企業Taboolaと共同開発され、複数のオープンソースモデルファインチューニングして構築されています。

リードCEOは、GoogleAI Overviewが「10の青いリンク(従来の検索結果)」を経由するトラフィックを著しく妨害しているとの認識を示しました。この問題は業界全体に及び、SEO最適化に依存する従来のコンテンツ配信モデルに、将来的なリスクをもたらすと警鐘を鳴らしています。

メディア業界のリーダーたちは、AIがコンテンツを学習データとして使用することに対する数十億ドル規模の補償が必要だと主張しています。Condé Nastのロジャー・リンチCEOは、音楽業界がストリーミングサービスとライセンス契約を結んだ状況になぞらえ、AIモデルにとってコンテンツは最も重要なインプットであると訴えています。

GannettはDeeperDiveを通じて読者の関心や意図をより深く理解し、収益化に繋げることを期待しています。次のステップとして、読者の購買決定を支援するエージェント機能を探求する意向を示しています。同社の読者は元々購買意欲が高い層であり、新たな収益源としての可能性を見込んでいるとのことです。