画像生成(ユースケース)に関するニュース一覧

拡散モデルAIに5千万ドル、コード生成を高速化

資金調達と背景

Inceptionが5千万ドルを調達
スタンフォード大教授が主導
MSやNVIDIAなど大手も出資

技術的な優位性

画像生成技術をテキスト・コードに応用
逐次処理から並列処理へ移行
低遅延・低コストでのAI開発
毎秒1000トークン超の生成速度

AIスタートアップのInceptionは11月6日、テキストおよびコード生成向けの拡散モデル開発のため、シードラウンドで5000万ドル(約75億円)を調達したと発表しました。スタンフォード大学の教授が率いる同社は、画像生成AIで主流の技術を応用し、従来のモデルより高速かつ効率的なAI開発を目指します。

拡散モデルは、GPTシリーズなどが採用する自己回帰モデルとは根本的に異なります。自己回帰モデルが単語を一つずつ予測し、逐次的に文章を生成するのに対し、拡散モデルは出力全体を反復的に洗練させるアプローチを取ります。これにより、処理の大幅な並列化が可能になります。

この技術の最大の利点は、圧倒的な処理速度です。Inceptionのモデル「Mercury」は、ベンチマークで毎秒1,000トークン以上を生成可能だと報告されています。これは従来の技術を大幅に上回る速度であり、AIの応答時間(レイテンシー)と計算コストを劇的に削減する可能性を秘めています。

今回の資金調達はMenlo Venturesが主導し、MicrosoftのM12ファンドやNvidiaのNVenturesなど、業界を代表する企業や投資家が参加しました。この事実は、テキスト生成における拡散モデルという新しいアプローチへの高い期待を示していると言えるでしょう。

テキスト生成AIの分野では自己回帰モデルが主流でしたが、特に大規模なコードベースの処理などでは拡散モデルが優位に立つ可能性が研究で示唆されています。Inceptionの挑戦は、今後のソフトウェア開発のあり方を大きく変えるかもしれません。

英AI著作権裁判、Stability AIが実質勝소

判決の要点

商標権侵害は認定
著作権侵害は棄却
AI学習の合法性は判断せず
Stability AIが実質勝訴

今後の焦点

米国での同種訴訟の行方
クリエイターとAI企業の対立
法整備の遅れが浮き彫りに
和解や提携の動きも活発化

英国高等法院は11月5日、画像生成AI「Stable Diffusion」を巡り、ストックフォト大手ゲッティイメージズが開発元のStability AIを訴えていた裁判で、Stability AI側に有利な判決を下しました。ゲッティのウォーターマーク(透かし)を再現したことによる商標権侵害は認定されたものの、AIの学習データ利用という核心的な著作権問題については判断が回避され、法的な不透明さが残る結果となりました。

判決の焦点は、著作権と商標権の侵害の有無でした。裁判所は、Stable Diffusionがゲッティの透かし入り画像を生成した点を商標権侵害と認定しました。一方で、著作権の二次的侵害については「AIモデルは著作権物を保存・複製していない」としてゲッティの主張を退け、Stability AIが実質的に勝訴した形です。

しかし、今回の裁判で最も注目された「著作権で保護された画像のAI学習への利用」という根幹的な論争に決着はつきませんでした。これは、ゲッティ側が証拠不十分を理由に裁判の途中でこの主要な訴えを取り下げたためです。結果として、英国におけるAIと著作権の明確な法的指針は示されないままとなりました。

この問題は、舞台を米国に移して争いが続きます。ゲッティはカリフォルニア州でもStability AIを相手に同様の訴訟を起こしており、そちらの判決が次の焦点です。一方で、AI企業と権利者の間では対立だけでなく、音楽業界のように戦略的提携に至るケースも出てきており、その動向は一様ではありません。

AI開発者経営者にとって、今回の判決は一安心材料かもしれません。しかし、AIの学習プロセスにおける著作権リスクが完全に払拭されたわけではない点に注意が必要です。各国の司法判断や法整備の動向を注視し、自社のAI開発・利用戦略を慎重に検討し続ける必要があるでしょう。

NVIDIA RTX、AIクリエイティブを劇的加速

AI制作の劇的な高速化

RTX 50シリーズのAI特化コア
生成AIモデルが最大17倍高速
主要制作アプリ135種以上を最適化

動画・3Dワークフロー革新

4K/8K動画もプロキシ不要で編集
リアルタイムでの3Dレンダリング
AIによるノイズ除去と高解像度化

配信・ストリーミング支援

専用エンコーダーで高画質配信
AIアシスタントによる配信作業の自動化

NVIDIAは、クリエイティブカンファレンス「Adobe MAX」において、同社のGeForce RTX GPU動画編集、3D制作、生成AIなどのクリエイティブな作業をいかに高速化するかを明らかにしました。AI時代に求められる膨大な計算処理を専用ハードウェアで実行し、アーティストや開発者生産性を飛躍的に向上させるのが狙いです。

RTX GPUの強みは、AI処理に特化した第5世代Tensorコアや、3Dレンダリングを高速化する第4世代RTコアにあります。さらにNVIDIA Studioが135以上のアプリを最適化し、ハードウェア性能を最大限引き出すことで、安定した制作環境を提供します。

特に生成AI分野で性能は際立ちます。画像生成AI「Stable Diffusion」は、Apple M4 Max搭載機比で最大17倍高速に動作。これによりアイデアの試行錯誤を迅速に行え、創造的なプロセスを加速させます。

動画編集では4K/8K等の高解像度コンテンツが課題でした。RTX GPUは専用デコーダーにより、変換作業なしでスムーズな編集を実現します。AIエフェクトの適用や書き出し時間も大幅に短縮され、コンテンツ公開までの速度が向上します。

3D制作の現場も大きく変わります。レイトレーシングを高速化するRTコアと、AIで解像度を高めるDLSS技術により、これまで時間のかかったレンダリングがリアルタイムで可能に。アーティストは結果をすぐに確認でき、創造的な作業に集中できます。

ライブ配信もより身近になります。専用エンコーダーNVENCがCPU負荷を軽減し、ゲーム性能を維持したまま高品質な配信を実現します。AIアプリ「Broadcast」を使えば、特別なスタジオがなくても背景ノイズ除去やカメラ補正が簡単に行えます。

NVIDIAのRTX GPUは、個別のタスク高速化だけでなく、制作ワークフロー全体を革新するプラットフォームです。AIを活用して生産性と収益性を高めたいクリエイターや企業にとって、不可欠なツールとなることは間違いないでしょう。

マイクロソフト、初の独自AI画像生成モデルを公開

独自モデル「MAI-Image-1」

MS初の独自開発AI画像生成モデル
モデル名は「MAI-Image-1」
写実的な風景や照明の生成に強み
速度と品質の両立をアピール

OpenAI依存脱却への布石か

BingとCopilotで提供開始
OpenAIモデルと並行して提供
Copilot音声ストーリーにも活用
AI開発の主導権確保を狙う動き

マイクロソフトは2025年11月4日、同社初となる自社開発のAI画像生成モデル「MAI-Image-1」を発表しました。この新モデルは、検索エンジンBingの画像生成機能やCopilotで既に利用可能となっています。大手IT企業がOpenAIへの依存度を下げ、独自のAI開発を加速させる動きとして注目されます。

「MAI-Image-1」は、特に食べ物や自然の風景、芸術的な照明、そして写実的なディテールの表現に優れているとされます。マイクロソフトは「速度と品質の両立」を強調しており、ユーザーはアイデアを素早く視覚化し、試行錯誤を重ねることが容易になります。

この新モデルは、Bing Image Creatorにおいて、OpenAIのDALL-E 3やGPT-4oと並ぶ選択肢の一つとして提供されます。また、Copilot音声合成機能では、AIが生成した物語に合わせてアートを自動生成する役割も担い、コンテンツ制作の幅を広げます。

今回の発表は、マイクロソフトがAI開発の主導権を確保しようとする大きな戦略の一環です。同社は8月にも独自の音声・テキストモデルを発表しており、OpenAIへの依存からの脱却を段階的に進めていると見られます。独自技術の強化は、今後の競争優位性を左右する鍵となるでしょう。

一方でマイクロソフトは、CopilotOpenAIの最新モデルGPT-5を導入するなど、マルチAIモデル戦略も同時に推進しています。自社開発と外部の高性能モデルを使い分けることで、あらゆるニーズに対応する構えです。最適なAI活用のバランスをどう取るのか、同社の動向から目が離せません。

ホワイトハウス新ホール、AI酷似の欠陥は人為ミス

AI生成を疑う声

行き止まりの階段
不自然に融合した窓
AI特有の不整合性に酷似
設計図との矛盾も多数

専門家が指摘する真相

AIではなく人為的エラー
拙速な計画と品質管理の欠如
通常の監督プロセスを省略
人間の作業ミスが原因

トランプ米大統領が公開したホワイトハウス新ホールの物理模型が、専門家から批判を浴びています。行き止まりの階段など、AI生成物に見られるような奇妙な欠陥が複数指摘されましたが、真相はAIではなく人為的なエラーのようです。拙速な計画進行が背景にあると見られています。

模型には、壁で行き止まりになる階段や不自然に融合した窓、設計図にない余分な柱など、構造上の矛盾が多数見られます。これらは、近年注目される画像生成AIが作り出す非論理的な描写と酷似しており、当初はAI使用の憶測を呼びました。

しかし、複数の建築専門家はこれを「お粗末な人間の仕事」と一蹴します。イリノイ大学のポール・プライスナー教授は「AIのせいにできるものではなく、品質管理がないだけだ」と指摘。極端に急がされたスケジュールが、初歩的なミスの原因だと分析しています。

この異例の速さの背景には、トランプ大統領による監督プロセスの軽視があります。政府建造物のデザインを審査する美術委員会の委員を全員解任し、通常経るべきレビューを省略して計画を強行したことが、今回の品質低下を招いたとみられています。

AI技術が浸透する現代において、その特有の「欠陥」が、人間の作業品質を測る一つの指標になりつつあるのかもしれません。今回の事例は、技術の有無に関わらず、厳格な品質管理と監督プロセスがいかに重要であるかを浮き彫りにしています。

AI発想支援Mixboard、180カ国超で提供開始

AIでアイデアをカタチに

実験的なAIコンセプトボード
テキストや画像自由に配置
AIによる画像生成・編集機能

世界展開と機能アップデート

提供国を180カ国以上に拡大
ユーザーの声でボード面積が4倍
企画や設計など多様な用途で活用

Googleは2025年10月30日、AIを活用した実験的なコンセプトボード「Mixboard」の提供を、新たに180カ国以上に拡大したと発表しました。このツールは、AIによる画像やテキストの生成・編集機能を持ち、ユーザーがアイデアを視覚的に探求し、具体化することを支援します。ビジネスの企画から個人の創作活動まで、幅広い活用が期待されます。

Mixboardの核となるのは、Google画像モデル「Gemini」を基盤とする「Nano Banana」です。ユーザーは簡単な指示で画像新規生成したり、既存の画像を編集したりできます。また、テキストブロックの自動生成や、手持ちの画像をボードにインポートすることも可能で、直感的な操作でアイデアを自由に配置、整理できます。

今回の発表では、提供国の拡大に加え、大幅な機能改善も行われました。9月の提供開始以降に寄せられたユーザーからのフィードバックを反映し、ボードの面積を従来の4倍に拡張。これにより、より複雑で大規模なアイデアも、一つのボード上でストレスなく展開できるようになりました。

すでにMixboardは多様なシーンで活用されています。公式ブログでは、パーティの企画、DIYプロジェクトの設計、アイデアのストーリーボード化といった事例が紹介されています。視覚的なブレインストーミングツールとして、チームでの共同作業や個人の創造性を飛躍的に高める可能性を秘めています。

Mixboardは、最新技術を試す「Google Labs」発の実験的なプロジェクトです。今回のグローバル展開と機能強化は、AIが創造的なプロセスを支援するツールとして本格的に普及する一歩と言えるでしょう。今後のさらなる進化に注目が集まります。

Figma、AI動画生成Weavy買収 デザイン機能強化へ

買収の概要

デザイン大手Figmaがイスラエル企業を買収
買収額は非公開、従業員20名が合流
ブランド「Figma Weave」として統合予定

Weavyの強み

複数AIモデルで画像動画を生成
プロンプト微調整可能な高度編集機能
ノードベースで生成物を分岐・リミックス

今後の展望

当面はスタンドアロン製品として提供
Figmaのプラットフォームに順次統合

デザインプラットフォーム大手のFigmaは10月30日、AIによる画像動画生成を手がけるイスラエルのスタートアップWeavyを買収したと発表しました。Weavyの従業員20名がFigmaに合流し、同社の技術は新ブランド「Figma Weave」として将来的にはFigmaのプラットフォームに統合されます。この買収により、FigmaはデザインプロセスにおけるAI生成能力を大幅に強化する狙いです。

Weavyは2024年にテルアビブで設立された新興企業です。創業から1年足らずで、シードラウンドにて400万ドルを調達するなど注目を集めていました。同社のツールは、ユーザーが複数のAIモデルを組み合わせて高品質な画像動画を生成し、プロ向けの編集機能で細かく調整できる点が特徴です。

Weavyの技術的な強みは、その柔軟な生成プロセスにあります。ユーザーは無限キャンバス上で、画像生成動画生成プロンプトを組み合わせるなど自由な発想でメディアを作成できます。この「ノードベース」のアプローチにより、生成結果を分岐させたり、リミックスしたりと、創造的な試行錯誤と改良が容易になります。

Figmaによると、Weavyは当面スタンドアロン製品として提供が継続されます。その後、新ブランド「Figma Weave」としてFigmaのプラットフォーム全体に統合される計画です。Figmaのディラン・フィールドCEOは、Weavyの「シンプルさ、親しみやすさ、そしてパワフルさのバランス」を高く評価しており、統合によるシナジーに期待を寄せています。

AIデザインツールの市場は競争が激化しています。AI検索Perplexityデザインツールチームを買収するなど、大手テック企業によるAIクリエイティブ領域への投資が活発化しています。今回の買収は、デザインワークフローのあらゆる段階にAIを組み込もうとするFigmaの強い意志を示すものであり、今後の業界の動向を占う上で重要な一歩と言えるでしょう。

OpenAI、推論で安全性を動的分類する新モデル公開

新モデルの特長

開発者安全方針を直接定義
推論ポリシーを解釈し分類
判断根拠を思考過程で透明化
商用利用可能なオープンモデル

従来手法との違い

ポリシー変更時の再学習が不要
大量のラベル付きデータが不要
新たな脅威へ迅速な対応が可能

性能と実用上の課題

小型ながら高い分類性能を発揮
処理速度と計算コストが課題

OpenAIは2025年10月29日、開発者が定義した安全方針に基づき、AIが推論を用いてコンテンツを動的に分類する新しいオープンウェイトモデル「gpt-oss-safeguard」を発表しました。このモデルは、従来の大量データに基づく分類器とは異なり、ポリシー自体を直接解釈するため、柔軟かつ迅速な安全対策の導入を可能にします。研究プレビューとして公開され、コミュニティからのフィードバックを募ります。

最大の特徴は、AIの「推論能力」を活用する点です。開発者は自然言語で記述した安全方針を、分類対象のコンテンツと共にモデルへ入力します。モデルは方針を解釈し、コンテンツが方針に違反するかどうかを判断。その結論に至った思考の連鎖(Chain-of-Thought)」も示すため、開発者は判断根拠を明確に把握できます。

このアプローチは、従来の機械学習手法に比べて大きな利点があります。従来、安全方針を変更するには、数千件以上の事例データを再ラベル付けし、分類器を再学習させる必要がありました。しかし新モデルでは、方針テキストを修正するだけで対応可能です。これにより、巧妙化する新たな脅威や、文脈が複雑な問題にも迅速に適応できます。

例えば、ゲームのコミュニティサイトで不正行為に関する投稿を検出したり、ECサイトで偽レビューを特定したりと、各サービスの実情に合わせた独自の基準を容易に設定・運用できます。大規模なデータセットを用意できない開発者でも、質の高い安全分類器を構築できる道が開かれます。

性能評価では、社内ベンチマークにおいて、基盤モデルである「gpt-5-thinking」を上回る精度を示しました。一方で、特定の複雑なリスクに対しては、大量のデータで専用に訓練された従来の分類器に劣る場合があることや、推論プロセスに伴う計算コストと処理遅延が課題であることも認めています。

OpenAIは、社内ツール「Safety Reasoner」で同様のアプローチを既に採用しており、GPT-5画像生成AI「Sora 2」などの安全システムの中核を担っています。今回のオープンモデル公開は、こうした先進的な安全技術を広く共有し、コミュニティと共に発展させることを目指すものです。モデルはHugging Faceからダウンロード可能で、Apache 2.0ライセンスの下で自由に利用、改変、配布ができます。

Meta、SNSにAI生成コンテンツ大量投入へ

AIが拓くSNSの新時代

友人・家族中心の第一期
クリエイター中心の第二期
AI生成コンテンツ第三の波

レコメンド技術が鍵

AI投稿を深く理解するシステム
ユーザーに最適なコンテンツを提示
AI動画アプリ「Vibes」で実験

好調な業績が後押し

第3四半期売上は26%増の好業績
「Vibes」で200億超画像生成

Metaのマーク・ザッカーバーグCEOは2025年10月29日の第3四半期決算発表で、FacebookInstagramなどのソーシャルフィードにAI生成コンテンツを大量に統合する計画を明らかにしました。AIによってコンテンツ作成が容易になることを背景に、これをソーシャルメディアの「第三の時代」を切り拓く重要な戦略と位置づけています。

ザッカーバーグ氏は、ソーシャルメディアの進化を二つの時代に分けて説明しました。第一の時代は友人や家族の投稿が中心、第二の時代はクリエイターコンテンツの台頭です。そして今、AIがもたらすコンテンツの爆発的な増加が、第三の大きな波になるとの見方を示しました。これは、私たちの情報消費のあり方を根本から変える可能性があります。

この変革の鍵を握るのが、レコメンデーションシステムです。AIが生成した膨大な投稿をシステムが「深く理解」し、個々のユーザーにとって最も価値のあるコンテンツを的確に表示する能力が、これまで以上に重要になるとザッカーバーグ氏は強調します。コンテンツの質と量のバランスをどう取るかが、今後の大きな課題となるでしょう。

Metaは既にこの未来に向けた布石を打っています。AI動画フィードアプリ「Vibes」では、ユーザーによって200億以上画像が生成されるなど、具体的な成果も出始めています。これはAIが可能にする全く新しいコンテンツ体験のほんの一例に過ぎません。

この大胆なAI戦略を支えているのが、同社の好調な業績です。第3四半期の売上は前年同期比26%増の512.4億ドルに達しました。潤沢な資金を背景に、MetaはAI分野への積極的な投資を続け、ソーシャルメディアの未来を再定義しようとしています。

Extropic、省エネAIチップでデータセンター覆す

新方式「熱力学チップ」

GPUとは根本的に異なる仕組み
熱のゆらぎを利用して計算
確率的ビット(p-bit)で動作
数千倍のエネルギー効率目標

初の試作機と将来性

初の実動ハードウェアを開発
AIラボや気象予測企業で試験
次世代機で拡散モデルを革新へ
データセンター電力問題に挑戦

スタートアップのExtropic社が、データセンターの常識を覆す可能性を秘めた新型コンピュータチップの最初の実動ハードウェアを開発しました。この「熱力学的サンプリングユニット(TSU)」は、従来のチップより数千倍のエネルギー効率を目指しており、AIの爆発的な普及に伴う莫大な電力消費問題への画期的な解決策として注目されています。

TSUは、GPUなどが用いる0か1のビットとは根本的に異なります。熱力学的な電子のゆらぎを利用して確率そのものを扱う「確率的ビット(p-bit)」で動作します。これにより、AIモデルや気象予測など、複雑なシステムの確率計算を極めて効率的に行えるようになります。この革新的なアプローチが、省エネ性能の鍵です。

同社は今回、初の試作機「XTR-0」を開発し、一部のパートナー企業への提供を開始しました。提供先には、最先端のAI研究を行うラボや気象モデリングを手がけるスタートアップ、さらには複数の政府関係者が含まれており、実環境での有用性の検証が始まっています。

パートナーの一社である気象予測AI企業Atmo社のCEOは、この新技術に大きな期待を寄せています。Extropicのチップを使えば、様々な気象条件が発生する確率を従来よりはるかに効率的に計算できる可能性があると述べており、より高解像度な予測モデルの実現につながるかもしれません。

Extropic社は、将来の展望も具体的に示しています。同社が発表した論文では、数千個のp-bitを搭載した次世代チップで、画像生成AIなどに用いられる「拡散モデル」を効率化できると説明。来年には25万p-bitを搭載したチップ「Z-1」の提供を目指しています。

この独自のアプローチは、業界専門家からも高く評価されています。ある専門家は「従来のトランジスタのスケーリングが物理的な限界に達する中、Extropic社の物理情報処理へのアプローチは、今後10年で変革をもたらす可能性がある」と指摘しています。

AIデータセンターへの巨額投資が続く一方で、そのエネルギー需要は深刻な課題です。Extropic社の挑戦は、ハードウェアの根本的な革新によってこの問題を解決しようとするものです。たとえ成功確率がわずかでも、試す価値のある重要な取り組みだと言えるでしょう。

Googleの教育AI、米1000大学で1000万人利用

教育現場でAI活用が加速

米国1000以上の高等教育機関が導入
利用学生数は1000万人を突破
MITやブラウン大学など名門校も採用
教育機関向けにデータ保護されたAIを提供

学習から就活まで支援

小テストや学習ガイドの個別生成
論文執筆のための情報要約・分析
証明写真や部屋の画像生成機能

Googleは2025年10月28日、同社の生成AI「Gemini for Education」が、米国の1000以上の高等教育機関で導入され、1000万人以上の学生に利用されていると発表しました。学習支援から就職活動まで幅広く活用されており、教育現場におけるAIの浸透が急速に進んでいます。

導入機関にはマサチューセッツ工科大学(MIT)やブラウン大学といった名門校も含まれます。Googleは、教育機関向けにデータ保護を強化したAIツールを無償で提供しており、これが急速な普及を後押ししていると考えられます。

学生教員は、Geminiを用いて試験対策用の小テストを作成したり、研究プロジェクトで必要な情報を要約・分析したりしています。また、寮の部屋のデザイン案や就職活動用の証明写真を生成するなど、学業以外でのクリエイティブな活用も広がっています。

今後は、簡単な指示(プロンプト)だけでプレゼンテーション資料を自動で作成し、Googleスライドにエクスポートする機能などが追加される予定です。これにより、学生教員生産性はさらに向上すると期待されます。

Gemini for Education」と研究ノートツール「NotebookLM」は、教育機関が利用する生産性向上スイートの種類を問わず、無償で導入可能です。GoogleはAI人材育成も視野に入れ、教育分野でのエコシステム構築を急いでいます。

Adobe、画像・音声生成AIを全方位で強化

Fireflyが大幅進化

新モデルFirefly Image 5登場
プロンプトレイヤー編集が可能に
独自スタイルでカスタムモデル作成

AIアシスタント登場

PhotoshopとExpressに搭載
自然言語で複雑な編集を自動化
複数アプリを統括するMoonlight

音声・動画生成も強化

動画に合わせたBGMを自動生成
テキストから高品質なナレーション生成

アドビは2025年10月28日、年次カンファレンス「Adobe Max 2025」で、生成AI機能群の大幅なアップデートを発表しました。中核となる画像生成AI「Firefly」の新モデルや、Photoshopなどに搭載されるAIアシスタント、BGMやナレーションを自動生成する音声ツールを公開。クリエイティブ制作の生産性と表現力を飛躍的に高めることを目指します。

画像生成AIの最新版「Firefly Image 5」は、性能が大きく向上しました。ネイティブで最大4メガピクセルの高解像度画像に対応するほか、オブジェクトを個別に認識しプロンプトで編集できるレイヤー機能を搭載。クリエイター自身の作品を学習させ、独自の画風を持つカスタムモデルを作成することも可能になります。

「Photoshop」と「Express」には、新たにAIアシスタントが導入されます。これにより、ユーザーは「背景を削除して」といった自然言語の指示で、複雑な編集作業を自動化できます。専門的なツール操作を覚える必要がなくなり、あらゆるスキルレベルのユーザーが、より直感的にアイデアを形にできるようになるでしょう。

動画制作者にとって画期的な音声生成機能も追加されました。「Generate Soundtrack」はアップロードされた動画の内容を解析し、最適なBGMを自動生成します。「Generate Speech」はテキストから自然なナレーションを作成。これらは商用利用も可能で、コンテンツ制作の効率を劇的に改善します。

将来構想として、複数アプリを統括するAIエージェント「Project Moonlight」も発表。このAIはCreative CloudやSNSアカウントと連携し、ユーザーの作風やブランド戦略を学習。一貫性のあるコンテンツの企画から制作、投稿戦略の立案までを支援する、まさに「クリエイティブディレクター」のような役割を担います。

アドビは自社モデルだけでなく、GoogleGeminiなどサードパーティ製AIモデルの採用も進めています。今回の発表は、クリエイティブの全工程にAIを深く統合し、制作プロセスそのものを変革しようとする同社の強い意志を示すものです。クリエイター生産性向上と、新たな表現の可能性が大きく広がりそうです。

画像生成AIの悪用、偽造領収書で経費不正が急増

生成AIによる不正の現状

画像生成AIで領収書を偽造
不正書類の14%がAI製との報告
90日で100万ドル超の不正請求も
財務担当者の3割が不正増を実感

偽造の手口と対策

テキスト指示だけで数秒で作成可能
専門家も「目で見て信用するな
経費精算システムのAI検知が重要

画像生成AIの進化が、企業の経費精算に新たな脅威をもたらしています。欧米企業で、従業員がOpenAIGPT-4oなどのAIを使い、偽の領収書を作成して経費を不正請求する事例が急増。経費管理ソフト各社は、AIによる不正検知機能の強化を急いでいます。これは、テクノロジーの進化がもたらす負の側面と言えるでしょう。

不正の規模は深刻です。ソフトウェアプロバイダーのAppZenによると、今年9月に提出された不正書類のうち、AIによる偽造領収書は全体の約14%を占めました。昨年は一件も確認されていなかったことからも、その増加ペースの速さがうかがえます。フィンテック企業Rampでは、新システムがわずか90日間で100万ドル以上の不正請求書を検出しました。

現場の危機感も高まっています。経費管理プラットフォームMediusの調査では、米国英国の財務専門家約3割が、OpenAIの高性能モデル「GPT-4o」が昨年リリースされて以降、偽造領収書の増加を実感していると回答。新たなAI技術の登場が、不正行為の明確な転換点となったことが示唆されています。

生成される領収書は極めて精巧で、人間の目での判別はほぼ不可能です。世界的な経費精算プラットフォームであるSAP Concurの幹部は「もはや目で見て信用してはいけない」と顧客に警告を発しています。同社では、AIを用いて月に8000万件以上コンプライアンスチェックを行い、不正の検出にあたっています。

なぜ、これほどまでに不正が広がったのでしょうか。従来、領収書の偽造には写真編集ソフトを扱う専門スキルや、オンライン業者への依頼が必要でした。しかし現在では、誰でも無料で使える画像生成AIに簡単なテキストで指示するだけで、わずか数秒で本物そっくりの領収書を作成できてしまうのです。

AI開発企業も対策を進めています。OpenAIは、規約違反には対処し、生成画像にはAIが作成したことを示すメタデータを付与していると説明します。しかし、悪意ある利用を完全に防ぐことは困難です。企業はもはや性善説に頼るのではなく、AIを活用した検知システムの導入が喫緊の課題となっています。

AIが作る偽の豪華休暇、新たな現実逃避市場が台頭

AIで偽の自分を生成

自分の顔写真から簡単生成
豪華な休暇を疑似体験
SNSでの見栄とは違う目的

現実逃避と自己実現

低所得者層が主な利用者
「引き寄せの法則」をAIで実践
叶わぬ願望を仮想体験

新たな課金モデル

少量画像生成課金誘導
C向けAIアプリの新潮流

AI技術を活用し、自分が豪華な休暇を楽しんでいるかのような偽の画像を生成するスマートフォンアプリが新たな注目を集めています。これらのアプリは、経済的な理由で旅行に行けない人々などに、一種の「デジタルな現実逃避」を提供。SNSでの見栄を張るためだけでなく、より良い人生を願う「引き寄せ」の一環として利用する動きが、特にアジアの若者などの間で広がっています。

この動きは、高級ブランドの模倣品を購入したり、プライベートジェット風のセットで写真を撮ったりする、従来の「富を偽る」行為の延長線上にあります。しかし、その目的は他者への誇示から、個人的な精神的満足へとシフトしている点が特徴です。AIが可能にした、よりパーソナルで没入感の高い体験が、新たな需要を生み出していると言えるでしょう。

具体的な事例として、インドネシアの状況が挙げられます。OpenAIコンサルタントによると、月収400ドル以下の低・中所得者層が集まるFacebookグループでは、ランボルギーニと写る自分など、AIが生成した豪華な体験写真が数多く共有されています。これは「決して生きられないであろう人生」を仮想的に体験する、現代的な現実逃避の形と言えます。

Metaデザイナーが開発した「Endless Summer」というアプリも、この潮流を象徴しています。このアプリは「燃え尽き症候群に陥った時に、偽の休暇写真で理想の生活を引き寄せる」というコンセプトを掲げています。数枚の自撮り写真を提供するだけで、世界中の観光地にいるかのような自分の画像を生成できる手軽さが特徴です。

ビジネスモデルとしては、数枚の画像を無料で生成させた後、より多くの画像を求めて有料プランへ誘導する手法が一般的です。例えば「Endless Summer」では30枚の画像生成に3.99ドルが必要となります。しかし、生成される画像の質はアプリによってばらつきがあり、本人とは似ても似つかない場合も少なくありません。

この「AIによる現実逃避」サービスは、消費者向けAIアプリの新たな市場可能性を示唆しています。一方で、デジタルな偽りの自己像への没入が、現実世界との乖離を助長するリスクもはらんでいます。経営者開発者は、人間の心理的な欲求を捉えたサービス開発と、その倫理的な課題の両面に目を向ける必要がありそうです。

ChatGPT、社内データ横断検索で業務を革新

社内情報の検索エンジン化

SlackやDriveと直接連携
複数アプリを横断した情報検索
アプリ切替不要で作業効率化

高精度な回答と信頼性

GPT-5搭載で高精度な回答
回答には出典を明記し信頼性確保
曖昧な質問にも多角的に回答

利用上の注意点

機能利用には手動選択が必要
ウェブ検索画像生成同時利用不可

OpenAIは2025年10月24日、法人および教育機関向けChatGPTに新機能「company knowledge」を導入したと発表しました。この機能は、SlackGoogle Driveといった社内ツールと連携し、組織内の情報を横断的に検索できるものです。アプリを切り替える手間を省き、情報探索の効率を飛躍的に高めることを目的としています。

新機能の最大の特徴は、ChatGPT社内情報のハブとして機能する点です。ユーザーは使い慣れたチャット画面から、Slackの会話、SharePointの文書、Google Driveの資料などを直接検索できます。これにより、散在する情報の中から必要なものを迅速に見つけ出すことが可能になります。

この機能は、最新のGPT-5モデルを基盤としています。複数の情報源を同時に検索・分析し、より包括的で精度の高い回答を生成するよう特別に訓練されています。これにより、単純なキーワード検索では得られなかった洞察や要約を提供します。競合のAnthropic社も同様の機能を発表しており、AIの業務活用競争が激化しています。

回答の信頼性も重視されています。すべての回答には明確な出典が引用として表示されるため、ユーザーは情報の出所を簡単に確認できます。例えば、顧客との打ち合わせ前に、関連メールや過去の議事録を基にしたブリーフィング資料を自動で作成するといった活用が可能です。

「来年の会社目標はどうなったか?」といった曖昧な質問にも対応します。ChatGPTは複数の情報源から関連情報を探し出し、矛盾する内容を整理しながら、総合的な回答を提示します。日付フィルター機能も備え、時系列に沿った情報検索も得意とします。

ただし、利用にはいくつかの注意点があります。現時点では、この機能を使うには会話を開始する際に手動で選択する必要があります。また、有効化している間はウェブ検索やグラフ・画像の生成といった他の機能は利用できません。OpenAIは今後数ヶ月で機能拡張を予定しています。

Mistral、企業向けAI開発・運用基盤を発表

AI開発の本番運用を支援

試作から本番運用への移行を促進
EU拠点のインフラデータ主権を確保
専門家以外も使える開発ツール

統合プラットフォームの3本柱

システムの振る舞いを可視化する可観測性
RAGも支える実行ランタイム
AI資産を一元管理するAIレジストリ

豊富なモデルと柔軟な展開

オープンソースから商用まで多数のモデル
クラウドやオンプレミスなど柔軟な展開

2025年10月24日、フランスのAIスタートアップMistral AIは、企業がAIアプリケーションを大規模に開発・運用するための新プラットフォーム「Mistral AI Studio」を発表しました。多くのAI開発が試作段階で止まってしまう課題を解決し、信頼性の高い本番システムへの移行を支援することが目的です。Googleなど米国勢に対抗する欧州発の選択肢としても注目されます。

同社はAI Studioを、AI開発における「プロダクションファビリック(生産基盤)」と位置付けています。AIモデルのバージョン管理や性能低下の追跡、コンプライアンス確保など、多くのチームが直面するインフラ面の課題解決を目指します。これにより、アイデアの検証から信頼できるシステム運用までのギャップを埋めます。

プラットフォームは3つの柱で構成されます。AIシステムの振る舞いを可視化する「可観測性」、検索拡張生成(RAG)なども支える実行基盤「エージェントランタイム」、そしてAI資産を一元管理する「AIレジストリ」です。これらが連携し、開発から監視、統制まで一貫した運用ループを実現します。

AI Studioの強みは、オープンソースから高性能な商用モデル、さらには画像生成音声認識モデルまでを網羅した広範なモデルカタログです。これにより企業は、タスクの複雑さやコスト目標に応じて最適なモデルを試し、柔軟に構成を組むことが可能になります。選択肢の多さは開発の自由度を高めます。

Pythonコードを実行する「コードインタプリタ」やWeb検索など、多彩な統合ツールも特徴です。これにより、単なるテキスト生成にとどまらず、データ分析やリアルタイムの情報検索、さらには画像生成までを一つのワークフロー内で完結させる、より高度なAIエージェントの構築が可能になります。

導入形態も柔軟です。クラウド経由での利用に加え、自社インフラに展開するオンプレミスやセルフホストにも対応。企業のデータガバナンス要件に応じて最適な環境を選べます。また、不適切なコンテンツをフィルタリングするガードレール機能も備え、安全なAI運用を支援します。

Mistral AI Studioの登場は、企業におけるAI活用の成熟度が新たな段階に入ったことを示唆します。モデルの性能競争から、いかにAIを安全かつ安定的に事業へ組み込むかという運用フェーズへ。同プラットフォームは、その移行を力強く後押しする存在となるでしょう。

グーグル、AIでハロウィン演出術。最新モデル活用法公開

画像・動画生成の最新AI

Nano Bananaで幽霊風の画像作成
90年代ホラー映画風ポスターを生成
ペットのコスチューム画像を自動生成
Veo 3.1で高品質なショート動画作成

アイデア創出からツール開発まで

Google Photosで写真をハロウィン風に加工
Mixboardでコスチューム案を視覚化
Canvasでカボチャ彫刻用アプリ開発

Googleは2025年10月24日、ハロウィンシーズンに向けて、同社の最新AIツール群を活用した画像動画の作成術を公式ブログで公開しました。画像生成モデル「Nano Banana」や動画生成モデル「Veo」などを使い、パーティーの招待状からSNSコンテンツまで手軽に作成する具体的なプロンプトを紹介しており、企業の季節イベント向けマーケティングのヒントとなりそうです。

中核となるのは画像生成モデルNano Bananaです。ユーザーは自身の写真と特定のプロンプトを組み合わせるだけで、ビクトリア朝時代の幽霊風ポートレートや90年代ホラー映画風のポスターなど、ユニークな画像を生成できます。精緻なプロンプトの記述方法も公開されており、プロンプトエンジニアリングの実践的な好例と言えるでしょう。

動画生成では、最新モデルVeo 3.1」が活躍します。プロンプトへの追従性が向上し、より物語性の高い動画作成が可能になりました。静止画を不気味なアニメーションに変換したり、テキストから秋の風景を描写したグリーティング動画を生成したりと、SNSマーケティングでの高い応用可能性を秘めています。

既存サービスへのAI統合も進んでいます。Google Photos」にはワンタップで写真をハロウィン風に加工する新機能が追加されました。また、アイデア出しツール「Mixboard」はコスチュームのブレインストーミングに、開発ツール「Canvas」は画像からカボチャの彫刻用テンプレートアプリを作成するといった実用的な活用法も示されています。

今回の発表は、AIが専門家だけでなく一般ユーザーにも浸透し、創造性を手軽に引き出すツールとなっている現状を示しています。企業はこれらのAIツールを季節イベントのプロモーションや顧客エンゲージメント向上にどう活用できるか、具体的な検討を始める好機と言えるでしょう。

ChatGPT、社内情報横断検索で業務の文脈を理解

新機能「Company Knowledge」

法人向けプランで提供開始
社内ツールと連携し横断検索
GPT-5ベースで高精度な回答
回答には明確な出典を引用

具体的な活用シーン

顧客フィードバックの戦略化
最新情報でのレポート自動作成
プロジェクトのリリース計画立案

エンタープライズ級の安全性

既存のアクセス権限を尊重
データはモデル学習に利用不可

OpenAIは2025年10月23日、法人向けChatGPTに新機能「Company Knowledge」を導入しました。この機能は、SlackGoogle Driveといった社内の各種ツールと連携し、組織固有の情報を横断的に検索。利用者の業務文脈に合わせた、より正確で具体的な回答を生成します。社内に散在する情報を集約し、意思決定の迅速化業務効率の向上を支援することが目的です。

新機能の核となるのは、GPT-5を基盤とする高度な検索能力です。複数の情報源を同時に参照し、包括的で精度の高い回答を導き出します。生成された回答にはすべて明確な出典が引用されるため、ユーザーは情報の出所をたどり、内容の信頼性を容易に確認できます。これにより、安心して業務に活用できるのが大きな特徴です。

例えば、顧客との打ち合わせ前には、Slackの最新のやり取り、メールでの詳細、Google Docsの議事録などを基に、ChatGPT自動でブリーフィングを作成します。また、キャンペーン終了後には、関連するデータを各ツールから抽出し、成果レポートを生成することも可能です。このように、手作業による情報収集の手間を大幅に削減します。

Company Knowledgeは、単なる情報検索にとどまりません。社内で意見が分かれているような曖昧な問いに対しても、各ツールの議論を要約し、異なる視点を提示する能力を持ちます。例えば「来年の会社目標は?」と尋ねれば、議論の経緯や論点を整理してくれます。これにより、チームの次のアクションを促すことができます。

企業導入で最も重要視されるセキュリティも万全です。この機能は、各ユーザーが元々持つアクセス権限を厳格に尊重します。OpenAIが企業のデータをモデル学習に利用することはなく、SSOやIP許可リストなど、エンタープライズ水準のセキュリティ機能も完備。管理者はアクセス制御を柔軟に設定できます。

現在、この機能は手動で有効にする必要があり、Web検索画像生成とは併用できませんが、将来的にはこれらの機能統合が予定されています。また、AsanaやGitLabなど連携ツールも順次拡大しており、今後さらに多くの業務シーンでの活用が期待されます。

ChatGPT、成人向けエロティカ生成を12月解禁へ

OpenAIの方針大転換

12月よりエロティカ生成を解禁
認証済み成人ユーザーが対象
CEOは「成人の自由」を主張

新たなAIとの関係性

親密な対話が常態化する可能性
ユーザー定着率の向上が狙いか
人間関係を補完する新たな選択肢

浮上するリスクと課題

個人情報のプライバシー漏洩懸念
感情の商品化によるユーザー操作

OpenAIは2025年12月に実施するアップデートで、AIチャットボットChatGPT」の利用規約を改定し、年齢認証済みの成人ユーザーに限り「エロティカ」を含む成熟したテーマのコンテンツ生成を許可する方針です。同社のサム・アルトマンCEOがSNSで公表しました。この方針転換は、AIと人間のより親密な関係性を促し、ユーザーエンゲージメントを高める可能性がある一方、プライバシー倫理的な課題も提起しています。

アルトマンCEOはSNSへの投稿で、今回の変更は「成人の自由」を尊重する同社の大きな姿勢の一部だと説明。「我々は世界の倫理警察ではない」と述べ、これまでの方針を大きく転換する考えを示しました。かつて同社は、自社モデルを成人向けコンテンツに利用した開発者に対し、停止命令を送付したこともありました。

この動きは、ユーザーとAIの関係を根本的に変える可能性があります。専門家は、人々が自身の性的嗜好といった極めてプライベートな情報をAIと共有することが常態化すると指摘。これにより、ユーザーのプラットフォームへの滞在時間が伸び、エンゲージメントが向上する効果が期待されます。

一方で、この変化を肯定的に捉える声もあります。専門家は、人々が機械と性的な対話を試みるのは自然な欲求だとし、AIコンパニオンが人間関係を代替するのではなく、現実世界では満たせないニーズを補完する一つの選択肢になり得ると分析しています。

最大の懸念はプライバシーです。チャット履歴が万が一漏洩すれば、性的指向などの機微な個人情報が流出しかねません。また、ユーザーの性的欲求がAI企業の新たな収益源となる「感情の商品化」につながり、ユーザーが感情的に操作されるリスク専門家は指摘しています。

今後、テキストだけでなく画像音声の生成も許可されるのか、詳細はまだ不明です。もし画像生成が解禁されれば、悪意あるディープフェイクの拡散も懸念されます。OpenAIがどのような年齢認証や監視体制を導入するのか、その具体的な実装方法が今後の大きな焦点となるでしょう。

EA、Stability AIと提携しゲーム開発を革新

提携の目的と背景

ゲーム大手EAとStability AIが提携
ゲーム制作のワークフローを革新
AIを「信頼できる味方」と位置付け

共同開発の具体例

リアルな質感表現(PBR)を加速
指示で3D環境を自動プレビュー

クリエイターへの影響

反復作業を高速化し生産性向上
クリエイター創造的業務に注力
迅速なプロトタイプ制作が可能に

ゲーム開発大手Electronic Arts (EA)は2025年10月23日、画像生成AI「Stable Diffusion」で知られるStability AIとの戦略的提携を発表しました。両社は生成AIモデルやツールを共同開発し、ゲーム制作のワークフローを革新します。この提携は、開発プロセスの高速化と、アーティストやデザイナーの創造性を最大限に引き出すことを目的としています。

EAはこの提携を通じて、AIを「信頼できる味方」と位置付けています。反復的な作業をAIに任せることで、開発者がより創造的な業務に集中できる環境を整えます。ただし、同社は「ストーリーテリングの中心は人間であり続ける」と強調しており、AIはあくまでクリエイターを支援する存在であるとの姿勢を明確にしています。

共同開発の第一弾として、リアルな質感を表現する「フィジカリーベースドレンダリング(PBR)」マテリアルの作成を加速させるツールに着手します。また、簡単な指示(プロンプト)から3D環境全体を瞬時にプレビューするAIシステムの開発も進め、コンセプト制作の速度と精度を飛躍的に高める計画です。

ゲーム業界におけるAI活用はEAに限りません。例えば、人気ゲーム「PUBG」の開発元であるKraftonも「AI First」戦略を掲げ、AI分野への大規模投資を発表しています。大手企業によるAI導入の動きは今後も加速し、業界全体の競争環境を大きく変える可能性があります。

EAのアンドリュー・ウィルソンCEOは以前からAIを事業の「まさに核」と述べており、今回の提携はその方針を具現化するものです。投資家の間では、AIによるコスト削減が収益性を大幅に向上させるとの期待も高まっています。このパートナーシップは、ゲーム開発の未来を占う重要な一歩と言えるでしょう。

Snapchat、画像生成AIレンズを米国で無料開放

プロンプトで画像生成

自由な指示で画像を生成・編集
自撮り写真をエイリアンなどに加工
ハロウィーンの仮装案にも活用
友人やストーリーで共有可能

競合追撃とユーザー拡大

MetaOpenAIなど競合の台頭
有料プラン限定から全ユーザーへ提供
まずは米国でサービス開始
カナダ、英国、豪州へも展開予定

Snapは10月22日、同社の人気アプリSnapchatにおいて、初の自由入力プロンプト型AI画像生成機能「Imagine Lens」を米国で無料公開しました。これまでは有料プラン限定でしたが、全ユーザーが利用可能になります。MetaOpenAIなど競合が高度なAIツールを投入する中、若者ユーザーの維持・獲得を狙う戦略的な一手とみられます。

この新機能を使えば、ユーザーは自撮り写真に「私をエイリアンにして」といったプロンプトを入力するだけで、ユニークな画像に加工できます。また、「不機嫌な猫」のように、全く新しい画像を生成することも可能です。作成した画像は友人とのチャットやストーリーで共有でき、ハロウィーンの仮装を試すといった実用的な使い方も提案されています。

今回の無料開放の背景には、SNS市場におけるAI開発競争の激化があります。Metaの「Meta AI」やOpenAI動画生成AI「Sora」など、競合他社がより高度なAI機能を次々と発表。若年層ユーザーの関心を引きつけるため、Snapも主力機能の一つであるAIレンズを無料化し、競争力を維持する投資に踏み切った形です。

これまで「Imagine Lens」は、有料プラン「Lens+」および「Snapchat Platinum」の加入者のみが利用できる限定機能でした。今回の拡大により、無料ユーザーも一定回数画像生成が可能になります。サービスはまず米国で開始され、今後カナダ、英国オーストラリアなど他の主要市場へも順次展開される計画です。

Google、誰でも数分でAIアプリ開発

「感覚」でアプリ開発

専門知識が不要なUI
プロンプトから自動生成
多様なAIモデルを統合
リアルタイムでの編集

創造性を刺激する機能

アイデアを自動で提案
65秒でプロトタイプ完成
GitHub連携やデプロイ
無料で試せる手軽さ

Googleは2025年10月21日、同社のAI開発プラットフォーム「Google AI Studio」に、プログラミング初心者でも数分でAIアプリケーションを開発・公開できる新機能「vibe coding」を追加したと発表しました。このアップデートにより、アイデアを持つ誰もが、専門知識なしで自身のアプリを具現化し、市場投入までの時間を劇的に短縮することが可能になります。

新機能の核心は、刷新された「Build」タブにあります。利用者はGemini 2.5 Proをはじめ、動画理解AIの「Veo」や画像生成AI「Imagine」など、Googleの多様なAIモデルを自由に組み合わせられます。「作りたいアプリ」を文章で説明するだけで、システムが必要なコンポーネントを自動で組み立て、アプリの雛形を生成します。

生成されたアプリは、インタラクティブなエディタですぐに編集できます。画面左側ではAIとの対話を通じてコードの修正や提案を受けられ、右側のエディタではソースコードを直接編集可能です。このハイブリッドな開発環境は、初心者から熟練の開発者まで、あらゆるスキルレベルのユーザーに対応します。

アイデアが浮かばないユーザーを支援する「I'm Feeling Lucky」ボタンもユニークな機能です。ボタンを押すたびに、AIがランダムなアプリのコンセプトと必要な設定を提案。これにより、偶発的な着想から新たなサービスが生まれる可能性を秘めています。

その実力は確かです。海外メディアVentureBeatの記者が「サイコロを振るアプリ」と指示したところ、わずか65秒でアニメーション付きの多機能なウェブアプリが完成しました。完成したアプリはGitHubへの保存や、Googleインフラを使ったデプロイも数クリックで完了します。

この新機能は無料で利用を開始でき、高度な機能を利用する場合のみ有料APIキーが必要となります。Googleは、AI開発のハードルを劇的に下げることで、開発者コミュニティの裾野を広げ、AIエコシステムのさらなる活性化を狙っていると考えられます。今回の発表は、今後予定されている一連のアップデートの第一弾とされています。

AIで偽の休暇写真、燃え尽き世代の新需要

新アプリの概要

AIで偽の休暇写真を自動生成
開発者Meta社プロダクトデザイナー
GoogleGeminiモデルを活用

ターゲットと収益モデル

多忙な燃え尽き症候群の層
最初の6枚は無料で試用可能
追加画像生成従量課金制
レトロな雰囲気の写真が特徴

Meta社のプロダクトデザイナーが、AIで偽の休暇写真を生成するiPhoneアプリ「Endless Summer」を公開しました。燃え尽き症候群に悩む多忙なビジネスパーソンを主なターゲットとし、実際に旅行せずとも世界中を旅しているかのような写真を手軽に作成できる点が特徴です。

このアプリは、Google画像生成モデル「Gemini Nano-Banana」を活用しています。ユーザーは自身の顔写真を基に、ボタンをタップするだけで、ビーチやヨーロッパの街並みなど、様々なシチュエーションの休暇写真をAIが自動で生成するシンプルな操作性を実現しています。

ビジネスモデルは、最初の6枚の画像生成を無料とし、それ以降は有料となる従量課金制を採用。30枚で3.99ドルといった価格設定で、手軽にAI体験を試せるように設計されています。毎朝自動で写真が届くオプション機能も提供しています。

開発の背景には、テック業界の過酷な労働文化「ハッスルカルチャー」があります。実際に休暇を取れない人々が、SNS上で「充実した生活」を演出したいというニーズを捉えたものと言えるでしょう。この現象は、AIが現実の代替体験を提供する新たな潮流を示唆しています。

生成される写真は、意図的にヴィンテージフィルムのような質感に仕上げられています。これは、完璧すぎない、より自然なライフスタイル感を演出する最近のトレンドを反映したものです。AI技術が、かつてのアナログな懐かしさを再現している点は非常に興味深いと言えます。

AI偽ヌード生成アプリ、被害者が運営停止求め提訴

提訴されたアプリの概要

写真から偽ヌード画像を生成
わずか3クリックの簡単操作
児童性的虐待コンテンツも作成

拡散を助長する仕組み

Telegramボットで自動宣伝・拡散
API提供で技術の悪用を拡大
多数の模倣アプリ・サイトが出現

驚異的な被害の規模

1日平均20万枚画像を生成
累計訪問者数は2700万人

AIで衣服を透視したかのような偽ヌード画像を生成するアプリ「ClothOff」が、17歳の被害者少女に提訴されました。訴状は、同アプリが児童性的虐待コンテンツ(CSAM)などを容易に生成・拡散できると指摘。原告は「絶え間ない恐怖」を訴え、アプリの運営停止などを求めています。

訴状によれば、ClothOffはInstagramなどの写真からわずか3クリックで、本物と見分けがつきにくい偽ヌード画像を生成できるとされます。これは非合意の性的画像だけでなく、未成年者を対象とした児童性的虐待コンテンツの生成にもつながる悪質な仕組みだと原告側は非難しています。

問題はアプリ単体にとどまりません。ClothOffは、自社の画像生成技術を外部サービスが組み込めるAPIを提供。これにより模倣サービスが乱立し、被害が拡大しています。さらにSNS「Telegram」上のボットがアプリを宣伝し、数十万人の登録者を集めるなど、拡散に拍車をかけていると指摘されています。

被害の規模は甚大です。訴状によると、ClothOffと関連サービスは1日平均で20万枚もの画像を生成し、累計訪問者数は2700万人を超えます。プレミアム機能として課金メニューも用意されており、運営側が偽ヌード画像の生成から直接利益を得ているビジネスモデルも問題視されています。

今回の訴訟は、生成AI技術の悪用がもたらす深刻な人権侵害と、それを助長するプラットフォームの責任を問うものです。技術者は自らの技術が社会に与える影響を、経営者はサービスが悪用されるリスクを直視する必要があるでしょう。AI時代の新たな法的・倫理的課題を突きつける事例です。

多機能とSNS連携で覇権、ByteDanceのAI『Doubao』

中国で最も人気なAIアプリ

月間利用者1.57億人中国首位
世界でも4番目に人気の生成AI
親しみやすいアバターとUI/UX

成功を支える『全部入り』戦略

チャットから動画生成まで多機能
AIに不慣れな層も取り込む設計
TikTok(Douyin)とのシームレスな連携

バイラル設計とエコシステム

SNSでの共有を促すバイラル設計
競合からユーザーの4割が流入
自動車など他デバイスへの展開

TikTokを運営する中国ByteDance社が開発したAIアシスタント「Doubao(豆包)」が、中国市場を席巻しています。2025年8月には月間アクティブユーザー数が1億5700万人に達し、競合のDeepSeekを抜いて国内首位となりました。その成功の裏には、チャットから画像動画生成までを網羅する多機能性と、ショート動画アプリ「Douyin(抖音)」と連携した巧みなバイラル戦略があります。

Doubaoの躍進は、データにも裏付けられています。中国のデータインテリジェンス企業QuestMobileによると、月間アクティブユーザー数は1億5700万人。競合のDeepSeekは1億4300万人で2位に後退しました。また、ベンチャーキャピタルa16zの調査では、ChatGPTGeminiに次ぐ世界で4番目に人気の生成AIアプリにランクインしています。

Doubaoの最大の特徴は「全部入り」とも言える包括的な機能です。テキスト対話だけでなく、画像生成、短い動画作成、データ分析、AIエージェントのカスタマイズまで、一つのアプリで完結します。これはまるで、ChatGPT、Midjourney、Sora、Character.aiといった複数の最先端ツールを一つに集約したような体験をユーザーに提供するものです。

なぜ、この「全部入り」戦略が受け入れられたのでしょうか。それは、DoubaoがAIに詳しくない一般ユーザーを明確にターゲットにしているからです。親しみやすいアバターやカラフルなUIに加え、テキスト入力より音声動画での対話を好む層を取り込み、AI利用のハードルを劇的に下げることに成功しました。

成功のもう一つの柱が、ByteDanceの得意とするSNS連携とバイラル設計です。ユーザーはDoubaoで生成したコンテンツを、Douyin(中国TikTok)ですぐに共有できます。逆にDouyinの動画要約をDoubaoにさせることも可能です。この利便性と楽しさが爆発的な拡散を生み、ユーザーエンゲージメントを高めています。

競合のDeepSeekがモデルの性能や論理的タスクに注力する一方、Doubaoは消費者向けアプリとしての完成度で差をつけました。QuestMobileのデータでは、DeepSeekを離れたユーザーの約4割がDoubaoに移行したとされています。これは、ByteDanceが長年培ってきた「アプリ工場」としての開発力が発揮された結果と言えるでしょう。

ByteDanceはスマートフォンの枠を超え、Doubaoをエコシステムの中核に据えようとしています。すでにスマートグラスや自動車メーカーとの提携を進めており、車載アシスタントやAIコンパニオンとしての搭載が始まっています。Doubaoは、私たちの生活のあらゆる場面に浸透するプラットフォームを目指しているのです。

日本政府、OpenAIに著作権侵害停止を公式要請

政府が公式に「待った」

OpenAIへの正式な申し入れ
動画生成AI「Sora」が対象
漫画・アニメの無断利用を懸念

保護されるべき日本の文化

「かけがえのない宝」と表現
知的財産戦略担当大臣が言及
クールジャパン戦略にも影響

OpenAIが抱える課題

著作権問題への対応に苦慮
CEOは日本の創造性を評価

日本政府が、米OpenAI社に対し、動画生成AI「Sora」の学習データに日本の漫画やアニメを無断で使用しないよう正式に要請しました。知的財産戦略を担当する木内稔大臣が明らかにしたもので、日本の文化資産である著作物の保護を強く求める姿勢を示しています。生成AIの急速な進化に伴い、著作権侵害のリスクが改めて浮き彫りになった形です。

木内大臣は、漫画やアニメを「日本の誇るかけがえのない宝」と表現し、その創造性が不当に利用されることへの強い懸念を表明しました。この要請は内閣府から正式に行われたもので、「クールジャパン戦略」を推進する政府としても、クリエイターの権利保護は看過できない重要課題であるとの認識が背景にあります。

OpenAIは、Soraのリリース以降、著作権を巡る問題に直面しています。ユーザーによってマリオやピカチュウといった著名キャラクターが無断で生成される事例が相次ぎ、対応に苦慮しているのが現状です。今回の日本政府からの公式な申し入れは、同社が世界中で直面する著作権問題の新たな一石となる可能性があります。

一方で、OpenAIサム・アルトマンCEOは、かねてより「日本の卓越した創造性」への敬意を公言しています。同社の画像生成AIでも過去にスタジオジブリ風の画像が大量に生成されるなど、日本コンテンツがAIモデルに大きな影響を与えていることは明らかです。今回の要請を受け、同社が学習データの透明性確保や著作権者への配慮にどう踏み込むかが焦点となります。

AIが細胞変化を画像で予測、創薬の実験を代替

AI創薬の新モデル登場

新AIモデルMorphDiff
遺伝子情報から細胞画像を生成
実験前に薬の効果を可視化

コストと時間を大幅削減

高価な画像化実験を代替
作用機序の特定を高速化
画像に迫る予測精度を達成

ビジネスへの応用

新薬候補の優先順位付け
既存薬の再利用(リパーパシング)

アラブ首長国連邦のAI専門大学院大学MBZUAIの研究者らが、創薬プロセスを革新する可能性を秘めた新しいAIモデル「MorphDiff」を開発しました。このモデルは、薬物投与などによって変化する遺伝子の活動パターンをもとに、細胞がどのように変化するかを画像で高精度に予測します。これにより、時間とコストのかかる実験の一部をコンピュータ上のシミュレーションで代替することを目指します。

MorphDiffの核心は、画像生成AIで広く使われる「拡散モデル」技術の応用です。薬などの刺激によってどの遺伝子が活性化・不活性化したかという情報(トランスクリプトーム)を入力するだけで、摂動後の細胞のリアルな顕微鏡画像を生成できます。これにより、実験室で実際に細胞を培養し観察する前に、その結果をプレビューすることが可能になります。

この技術がもたらす最大の利点は、創薬研究における試行錯誤を大幅に削減できる点です。従来、何百万もの候補化合物の効果を一つ一つ画像化して評価するのは不可能でした。しかしMorphDiffを使えば、コンピュータ上で多数の化合物の効果をシミュレートし、有望な候補を効率的に絞り込めます。

生成される画像は単なる想像図ではありません。細胞の質感や内部構造といった数百もの生物学的特徴を正確に捉えており、その統計的分布は実際の実験データと区別がつかないレベルに達しています。この高い忠実性により、薬がどのように作用するかのメカニズム(MOA)を正確に推定するのに役立ちます。

具体的な応用例として、新薬候補のスクリーニングが挙げられます。未知の化合物が生み出す細胞変化の画像を予測し、既知の薬の作用パターンと比較することで、その化合物の潜在的な効果や副作用を迅速に評価できます。これは開発パイプライン全体の効率化に直結するでしょう。

現状では推論速度などの課題も残されていますが、今後の研究開発により、コンピュータ内での実験が現実の実験を強力に補完する未来が近づいています。この技術は、創薬研究のあり方を変え、より早く、より安価に新薬を届けるための重要な一歩となる可能性があります。

NVIDIA、卓上AIスパコン発表 初号機はマスク氏へ

驚異の小型AIスパコン

1ペタフロップスの演算性能
128GBのユニファイドメモリ
Grace Blackwellチップ搭載
価格は4,000ドルから提供

AI開発を個人の手に

最大2000億パラメータのモデル実行
クラウド不要で高速開発
開発者や研究者が対象
初号機はイーロン・マスク氏へ

半導体大手NVIDIAは2025年10月14日、デスクトップに置けるAIスーパーコンピュータ「DGX Spark」を発表しました。ジェンスン・フアンCEO自ら、テキサス州にあるSpaceXの宇宙船開発拠点「スターベース」を訪れ、初号機をイーロン・マスクCEOに手渡しました。AI開発の常識を覆すこの新製品は、15日から4,000ドルで受注が開始されます。

DGX Sparkの最大の特徴は、その小型な筐体に詰め込まれた圧倒的な性能です。1秒間に1000兆回の計算が可能な1ペタフロップスの演算能力と、128GBの大容量ユニファイドメモリを搭載。これにより、従来は大規模なデータセンターでしか扱えなかった最大2000億パラメータのAIモデルを、個人のデスク上で直接実行できます。

NVIDIAの狙いは、AI開発者が直面する課題の解決にあります。多くの開発者は、高性能なPCでもメモリ不足に陥り、高価なクラウドサービスデータセンターに頼らざるを得ませんでした。DGX Sparkは、この「ローカル環境の限界」を取り払い、手元で迅速に試行錯誤できる環境を提供することで、新たなAIワークステーション市場の創出を目指します。

この卓上スパコンは、多様なAI開発を加速させます。例えば、高品質な画像生成モデルのカスタマイズや、画像の内容を理解し要約する視覚言語エージェントの構築、さらには独自のチャットボット開発などが、すべてローカル環境で完結します。アイデアを即座に形にできるため、イノベーションのスピードが格段に向上するでしょう。

DGX Sparkは10月15日からNVIDIAの公式サイトやパートナー企業を通じて全世界で注文可能となります。初号機がマスク氏に渡されたのを皮切りに、今後は大学の研究室やクリエイティブスタジオなど、世界中のイノベーターの元へ届けられる予定です。AI開発の民主化が、ここから始まろうとしています。

Googleフォト、AIとの対話で写真編集を刷新

AIとの対話で簡単編集

米国Androidユーザー向けに提供
テキストや音声で編集を指示
「Help me edit」から起動
複雑な編集も一括で実行可能

多彩な編集プロンプト例

不要な反射や映り込みを除去
ペットに衣装を合成
古い写真を鮮明に復元
背景を拡張し構図を改善

Googleが、写真編集アプリ「Googleフォト」に、AIとの対話を通じて画像を編集できる新機能を導入しました。2025年10月14日、まずは米国Androidユーザーを対象に提供を開始。ユーザーは「Help me edit」機能から、テキスト入力や音声で「窓の反射を消して」などと指示するだけで、AIが自動で高度な編集を実行します。専門的なスキルがなくとも、誰もが直感的に写真を加工できる時代の到来です。

この新機能の利用方法は極めてシンプルです。Googleフォトで編集したい写真を開き、「Help me edit」ボタンをタップ。後は、実現したいことを自然な言葉で話したり、入力したりするだけでAIが意図を汲み取り、編集作業を代行します。これにより、これまで複数のツールや複雑な操作を要した作業が、ワンステップで完了するようになります。

具体的な活用例は多岐にわたります。例えば、商品写真の窓ガラスに映り込んだ不要な反射の除去や、背景の整理といった実用的な修正が瞬時に可能です。さらに、古い記録写真を鮮明に復元したり、複数の修正指示を一度にまとめて実行したりすることもできます。これにより、マーケティング資料や報告書の質を、手間をかけずに向上させることが期待できるでしょう。

加えて、この機能は創造性の発揮も支援します。ペットの写真にハロウィンの衣装を合成したり、殺風景な丘をヒマワリ畑に変えたりといった、遊び心のある編集も可能です。「犬が月面でスキーをしている写真」のような非現実的な画像生成も、簡単な指示で実現できます。ビジネスにおけるクリエイティブ制作の新たな可能性が広がります。

今回のアップデートは、AIが専門家のスキルを民主化する象徴的な事例と言えるでしょう。画像編集の専門知識がないビジネスパーソンでも、高品質なビジュアルコンテンツを迅速に作成できるようになります。生産性の向上はもちろん、新たなアイデア創出のツールとして、経営者エンジニアにとっても注目すべき機能ではないでしょうか。

マイクロソフト、自社開発画像生成AIを発表

MAI-Image-1の主な特徴

初の自社開発画像生成AI
フォトリアル画像に強み
高速画像生成を実現
LMArenaでトップ10入り

開発の背景と戦略

OpenAI依存からの脱却模索
クリエイターフィードバックを反映
安全性の確保にコミット
自社AIモデルへの投資を拡大

マイクロソフトAIが13日、初の自社開発によるテキストto画像生成モデル「MAI-Image-1」を発表しました。これは同社のAI戦略における重要な一歩であり、OpenAIへの依存低減にもつながる可能性があります。

MAI-Image-1は、クリエイティブプロフェッショナルの意見を取り入れ、画一的でない出力を目指しました。稲妻や風景などのフォトリアリスティック画像生成に優れ、処理速度も大型モデルより高速です。

このモデルは、AIモデルの性能を人間が評価するベンチマークサイト「LMArena」ですでにトップ10に入る実績を上げており、その技術力の高さが示されています。

今回の発表は、マイクロソフトOpenAIとの関係が複雑化する中、自社開発のAI能力を強化する戦略の一環です。音声生成AI「MAI-Voice-1」など、自社モデルのラインナップ拡充を進めています。

同社は安全で責任ある結果の確保にコミットしていると強調します。しかし、実際の安全性ガードレールについてはまだ評価されておらず、今後の検証が待たれるでしょう。

Google、欧州など大学生にGeminiを1年間無償提供

無償提供の概要

対象は欧州・中東・アフリカの大学生
1年間無料のAI Proプラン
12月9日までの申込が必要
18歳以上の学生が対象

利用可能な主要機能

最先端モデルGemini 2.5 Pro
調査レポート作成Deep Research
思考整理を支援NotebookLM
テキストから動画生成Veo 3

Googleは2025年10月13日、欧州・中東・アフリカ(EMEA)域内の大学生向けに、自社の最先端AIツール群「Google AI Proプラン」を1年間無償提供すると発表しました。18歳以上の学生が対象で、同年12月9日までの申込みが必要です。この取り組みは、次世代のAI人材育成と将来の労働力準備を目的としています。

無償提供されるのは、Gemini 2.5 Proへの拡張アクセスや、大規模な調査レポートを自動生成する「Deep Research」など、高度なAI機能を含むプランです。学生はこれらのツールを活用し、学業や創造的活動における生産性を大きく向上させることが可能になります。

さらに、音声動画の概要作成機能が強化された思考支援ツール「NotebookLM」や、テキスト・画像から高品質な動画を生成する「Veo 3」も利用可能です。これにより、学生は研究からプレゼンテーション準備まで、多岐にわたるタスクをAIサポートで進められます。

Googleは単なる答えの提供ではなく、理解を深め批判的思考を育むことを重視しています。そのため、質問やステップバイステップの支援で学習を導く「Guided Learning」モードも導入。複雑な数学の問題解決や論文構築などをサポートします。

学生は、最新の画像生成・編集モデル「Nano Banana」を使い、寮のデザインやクラブのロゴなど、アイデアを視覚的に具体化することもできます。創造性を刺激し、プロジェクトの初期段階を迅速に進めるツールとして活用が期待されます。

この施策は、教育者向けの「Gemini for Education」の拡充とも連動しています。Googleは世界中の大学と協力し、AIリテラシーの向上と個別化された学習支援の実現を目指していて、未来の担い手への投資を強化しています。

OpenAI、アジア16カ国で低価格プラン展開

ChatGPT Goの概要

月額5ドル以下の低価格プラン
メッセージ等の上限引き上げ
無料版の2倍のメモリ容量

アジア市場での急成長

東南アジアでユーザー4倍増
インドでは有料会員が倍増
一部で現地通貨決済に対応

激化するAI競争

Google同様プランを拡大
ユーザー8億人、OS化目指す

OpenAIは2025年10月9日、月額5ドル以下の低価格プラン「ChatGPT Go」をアジアの新たに16カ国で提供開始しました。この動きは、東南アジアで週次アクティブユーザーが最大4倍に急増するなど、同地域での需要の高まりを受けたものです。Googleとの市場獲得競争が激化する中、OpenAIは成長市場での収益化とユーザー基盤の拡大を加速させます。

ChatGPT Go」は、無料版と比べて多くの利点を提供します。メッセージの送受信、画像生成、ファイルや画像のアップロードにおける1日あたりの上限が引き上げられます。さらに、メモリ容量は無料版の2倍となり、ユーザーの意図をより深く理解した、パーソナライズされた応答が可能になる点が特徴です。

今回の拡大対象は、マレーシア、タイ、フィリピン、ベトナムなど16カ国です。これらの国の一部では利便性を高めるため、現地通貨での支払いに対応します。先行して8月にインド、9月にインドネシアで導入されており、特にインドでは導入後に有料会員数が倍増するなど、大きな成功を収めています。

この動きの背景には、ライバルであるGoogleとの熾烈な競争があります。Googleも同様の価格帯の「Google AI Plus」プランを9月にインドネシアで開始し、その後40カ国以上に急拡大しています。両社は、成長著しいアジア市場で手頃な価格のAIサービスを提供し、シェア獲得を競っているのです。

OpenAIは先日開催した開発者会議で、ChatGPTの週次アクティブユーザーが全世界で8億人に達したと発表しました。さらに、ChatGPT内でSpotifyなどの外部アプリを直接利用できる機能を導入。単なるチャットボットから、アプリストアのような「OS」へと進化させる壮大な構想を明らかにしています。

2025年上半期に78億ドルの営業損失を計上するなど、AIインフラへの巨額投資が続くOpenAIにとって、収益化は大きな課題です。今回の低価格プランのアジア展開は、グローバルなユーザー基盤を拡大しつつ、持続的な成長に向けた収益源を確保するための重要な戦略的一手と言えるでしょう。

Figma、Google Gemini搭載でデザイン高速化へ

Gemini搭載の狙い

進化するデザイナーのニーズ対応
画像編集・生成機能の強化
ワークフローの大幅な高速化
画像生成遅延を50%削減

加速するAI業界の覇権争い

大手アプリへのAIモデル統合が加速
消費者への普及で優位性を確保
FigmaはOpenAIとも提携済み
非独占的なパートナーシップ戦略

デザインプラットフォーム大手のFigmaは10月9日、Googleとの提携を発表しました。Googleの最新AIモデル群「Gemini」を自社ツールに統合し、AIによる画像編集や生成機能を大幅に強化します。この提携は、製品デザイナーやチームの進化するニーズに応え、クリエイティブワークフローを劇的に高速化することが狙いです。

具体的には、高速な「Gemini 2.5 Flash」や高性能な「Gemini 2.0」、画像生成モデル「Imagen 4」がFigmaに導入されます。特にGemini 2.5 Flashは画像生成機能に組み込まれ、社内テストでは画像生成時の遅延を50%削減する成果を上げています。ユーザーはプロンプト入力だけで、画像の生成や変更を迅速に行えるようになります。

この提携は、AI業界の覇権争いを象徴する動きと言えるでしょう。OpenAIGoogleなどのAI開発企業は、巨大なユーザー基盤を持つ既存アプリケーションに自社モデルを統合することで、消費者への普及を一気に進めようと競っています。有力プラットフォームとの連携が、市場での優位性を確立する鍵となっているのです。

興味深いのは、今回の提携非独占的である点です。FigmaはすでにOpenAIとも提携しており、ChatGPT内でFigmaの機能を利用できます。これは、特定のAI技術に依存するのではなく、デザイナーにとって最適なツールを柔軟に提供するというFigmaのプラットフォーム戦略を明確に示しています。

一方、Googleにとってもこの提携は重要です。同社は法人向けAIプラットフォーム「Gemini Enterprise」を発表したばかり。Figmaとの連携は、企業の既存ワークフローにAIをシームレスに組み込むというGoogleの戦略を具体化するショーケースとなります。

多くの企業で生成AIの試験導入が難航する中、GoogleはFigmaのような成功事例を通じて、AIが生産性向上に直結する投資であることを証明したい考えです。今回の提携は、専門ツールへのAI統合が今後さらに加速することを示唆しています。

Google AI、コア製品を劇的進化 9月のChrome/Search/Gemini刷新まとめ

コア製品のAI統合

ChromeGeminiブラウジングアシスタント搭載
Searchにリアルタイム視覚検索(Search Live)導入
複雑な多段階質問に対応するAIモードの拡充
Android Gboardにトーン修正・文法校正AI

Geminiと次世代技術

カスタムAI「Gems」の共有機能でコラボを促進
Nano Bananaによる高度な画像生成・編集機能

Googleは2025年9月、AI技術を中核製品全体に深く統合し、利用者体験の劇的な向上を発表しました。これはChrome、Search、Geminiアプリといった主要サービスに留まらず、教育分野や次世代ロボティクスまで多岐にわたります。特に、生産性向上に直結する機能が多数リリースされており、AIを使いこなしたい経営者エンジニア層にとって見逃せないアップデートです。

ウェブブラウザと検索機能は、AIアシスタント化を加速させています。ChromeではGeminiがブラウジングアシスタントとして機能し、開いているタブ全体を横断して質問に回答可能です。また、SearchのAIモードは、複雑な多段階質問に対応するだけでなく、日本語を含む多言語対応を拡大し、グローバルでの利用を促進しています。

特に画期的なのは、Search Liveの導入です。これは、リアルタイムの音声会話にスマートフォンのカメラフィードを共有する機能を組み合わせ、現実世界の課題解決をリアルタイムで支援します。また、AndroidのGboardにはAIライティングツールが追加され、トーンの修正やスペル・文法の校正が端末内で自動で行えるようになり、モバイル生産性が向上しました。

GeminiアプリはAI活用ハブとしての地位を固めています。特に、特定の目的に合わせてカスタマイズしたAIモデル「Gems」の共有機能が追加され、チーム内での共同作業や情報共有が容易になりました。さらに、DeepMind開発の画像生成・編集モデル「Nano Banana」の活用が広がり、クリエイティブな作業の可能性を広げています。

学習領域では、AIが個々のユーザーに最適化された学習を実現します。NotebookLMは、利用者のメモに基づきフラッシュカードやクイズを自動生成し、パーソナライズされた学習ガイドを提供します。スンダー・ピチャイCEOはAI教育への10億ドルのコミットメントを強調し、「Gemini for Education」を全米の高校に提供すると発表しました。

長期的な視点では、Google DeepMindが「物理エージェント」の時代を宣言し、ロボティクスモデルを強化しました。Gemini Robotics 1.5/ER 1.5は、ロボットが環境を認識し、推論し、複雑なマルチステップタスクを処理する能力を飛躍的に高めます。また、Gemini 2.5が国際プログラミングコンテストで金メダル級の成績を収め、その推論能力を証明しています。

Google、AIプレミアム機能の提供国を世界77カ国へ拡大

サービス拡大の概要

提供国が世界77カ国に拡大
新規加入者向けに6カ月間50%割引
最新AIモデルによる生産性向上を支援

主なプレミアム機能

画像動画生成機能の利用制限緩和
Gmail/DocsへのGemini統合
ノート作成AI「NotebookLM」へのアクセス拡大
Google Oneの200GBストレージ付属

Googleは7日、AIサブスクリプションサービス「Google AI Plus」の提供国を大幅に拡大すると発表しました。新たに36カ国を追加し、合計77カ国で利用可能となります。これは、最新のAIモデルと機能を活用し、ユーザーの生産性を高めるための戦略的な一歩です。

Google AI Plusの最大の利点は、GeminiがGmailやDocsといった主要アプリに組み込まれる点です。これにより、メール作成やドキュメント要約などの日常業務をAIで自動化し、ビジネスパーソンの業務効率を飛躍的に向上させます。

さらに、画像生成・編集モデルである「Nano Banana」や、動画生成機能の利用制限が緩和されました。また、高度なノート作成AIである「NotebookLM」へのアクセスも拡大しており、研究や分析を行うユーザーにとって強力なツールとなります。

本プランは、高度なAIモデルをより低価格で利用できるように設計されています。サービス拡大を記念し、新規加入者に対しては最初の6カ月間が50%割引になる期間限定の優待も提供されます。

UCLAが光でAI画像を超高速生成、低消費電力とプライバシーを両立

光学AIの3大革新性

生成速度は光速レベルを達成
電子計算より低消費電力で稼働
デジタル情報を保護するプライバシー機能を搭載

技術構造と動作原理

デジタルとアナログのハイブリッド構造
光の位相パターンを利用したアナログ領域での計算
「知識蒸留」プロセスによる学習効率化
画像生成単一の光パスで実行(スナップショットモデル)

米カリフォルニア大学ロサンゼルス校(UCLA)の研究チームは、生成AIのエネルギー問題を解決する画期的な技術として、「光学生成モデル」を発表しました。電子ではなく光子を用いることで、AI画像生成光速レベルで実現し、従来の拡散モデルが抱える高い消費電力とCO2排出量の削減を目指します。この技術は、処理速度の向上に加え、強固なプライバシー保護機能も提供します。

学生成モデルは、デジタルプロセッサとアナログの回折プロセッサを組み合わせたハイブリッド構造です。まず、デジタル領域で教師モデルから学習したシード(光の位相パターン)を作成します。このシードにレーザー光を当て、回折プロセッサが一瞬でデコードすることで、最終的な画像を生成します。生成計算自体は、光を使ったアナログ領域で実行されるのが特徴です。

UCLAのAydogan Ozcan教授によると、このシステムは「単一のスナップショット」でエンドツーエンドの処理を完了します。従来の生成AIが数千ステップの反復を必要とするのに対し、光の物理を利用することで、処理時間が大幅に短縮され、電力効率が劇的に向上します。画質を向上させる反復モデルも開発されており、高い品質を実現しています。

本モデルの大きな利点の一つは、データのプライバシー保護能力です。デジタルエンコーダーから生成される位相情報は、人間には理解できない形式であるため、途中で傍受されても専用のデコーダーなしには解読できません。これにより、生成された情報を特定ユーザーのみが復号できる形で暗号化する仕組みを構築できます。

研究チームは、この技術をデジタルコンピュータエコシステム内の代替品ではなく、「視覚コンピューター」として位置づけています。特に、デバイスが直接人間の目に画像を投影するAR(拡張現実)やVR(仮想現実)システムにおいて、処理システムとして活用することで、クラウドからの情報伝達と最終的な画像生成を光速かつ高効率で実現できると期待されています。

Google Gemini、UI刷新で視覚体験を強化へ

新UIの狙いと特徴

チャット形式からフィード形式
視覚的なプロンプト利用を促進
ユーザーエンゲージメントの向上
競合OpenAIとの差別化戦略

背景と今後の展望

OpenAISora」の成功が影響か
画像モデル「Nano Banana」の人気活用
Androidアプリのコードから発見
公式発表はまだ未定

Googleが、同社のAIアプリ「Gemini」で、UI(ユーザーインターフェース)の大幅な刷新をテストしている可能性が浮上しました。これはチャット形式から、目を引く画像付きのプロンプト案が並ぶスクロール型フィードへの移行を目指すものです。背景には、競合であるOpenAI動画編集アプリ「Sora」の成功があるとみられています。

新しいUIはAndroidアプリのコード解析から発見されたもので、まだ一般公開されていません。画面上部に「画像生成」といったショートカットを配置し、その下には創造性を刺激する具体的なプロンプト画像付きでフィード形式で表示されます。

この刷新の狙いは、ユーザーにAIの機能を自ら探させるのではなく、アプリ側から魅力的な活用法を提案することにあります。「写真を宇宙にテレポートさせる」といった楽しい提案で、ユーザーの利用を促し、エンゲージメントを高めることを目指しているのです。

競合の動向も、この変更を後押ししていると考えられます。App Storeで首位を獲得したOpenAIの「Sora」や、シンプルなUIを持つ「ChatGPT」に対し、Gemini視覚的な魅力と使いやすさで差別化を図る戦略でしょう。ユーザー体験の競争は新たな段階に入っています。

Googleは自社の強みも活かします。9月にGeminiApp Storeのトップに押し上げたAI画像モデルNano Bananaの人気を、この新UIでさらに活用する狙いです。視覚的な機能とUIを連動させ、相乗効果を狙うと考えられます。

Googleの広報担当者は「現時点で発表することはない」とコメントしており、このUIが実際に導入されるかは未定です。しかし、この動きはAIアプリの競争が、機能だけでなくユーザーを惹きつける体験のデザインへと移行していることを明確に示しています。

Google新画像AI、編集・生成の常識を覆す

驚異の編集・生成能力

文脈を理解し一貫性を維持
本人そっくりの人物画像を生成
自然言語によるピクセル単位の修正
AIが曖昧な指示も的確に解釈

新たな創造性の探求

スケッチからリアルな画像を生成
古い写真の修復・カラー化も可能
最大3枚の画像を融合し新画像を創造
開発者向けツールとのシームレスな連携

Googleは2025年8月下旬、Geminiアプリに搭載された新しい画像生成・編集AIモデル「Nano Banana」を発表しました。このモデルはテキストと画像を同時に処理するネイティブなマルチモーダル能力を持ち、リリースからわずかな期間で50億以上の作品を生み出すなど世界中で注目を集めています。専門的なツールを不要にするその革新的な機能は、ビジネスにおける創造性の常識を大きく変える可能性を秘めています。

Nano Bananaの最大の強みは、シーンやキャラクターの一貫性を維持する能力です。一度生成した人物の服装やポーズ、背景だけを変更するなど、連続した編集が可能です。これにより、従来のAIが生成しがちだった「本人とは少し違う」違和感を解消し、広告素材のバリエーション作成や製品プロモーションなど、より実用的な応用が期待されます。

さらに、自然言語による「ピクセル単位の編集」も注目すべき機能です。「ソファの色を赤に変えて」といった簡単な指示で、画像内の特定要素だけを他の部分に影響を与えることなく修正できます。これにより、インテリアデザインシミュレーションや、WebサイトのUIモックアップ修正といったタスクを、専門家でなくとも直感的に行えるようになります。

このモデルは、曖昧な指示から文脈を読み取って画像を生成したり、古い写真を歴史的背景を理解した上で修復・カラー化したりすることも可能です。また、最大3枚の画像を組み合わせて全く新しい画像を創造する機能もあり、アイデアの着想からプロトタイピングまでの時間を大幅に短縮し、これまでにないクリエイティブな表現を可能にします。

エンジニア開発者にとってもNano Bananaは強力なツールとなります。Geminiアプリ内のCanvasやGoogle AI Studioと統合されており、画像ベースのアプリケーションを容易に構築できます。実際に、1枚の写真から様々な時代のスタイルに合わせた画像を生成する「PictureMe」のようなアプリが、社内のプロジェクトから生まれています。

Nano Bananaは、単なる画像生成ツールにとどまりません。専門的なスキルがなくとも誰もがアイデアを形にできる「創造性の民主化」を加速させます。Googleはすでに次の改良に取り組んでおり、この技術が今後、企業のマーケティングや製品開発にどのような革新をもたらすか、引き続き目が離せないでしょう。

MS、AI統合新プラン発表 ChatGPTと同額でOfficeも

新プラン「M365 Premium」

OfficeとAIを統合した新プラン
Copilot ProとM365 Familyを統合
月額19.99ドルで提供

ChatGPT Plusに対抗

ChatGPT Plusと同額で提供
Officeアプリと1TBストレージが付属
生産性アプリとのシームレスな連携が強み

職場利用も可能に

個人契約で職場のOfficeもAI対応
企業データは保護され安全性も確保

Microsoftは2025年10月1日、AIアシスタントCopilot Pro」と生産性スイート「Microsoft 365 Family」を統合した新サブスクリプションプラン「Microsoft 365 Premium」を発表しました。月額19.99ドルという価格は、競合するOpenAIの「ChatGPT Plus」と同額に設定。Officeアプリと高度なAI機能をバンドルすることで、個人の生産性向上市場での覇権を狙います。

この新プランは、個人事業主や高い生産性を求めるプロフェッショナルを主なターゲットとしています。WordやExcelなどのOfficeデスクトップアプリの利用権(最大6人)、1人あたり1TBのクラウドストレージに加え、GPT-4oによる画像生成などCopilot Proの全機能が含まれます。Microsoftは「競合と比較して否定できない価値がある」と自信を見せています。

月額19.99ドルという価格設定は、明らかにChatGPT Plusを意識したものです。OpenAIが汎用的なAI機能で先行する一方、Microsoftは「生産性は我々のDNAだ」と述べ、Officeアプリに深く統合されたAI体験を強みとしています。使い慣れたツール内でシームレスにAIを活用できる点が、最大の差別化要因となるでしょう。

特に注目すべきは、個人契約のAI機能を職場で利用できる仕組みです。個人としてM365 Premiumを契約していれば、職場のPCにインストールされたOfficeアプリでもAI機能が有効になります。企業のデータは個人のアカウントと分離され、セキュリティコンプライアンスは維持されるため、IT管理者も安心して導入を検討できます。

この新プランの導入に伴い、単体の「Copilot Pro」は新規販売が停止されます。Microsoftは、AI機能をOfficeスイートと一体化させる戦略を鮮明にしました。既存のPersonalおよびFamilyプラン加入者にも一部のAI機能が解放されるなど、同社のサブスクリプション体系は、AIを核として大きく再編されつつあります。

Meta、AIとの会話データを広告に活用へ

AIデータ活用の新方針

AIとの会話内容を広告に利用
12月16日からポリシー改定
ユーザーによる拒否は不可

対象となるデータとサービス

チャットボットとの会話履歴
FacebookInstagramで反映

プライバシーへの配慮と例外

EU・英国韓国適用除外
センシティブな話題は利用対象外

Metaは、傘下のAIアシスタントとの会話データをターゲティング広告に利用する方針を明らかにしました。2025年12月16日からプライバシーポリシーを改定し、FacebookInstagramのユーザーに対し、よりパーソナライズされた広告コンテンツを提供します。この動きは、巨大IT企業によるAI製品の収益化競争が新たな段階に入ったことを示唆しています。

具体的には、ユーザーがMeta AIと「ハイキング」について話した場合、ハイキング用品の広告が表示されるようになります。このデータ活用はチャットボットとの会話だけでなく、Ray-Ban MetaスマートグラスでAIが分析した音声画像データ、AI画像生成ツール「Imagine」での操作なども対象となり、ユーザーの行動が多角的に分析されます。

ユーザーにとって重要なのは、このデータ利用を拒否(オプトアウト)できない点です。Metaの各種サービスで同一アカウントにログインしている場合、例えばWhatsAppでのAIとの会話がInstagram広告に影響を与える可能性があります。ユーザーに許されているのは、既存の広告設定メニューから表示される広告の好みを調整することのみです。

プライバシーへの配慮として、Metaは宗教的信条や政治的見解、健康状態といったセンシティブな情報に関する会話は広告に利用しないと説明しています。また、欧州連合(EU)、英国韓国では、現地の厳格なプライバシー規制のため、この新方針は当面適用されません。

Metaの狙いは明確です。中核事業である広告ビジネスを、AIから得られる新たなデータで強化することにあります。月間10億人以上が利用するMeta AIは、ユーザーの興味関心を深く知るための新たな情報の宝庫です。これまで無料で提供してきたAI製品を、広告という収益の柱に直結させる戦略です。

AI製品の収益化は業界全体の課題です。OpenAIChatGPT内での商品購入機能を発表し、GoogleがAI検索への広告導入を計画するなど、各社が模索を続けています。Metaの今回の動きは、データ活用による広告モデルという、同社の成功方程式をAI時代にも適用する明確な一手と言えるでしょう。

Google、AIで巨匠の作風を学び椅子をデザイン

AIとデザイナーの協業

Googleと著名デザイナーの協業
生成AIでデザインを試作
有機的な作風をAIが学習

独自モデルで創造性を拡張

独自スケッチでAIを訓練
言語化と対話で出力を調整
金属3Dプリンタで実物化
創造性を拡張する協業ツール

Google DeepMindは、世界的に著名なデザイナーであるロス・ラブグローブ氏と協業し、生成AIを用いてユニークな椅子をデザインしました。ラブグローブ氏独自のスケッチ群を学習データとし、画像生成モデルをファインチューニング。AIとの対話を通じて氏の作風を反映した新たなアイデアを生み出し、最終的に金属3Dプリンターで物理的なプロトタイプを制作しました。これはAIが創造的プロセスを支援する強力なツールとなり得ることを示す事例です。

プロジェクトの目的は、生成AIを用いてコンセプト作りから物理的な製品まで一貫してデザインを完遂することでした。題材に選ばれたのは、機能が固定されつつも形状の自由度が高い「椅子」。デザイナー独自のスタイルやニュアンスをAIがどこまで正確に捉え、表現できるかという、古典的かつ本質的なデザインの課題に挑戦しました。

開発チームは、ラブグローブ氏が厳選したスケッチの高品質なデータセットを作成。これをGoogleのテキスト画像生成モデル「Imagen」に学習させ、ファインチューニングを行いました。このプロセスにより、モデルはラブグローブ氏のデザイン言語の核となる特有の曲線や構造的論理、有機的なパターンを組み込み、氏の作風に根差した新しいコンセプトを生成できるようになったのです。

成功の鍵は、デザイナーとAIの「対話」にありました。チームは、氏のデザイン語彙を言語化し、AIへの指示(プロンプト)を工夫することで、出力の精度を高めました。例えば、あえて「椅子」という単語を使わず類義語で指示を出し、より多様な形状や機能の探求を促しました。この試行錯誤が、AIを単なるツールから共同制作者へと昇華させたのです。

AIとの協業プロセスを経て生み出された数々のコンセプトから、ラブグローブ氏のチームは最終的なデザインを選定。金属3Dプリンティング技術を用いて、AIが生成したデジタルデータを実物の椅子として作り上げました。ラブグローブ氏は「AIが、ユニークで並外れた何かをプロセスにもたらしうることを示している」と、この成果を高く評価しています。

この事例は、AIが人間の専門性や創造性を代替するのではなく、むしろ拡張するための強力なパートナーになり得ることを明確に示しています。自社の製品開発やサービス設計において、AIをいかに「協業相手」として活用するか経営者エンジニアにとって、その可能性を探る貴重なヒントとなるでしょう。

ChatGPT、子の安全を守る保護者機能と新システム

保護者による利用制限

ティーンのアカウントと連携
利用時間や機能を個別設定
自傷行為の兆候を親へ通知
保護者向けリソースページ開設

会話の自動安全化

有害な会話を自動検知
高精度モデルへ自動切替
安全な応答を生成する新機能
過保護との批判も、改善期間を設定

OpenAIは2025年9月29日、対話型AI「ChatGPT」に、保護者がティーンエイジャーの利用を管理する「ペアレンタルコントロール」と、有害な会話を検知して安全なモデルに切り替える「セーフティルーティングシステム」を導入しました。これは、過去にChatGPTがティーンエイジャーの自殺に関与したとされる訴訟などを受け、AIの安全性と倫理的責任を高めるための重要な一歩です。企業のリーダーや開発者は、AIのリスク管理における先進事例として注目すべきでしょう。

新たに導入されたペアレンタルコントロールでは、保護者が自身のアカウントとティーンのアカウントを連携させ、利用を細かく管理できます。利用できない時間帯の設定や、ボイスモード、画像生成、メモリ機能の無効化が可能です。また、システムが自傷行為の兆候を検知した場合、保護者に通知する機能も実装されました。

もう一つの柱が「セーフティルーティングシステム」です。ユーザーとの会話が感情的にデリケートな内容になった場合、それを自動検知し、より安全な応答ができる最新モデル「GPT-5-thinking」へ会話の途中で切り替えます。単に応答を拒否するのではなく、安全な形で応答を生成する新技術が活用されています。

今回の機能強化の背景には、AIがユーザーに与える精神的な影響への懸念があります。特に、過去にティーンエイジャーがChatGPTとの長期間の対話の末に自ら命を絶ったとして、遺族がOpenAIを提訴する事件が発生しました。AIプラットフォームを運営する企業として、ユーザー保護と社会的責任を果たすための具体的な対策が求められていたのです。

これらの安全機能は専門家から歓迎される一方、一部ユーザーからは「過保護すぎる」といった批判的な声も上がっています。OpenAIもシステムの完璧性を認めておらず、今後120日間の改善期間を設けフィードバックを反映させる方針です。安全性と利便性のバランスをいかに取るかが今後の課題となります。

Meta、AI動画の新フィード『Vibes』を開始

AI動画の発見と創作

AI生成の短尺動画専用フィード
クリエイター作品からの着想を促進
プロンプト表示で制作過程を可視化

リミックスとSNS連携

音楽画像・アニメーションの変更機能
Instagram等への簡単クロス投稿
MetaのAIエコシステム拡大戦略

Metaは9月26日、AIが生成した短尺動画を発見・共有するための新フィード「Vibes」を、Meta AIアプリ内で公開しました。この機能は、クリエイターやコミュニティが作成したAI動画をユーザーがリミックス(再編集)し、新たな創作活動を促すことを目的としています。

「Vibes」は、以前ユーザーがAIとの対話やプロンプトを共有していた「Discover」フィードに代わるものです。テキスト中心の共有から、動画コンテンツの創作と発見に焦点を移したことは、MetaのAI戦略における重要な転換点と言えるでしょう。

フィード上の動画には、生成に使用されたプロンプトが併記されており、ユーザーは制作の裏側を覗くことができます。さらに、音楽画像、アニメーションを変更する「リミックス機能」を活用し、独自の作品をVibesやInstagramFacebookに手軽にクロス投稿できます。

この動きは、Metaが全社的に進めるAI機能統合の一環です。同社はFacebookInstagramなど主力製品にAI画像生成機能を組み込むほか、先日には画像生成AIの有力企業Midjourneyとの提携も発表しました。MetaはAIによるコンテンツ制作エコシステムの構築を加速させています。

Meta、OpenAIから研究者獲得 超知能開発を加速

Metaは2025年9月、AI開発競争の激化を背景に、OpenAIの著名な研究者ヤン・ソン氏を「Meta Superintelligence Labs」の研究責任者として採用しました。この動きは、マーク・ザッカーバーグCEOが今夏から進める人材獲得攻勢の一環です。ソン氏は、OpenAI出身のシェンジア・ジャオ氏の直属となり、超知能開発を加速させる狙いがあります。AI分野におけるトップ人材の獲得競争が、さらに激しさを増していることを示しています。 ソン氏はOpenAIで戦略的探査チームを率いていました。スタンフォード大学の博士課程在学中には、OpenAI画像生成モデル「DALL-E 2」の開発に貢献した画期的な技術を開発した実績を持ちます。彼の専門知識は、大規模で複雑なデータセットを処理するモデルの能力向上に貢献すると期待されています。 今回の採用は、ザッカーバーグCEOが今夏に開始した大規模な人材獲得攻勢の一環です。MetaOpenAIGoogleAnthropicなどから、これまでに少なくとも11人のトップクラスの研究者を引き入れています。CEO自らが主導し、AI開発体制の強化を急いでいることがうかがえるでしょう。 ソン氏が所属する研究所は、同じくOpenAI出身のシェンジア・ジャオ氏が7月から率いています。ジャオ氏はChatGPTGPT-4の開発にも携わった人物で、MetaOpenAIからの人材を中核に据えて開発を進めていることが鮮明になっています。AIの最先端を走る人材の獲得は、企業の競争力を左右する重要な要素です。 一方で、Metaの超知能研究所からは、設立発表後に少数の研究者が離脱する動きも見られます。一部は古巣のOpenAIに戻るなど、トップ人材の流動性は非常に高まっています。企業は優秀な人材を惹きつけ、維持し続けることが大きな課題となっているのです。

Google、AIムードボード「Mixboard」公開 テキストでアイデア創出

Googleは9月24日、AIを活用したムードボード作成アプリ「Mixboard」のパブリックベータ版を米国で公開しました。このサービスは、テキスト指示だけでAIがアイデアを画像化し、ムードボードを作成できるのが特徴です。Pinterestなどの競合サービスと異なり、利用者は既存の画像コレクションを必要とせず、創造的なアイデア出しを手軽に始められます。 Mixboardの最大の特徴は、テキストプロンプトを入力するだけでAIがアイデアを具現化してくれる点です。利用者は手持ちの画像がなくても、ゼロからプロジェクトを開始できます。創造性を刺激するためのテンプレートも用意されており、誰でも手軽にムードボード作りを始められる設計になっています。どのようなアイデアを形にできるでしょうか。 このアプリの中核を担うのは、Googleの最新画像編集モデル「Nano Banana」です。このモデルは、複雑な編集指示を理解し、リアルな画像を生成する能力に優れています。先に公開され人気を博したAIアプリ「Gemini」の成功を支えたのもこの技術であり、その性能の高さが証明されています。 Mixboardは、Pinterestのコラージュ機能と直接競合します。しかし、Pinterestが利用者のピン留めした画像などを使うのに対し、MixboardはAIによる画像生成を起点とします。これにより、まだ形になっていない漠然としたアイデアを探求するプロセスを強力にサポートできるのが強みです。 GoogleはMixboardの用途として、インテリアデザインの考案、イベントテーマのブレインストーミング、DIYプロジェクトのアイデア出しなどを挙げています。画像とテキストを組み合わせて、多角的な視点からアイデアを練ることが可能で、ビジネスや個人の創造活動に大きく貢献することが期待されます。 デジタルムードボードは、特に若年層の間で人気が高まっています。Pinterestのコラージュアプリ「Shuffles」がTikTokでバイラルヒットした例もあります。Mixboardは、こうした市場の需要に応え、AI技術でクリエイティブな表現を支援する新たなツールとして注目されます。 Mixboardは現在、米国の利用者を対象にGoogle Labsでパブリックベータ版として提供されています。利用者は生成した画像を再生成して新たなアイデアを得たり、ボードの内容からAIにテキストを生成させたりすることもできます。フィードバック用のDiscordコミュニティも開設されています。

Google、月額5ドルのAIプランを新興国40カ国超に拡大

Googleは9月24日、月額約5ドルの安価なAIサブスクリプションプラン「AI Plus」を、インドネシアやメキシコなど40カ国以上で提供開始しました。標準プランが高価な新興国市場で有料ユーザーを獲得し、先行するOpenAIに対抗する狙いです。この動きは、世界のAIサービス市場の勢力図に影響を与える可能性があります。 このプランでは、最新AIモデル「Gemini 2.5 Pro」へのアクセスが可能です。加えて、画像生成ツール「Flow」や動画生成ツール「Veo 3 Fast」など、クリエイティブな作業を支援する機能も含まれます。GmailやDocsといったGoogleの各種アプリ内でもAI機能が使えるようになり、業務効率の向上が期待できます。 さらに、AIリサーチアシスタントNotebookLM」の拡張機能や、200GBのクラウドストレージも提供されます。専門的な情報収集や資料作成、データ保管といったビジネスシーンでの実用性を高めており、コストパフォーマンスに優れたサービス内容となっています。 この動きの背景には、OpenAIとの激しい顧客獲得競争があります。OpenAIインドネシアなどで月額5ドル未満の「ChatGPT Go」を展開済みです。月額20ドルの標準プランが浸透しにくい市場で、両社は低価格戦略を加速させ、次なる巨大市場の主導権を争っています。 月額料金は多くの国で約5ドルに設定されていますが、ネパールやメキシコなど一部地域では、最初の6ヶ月間は50%割引が適用されます。巨大IT企業による価格競争は、今後さらに多くの地域で高機能なAIツールの普及を後押しすることになるでしょう。

Google、AI Plusプランを40カ国に追加、新興国市場へ展開加速

Googleは9月23日、AIサブスクリプションプラン「AI Plus」の提供国を新たに40カ国拡大したと発表しました。インドネシアでの先行導入が好評だったことを受け、より手頃な価格で高度なAIツールを世界中に提供する狙いです。対象はアジア、アフリカ、中南米の新興国が中心で、グローバルな利用者層の拡大を目指します。 「AI Plus」プランでは、Geminiアプリでの画像生成・編集や動画生成モデル「Veo 3 Fast」の利用上限が引き上げられます。さらに、Gmail、Docs、Sheetsといった主要な生産性ツールにGeminiが統合され、業務効率の大幅な向上が期待できるでしょう。ビジネスの現場でAIをどう活用できるか、試金石となりそうです。 このプランには、AI搭載のデジタルノート「NotebookLM」の利用上限拡大や、Googleフォト、ドライブ、Gmailで使える200GBのストレージも含まれます。また、これらの特典は最大5人の家族と共有可能で、個人利用だけでなく小規模なチームでの活用も視野に入ります。 新たに追加されたのは、ベトナム、フィリピン、ナイジェリア、メキシコ、ウクライナなど40カ国です。Googleは、価格を各国の市場に合わせて設定することで、新興国市場でのAIサービスの普及を加速させる戦略です。手頃な価格設定が、新たなビジネスチャンスを生むかもしれません。

Googleフォト、対話型AI編集を全Androidユーザーに拡大

Googleは2025年9月23日、米国Googleフォトの対話型AI編集機能を対象の全Androidユーザーに展開開始しました。音声やテキストで指示するだけで、同社のAI「Gemini」が写真を自動で編集します。これにより、専門知識がなくても高度な写真編集が可能となり、クリエイティブな表現の幅が広がります。 この新機能は、アプリ内の「Help me edit」ボタンから利用できます。ユーザーは編集ツールやスライダーを直接操作する必要がありません。代わりに「もっと明るくして」「背景の人を消して」といった自然な言葉で指示を出すだけで、AIが意図を汲み取り、写真を編集します。 この機能は、Googleの高性能AIモデル「Gemini」の能力を活用しています。当初は最新スマートフォン「Pixel 10」の利用者向けに限定公開されていましたが、今回、対象機種が大幅に拡大されました。これにより、より多くのユーザーが最先端のAI技術を手軽に体験できます。 簡単な明るさ調整や不要物の除去はもちろん、古い写真の修復といった高度な編集も可能です。さらに「ペットのアルパカをハワイのワイキキに移動させて」のような、現実にはない創造的な画像生成にも対応し、写真編集の楽しみを広げます。 一度の指示で終わりではありません。AIによる編集結果に対して「もう少しこうして」といった追加の指示を出すことで、対話しながら微調整を重ね、理想の仕上がりに近づけることができます。「make it better(もっと良くして)」といった曖昧な指示から始めることも可能です。 現在の提供対象は、米国在住で18歳以上のユーザーに限定され、言語は英語のみです。また、GoogleはAIで生成・編集された画像であることを示す技術標準「C2PA」にも対応しており、コンテンツの信頼性確保にも配慮しています。

OpenAI、インドネシアで廉価版ChatGPT投入、Google追撃

OpenAIは、インドネシアで廉価版サブスクリプションプラン「ChatGPT Go」を開始しました。料金は月額75,000ルピア(約4.50ドル)です。8月に開始したインド市場での成功を受け、新興国への展開を加速します。この動きは、同市場で先行する米Googleの類似プランに対抗するもので、生成AIの顧客基盤拡大を狙います。 ChatGPT Goプランは、無料版と月額20ドルの「Plus」プランの中間に位置します。無料版の10倍の利用上限が設定され、質問やプロンプトの送信、画像生成、ファイルアップロードがより多く利用できます。また、過去の会話を記憶する能力が向上し、ユーザーごとに最適化された応答が期待できます。 先行して同プランを導入したインドでは、有料購読者数が2倍以上に増加したといいます。価格を抑えたプランが新興市場のユーザー獲得に有効であることを証明したかたちです。この成功が、今回のインドネシアへの迅速な展開につながったのでしょう。各市場の特性に合わせた価格戦略の重要性を示唆しています。 この動きは、競合するGoogleへの直接的な対抗策です。Googleは今月初め、インドネシアで同様の価格帯の「AI Plus」プランを先行して発表しました。同プランでは、高性能な「Gemini 2.5 Pro」や画像動画生成ツール、200GBのクラウドストレージなどを提供しており、競争は激化しています。 AI大手が新興国で廉価版プランの投入を急ぐ背景には、将来の巨大市場での主導権争いがあります。一度ユーザー基盤を確立すれば、長期的な収益源となるためです。日本企業も、海外市場へAIサービスを展開する際には、現地の経済状況に合わせた価格設定と競合の動向を分析することが成功の鍵となるでしょう。

フアンCEOがGemini「Nano Banana」を絶賛、AIは「格差解消の機会」

フアン氏熱狂のAI画像生成

Google Geminiの「Nano Banana」を熱狂的に称賛
公開後数日で3億枚画像生成増を記録
AIの民主化を推進する技術と評価

CEOの高度なAI活用術

日常業務や公開スピーチ作成にAIを多用
AIを「考えるパートナー」として活用
タスクに応じて複数モデルを使い分け

英国AI市場への戦略

NVIDIA英国AIインフラ企業に6.83億ドルを出資
英国のAI潜在能力を高く評価し謙虚すぎると指摘

NVIDIAのジェンスン・フアンCEOは、Google GeminiのAI画像生成ツール「Nano Banana」を熱狂的に称賛しました。同氏はロンドンで英国への大規模AI投資を発表した際、AIは「技術格差を解消する最大の機会」であると主張。AIの未来について非常に楽観的な見解を示しています。

フアンCEOが熱狂的に支持するNano Bananaは、公開から数日でGemini画像生成数を3億枚急増させた人気機能です。これは、背景の品質を維持したまま、顔や動物などのオブジェクトに精密な編集を可能にする点が評価され、ユーザーに広く受け入れられています。

フアン氏は日常業務から公開スピーチの準備まで、AIを積極的に利用しています。AIワープロを使用することで、自身の状況や意図を記憶し、適切な提案を行う「思考のパートナー」として生産性を劇的に高めていると説明しています。

同氏はタスクに応じてAIモデルを厳密に使い分けています。技術的な用途にはGeminiを、芸術的な要素が強い場合はGrokを、高速な情報アクセスにはPerplexityを、そして日常的な利用にはChatGPTを楽しむと述べています。

さらに重要なリサーチを行う際には、フアン氏独自の高度な検証プロセスを採用しています。同じプロンプト複数のAIモデルに与え、互いの出力結果を批判的に検証させてから、最適な成果を選び出す手法です。

フアン氏は、AIは電気やインターネットのように、すべての人に開かれ、誰一人として取り残されてはならないという哲学を持っています。「この技術は使い方が非常に簡単であり、技術格差を埋める最大のチャンスだ」と強調し、AIの民主化を訴えています。

NVIDIAは、英国データセンター構築企業Nscaleに対し、6億8300万ドル(約1,000億円超)の株式投資を実施しました。フアン氏は、英国が産業革命やDeepMindの創出に貢献した歴史を踏まえ、同国のAI進展における潜在能力を高く評価しています。

インドがGoogle画像AI「Nano Banana」世界一の市場に

世界最大の利用規模

インドNano Banana利用数世界No.1に浮上
GeminiアプリのDL数がリリース後667%急増
1~8月のDL数は米国より55%高い水準

爆発的成長の要因

90年代ボリウッド風など独自のトレンドが拡大
伝統衣装「AIサリー」ブームの創出
フィギュア化などグローバルトレンドの拡散源

収益性と安全対策

アプリ内課金成長率が米国を大きく凌駕
SynthIDによるAI生成画像の識別

Google画像生成AI「Nano Banana」(正式名称Gemini 2.5 Flash Image)が、インドで爆発的な人気を集め、現在、利用規模において世界最大の市場となりました。独自のレトロポートレートやボリウッド風の画像生成といったローカルトレンドが牽引し、Geminiアプリはインドの主要アプリストアで無料チャートのトップを独占しています。

この人気により、インドでのGeminiアプリのダウンロード数は、Nano Bananaのアップデート後、わずか2週間で667%もの急増を記録しました。世界第2位のスマートフォン市場であり、オンライン人口を抱えるインドでの爆発的な普及は、AIモデルのグローバル展開において極めて重要な試金石となります。

Google DeepMindによると、インドユーザーの特徴は、その利用の仕方にあるといいます。特に注目されているのが、1990年代のボリウッドスタイルを再現するレトロポートレート生成です。また、インドの伝統衣装「サリー」を着用したビンテージ風画像、通称「AIサリー」ブームも発生しています。

インドユーザーは、単にローカルな画像生成に留まりません。例えば、自分自身をミニチュア化する「フィギュアトレンド」はタイで始まりましたが、インドで大きな牽引力を得たことで、世界的な流行へと拡大しました。インドは、AIトレンドを消費するだけでなく、拡散する主要なハブとなりつつあります。

利用規模だけでなく、収益性の面でもインド市場は高い潜在力を示しています。アプリ内課金(IAP)の全体額はまだ米国に及びませんが、Nano Bananaリリース後のIAP成長率は18%を記録し、これは世界平均の11%や、米国市場の1%未満を大きく凌駕しています。

一方で、私的な写真を用いた画像生成に伴うプライバシーやデータ悪用の懸念も指摘されています。これに対しGoogleは、AI生成画像であることを識別するため、目に見える透かしに加え、SynthIDと呼ばれる隠しマーカーを埋め込むことで、安全性の向上を図っています。

Geminiが新AI画像モデルでApp Store首位獲得

ランキング勢力図の変化

米国iOSChatGPTを抜き首位 (9/12)
世界108カ国でiPhone総合Top 5入り
Google Playでは26位から2位に急伸

DLと収益の爆発的成長

9月のDL数が前月比45%増を記録
Nano Banana導入後、新規ユーザー2300万人
iOS収益が1月比1,291%増を達成

GoogleのAIチャットアプリ「Gemini」が、新画像編集AIモデル「Nano Banana」の導入により、モバイルアプリ市場で記録的な成長を見せています。特に米国iOSApp Storeでは、長らく首位を維持していたOpenAIChatGPTを抜き、トップの座を獲得しました。

Geminiは9月12日に米国App Store総合ランキング1位を達成し、現在もその座を維持しています。また、AndroidプラットフォームのGoogle Playでも、9月8日の26位から一気に2位まで躍進。AIアプリ市場の勢力図が大きく変化しています。

アプリインテリジェンス企業Appfiguresのデータによると、9月のダウンロード数は前月比45%増となり、わずか半月で1,260万ダウンロードを記録しました。さらに世界108カ国でiPhone総合アプリのTop 5に入るなど、グローバルな浸透が加速しています。

この成長の最大の要因は、ユーザーが複雑な画像編集やリアルな画像生成を容易に行えるようになった「Nano Banana」モデルへの高い評価です。同モデル導入後、新規ユーザーは2,300万人を超え、共有された画像5億枚以上に達しています。

利用者の増加は収益にも直結しています。iOSにおけるGeminiの年間収益は630万ドルに達しており、特に「Nano Banana」がリリースされた8月の収益は160万ドルでした。これは1月と比較して1,291%もの大幅な伸びです。

M365 Copilot Chatが無料化、主要Officeアプリで生産性を底上げ

無料化の対象と範囲

全てのM365ビジネスユーザーが対象
Word、Excelなど主要5アプリに搭載
Copilot Chatサイドバーを実装
追加ライセンス費用は不要

提供される主要機能

ドキュメントの迅速な下書き・要約
スプレッドシートのデータ分析を支援
開いたファイル内容を理解し回答
Webベースの安全なAIチャット利用

Microsoftは、全てのMicrosoft 365ビジネスユーザーを対象に、WordやExcelなどの主要Officeアプリケーション内でAI機能「Copilot Chat」の無料提供を開始しました。これにより、ドキュメントの下書きやデータ分析といった生成AIの基本機能が、追加費用なしで利用可能になります。これは、企業やチームの生産性向上を強力に後押しする戦略的な動きです。

今回搭載されたのは、アプリ内で利用できるCopilot Chatサイドバーです。ユーザーが開いているファイルの内容を瞬時に理解し、関連性の高い回答を返す「コンテンツアウェア」なチャット機能が特徴です。例えば、Wordでの文書の書き換えや、PowerPointでのスライド作成補助などを、すぐに開始できます。

ただし、月額30ドル/ユーザーの有償ライセンス「Microsoft 365 Copilot」は引き続き提供されます。有償版は、単一ファイルに限定されず、企業全体の作業データに基づいて推論できる点で無料版と一線を画します。真の全社的なAI活用を目指す企業には、引き続き有償版の検討が必要です。

さらに、有償ライセンスユーザーは、最新技術であるGPT-5への優先アクセス権や、ファイルアップロード、画像生成といった高度な機能を利用できます。また、応答速度の向上や、ピーク利用時でも安定した可用性といった技術的な優位性も享受できます。

今回の無料化は、既存のビジネスプランの価格調整を伴わず実施されました。企業は、AI活用のハードルが大幅に下がることで、従業員のAIリテラシー向上と生産性改善を同時に進めることが可能になります。日常業務へのAI浸透を加速させる、重要な施策と言えるでしょう。