画像生成(ユースケース)に関するニュース一覧

GoogleがAIアート展を開催、技術と自然の融合を探求

AIとアートの融合を展示

新作13点をマウンテンビューで公開
オンラインでも全作品を鑑賞可能
ベイエリアの生態系に着想を得た構成

技術が拓く創造の未来

DeepDreamから続く10年の軌跡
人間と機械、自然の共進化を探求
次世代のクリエイター支援を強化

Googleは2025年12月11日、AIとアートの融合をテーマにした展覧会「Gradient Canvas」を発表しました。本展では、カリフォルニア州マウンテンビューおよびオンラインにて、新作13点を公開しています。AIを「人間・機械・自然をつなぐ架け橋」と位置づけ、テクノロジーがもたらす新たな視点と創造の可能性を提示するものです。

今回の展示は、Googleの拠点であるベイエリアの生態系に着想を得ています。参加アーティストはAIを駆使し、私たちを取り巻く環境との相互作用を表現しました。人間と機械の知性が世界をどう理解し、共進化していくのかを問いかける試みです。

Googleとアートの関わりは、10年前の画像生成技術「DeepDream」に遡ります。AIによる視覚表現の可能性を示したこの技術は、様々な支援プログラムへと発展しました。長年のコラボレーションの蓄積が、本展の強固な基盤となっています。

技術に目的を与えるのは、常に人間の想像力です。Googleは、アーティストがAIツールを活用することで、より思慮深い未来を築けると確信しています。今後も次世代を支援し、最先端のAIツールをより多くの人々に届けることを目指します。

Google、自撮り1枚で全身試着を実現 Gemini搭載

自撮り画像から全身を生成

自撮りだけで全身モデルを生成
服のサイズ指定で高精度に再現
従来の全身写真も引き続き利用可

Gemini 2.5を活用

最新のGemini 2.5を採用
モデル名「Nano Banana」活用
米国Google Shoppingで提供

Googleは2025年12月11日、AIを活用したバーチャル試着機能をアップデートし、米国ユーザー向けに提供を開始しました。これまでは全身写真のアップロードが必要でしたが、顔写真(セルフィー)1枚だけで自身の全身デジタルモデルを生成し、仮想的な試着が可能になります。

この新機能の中核には、Googleの最新画像生成モデルであるGemini 2.5 Flash Image model(コードネーム:Nano Banana)が採用されています。ユーザーが自撮り写真をアップロードし、普段着用している服のサイズを選択すると、AIがスタジオ品質の全身画像を複数生成します。

生成されたデジタルモデルをデフォルトの試着モデルとして設定することで、Google Shopping上の数十億に及ぶ商品リストから、自分に似合う服をスムーズに探せるようになります。従来の全身写真を使用する方法や、多様な体型のモデルから選ぶオプションも維持されています。

今回のアップデートは、照明条件の悪い試着室や自撮りの手間といった、オンラインショッピングにおける顧客体験(UX)の課題を解決するものです。AI技術をEC体験に深く統合することで、購買意欲の向上と返品率の低減が期待されます。

Googleは、AI試着専用アプリ「Doppl」の開発など、ファッション領域でのAI活用を加速させています。今回の機能拡充により、TikTokInstagramなどのプラットフォームに慣れ親しんだ層に対し、より没入感のある新しい購買体験を提示していく狙いがあります。

AI生産性格差は6倍:勝機はツール導入でなく「行動変容」

同じツールでも成果は別物

上位層は中央値の6倍活用
コーディング17倍の格差
多機能利用で5倍の時短

習慣化と探索が分ける明暗

毎日使う層は全機能を駆使
月1回層は高度機能を使わず
格差の本質は技術でなく行動

組織導入の95%は失敗

企業の95%が投資回収できず
公式より個人利用が成果出す

OpenAIMITが2025年に発表した衝撃的なレポートにより、AI導入企業内で深刻な「生産性格差」が起きていることが判明しました。同じツールへのアクセス権を持ちながら、使いこなす層とそうでない層の間には6倍もの開きが存在します。本質はツールの有無ではなく、個人の行動変容と組織の戦略にあることが浮き彫りになりました。

格差の実態は劇的です。上位5%の「パワーユーザー」は、一般的な従業員と比較してChatGPTへのメッセージ送信数が6倍に達しています。特にコーディング業務ではその差は17倍、データ分析でも16倍に拡大しており、AIを業務の核に据える層と、単なる補助ツールと見なす層との間で二極化が進んでいます。

この分断を生む最大の要因は「習慣化」です。毎日AIを利用するユーザーの99%が検索推論などの高度な機能を活用している一方、月間ユーザーの約2割はデータ分析機能を一度も触っていません。毎日使うことで新たな用途を発見し、それがさらなる生産性向上につながるという複利効果が働いています。

複数の機能を使いこなすことのインパクトも甚大です。データ分析、執筆、画像生成など7種類以上のタスクでAIを活用する従業員は、4種類以下のユーザーに比べて5倍の時間を節約しています。実験的に使い倒す姿勢が、結果として個人の市場価値を大きく引き上げているのです。

一方で、企業レベルの投資対効果は厳しい現実を突きつけています。MITの調査によると、生成AIへの巨額投資にもかかわらず、変革的なリターンを得ている組織はわずか5%です。多くの企業がパイロット段階で停滞しており、ツールを配布するだけで業務プロセスを変えられていないことが主因です。

皮肉なことに、会社が公式に導入したシステムよりも、従業員が個人的に契約して業務に組み込む「シャドーAI」の方が高いROIを叩き出しています。IT部門の承認を待たず、自らの判断で柔軟なツールを選び、ワークフローを改善する自律的な従業員だけが先行者利益を得ている状況です。

結論として、AI活用の成否を分けるのはテクノロジーそのものではありません。組織がいかにして「毎日使い、深く探索する」という行動様式を定着させられるかにかかっています。単なるツール導入で満足せず、業務フロー自体を再設計する覚悟がリーダーに問われています。

Google Mixboard、AIでプレゼン資料を自動生成へ

Nano Banana Proを搭載

ボード内容からプレゼン資料を生成
文脈や好みのスタイルを反映
高解像度ビジュアルとテキストを作成

入力・編集機能の強化

自分撮りカメラやPDFに対応
画像への手書きで修正指示が可能
1プロジェクトで複数ボードを管理

Google LabsはAI実験ツール「Mixboard」を更新し、Nano Banana Proを活用したプレゼンテーション生成機能を追加しました。アイデア出しから資料作成までをシームレスにつなぎ、業務効率を劇的に向上させます。

新機能では、ボード上の画像やテキストの文脈を解析し、ユーザー指定のスタイルで美しいスライドを自動構築します。高度な画像生成モデルにより、説得力のあるビジュアルとテキストを瞬時に用意できるのが特徴です。

インプット機能も強化され、PDFの読み込みや内蔵カメラでの自撮り画像追加が可能になりました。さらに、画像に直接手書き(ドゥードゥル)して修正エリアを指定するなど、直感的な編集もサポートしています。

プロジェクト管理面では、単一プロジェクト内で複数のボードを切り替えられるようになりました。ブレインストーミング用と最終案用を分けるなど、思考プロセスに応じた柔軟な使い分けが可能です。

ChatGPT成長鈍化、Google Geminiが猛追

鮮明になる成長率の格差

ChatGPTのユーザー増は6%に鈍化
Geminiは同期間に30%急伸
市場飽和とシェア低下の兆候

機能強化と競合の台頭

画像モデルが利用増を牽引
滞在時間が倍増し1日11分へ
Perplexity等も3倍超の成長

米TechCrunchによると、市場調査会社Sensor TowerがChatGPTの成長鈍化とGoogle Geminiの急伸を報告しました。2025年後半、先行するOpenAIに対し、Google機能拡充で攻勢を強めています。

ChatGPTは依然として市場の過半数を握りますが、8月から11月の月間アクティブユーザー増加率はわずか6%に留まりました。市場飽和の懸念が浮上する中、Geminiは同期間に約30%の成長を記録しています。

Googleの躍進を牽引するのは、新型の画像生成モデル「Nano Banana」の高い人気です。Android OSへの統合も進み、アプリ滞在時間は3月から倍増の1日11分に達し、ユーザーのエンゲージメントが高まっています。

競合のPerplexityClaudeも前年比で3桁成長を遂げており、市場競争は激化の一途です。OpenAIは危機感を強め、サム・アルトマンCEO主導で製品改善に注力するよう社内に指示を出しました。

Google「Gemini 3」発表:視覚推論と自律エージェントで生産性革命

行動するAIへの進化

マルチモーダル理解とAgentic機能が大幅強化
自然言語でアプリを生成するVibe Codingを実現
検索結果で動的ツールを作成するAI Mode

視覚・空間認識の飛躍

Gemini 3 Pro Visionが文書や画面を精密に構造化
動画の因果関係を理解しピクセル単位の操作が可能
医療・法務・教育など専門分野での応用深化

新開発基盤とエコシステム

ツールを横断して自律遂行するGoogle Antigravity
Nano Banana Pro画像生成もプロ品質へ
GoogleマップやAndroid Autoへも全面展開

Googleは12月5日、次世代AIモデル「Gemini 3」およびエージェント開発プラットフォーム「Google Antigravity」を発表しました。新モデルは、テキスト・画像動画・コードを統合的に理解するマルチモーダル性能で世界最高峰を記録。特に「視覚・空間推論」能力の飛躍的な向上と、自律的にタスクを遂行する「Agentic(エージェンティック)」な機能強化が特徴です。ビジネスの現場における自動化と生産性の定義を塗り替える可能性があります。

Gemini 3の最大の特徴は、ユーザーの意図を汲み取り、複雑な工程を自律的に実行する能力です。これを象徴するのが「Vibe Coding」と呼ばれる開発体験です。自然言語の指示だけで、インタラクティブなWeb UIやツールを即座に生成・実行します。Google検索に統合された「AI Mode」では、検索クエリに応じて動的にローン計算機や科学シミュレーションを作成し、ユーザーに提示します。単に情報を返すだけでなく、「使える道具」をその場で作り出す点が画期的です。

同時に発表された「Gemini 3 Pro Vision」は、AIの「眼」を再定義します。従来のOCR(文字認識)を超え、複雑な文書、手書きのメモ、グラフを構造化されたコード(HTMLやLaTeX)に復元する「Derendering」機能を搭載しました。さらに、PCやスマホの画面上のUIを正確に理解して操作する能力や、1秒間に10フレーム以上の動画を処理してゴルフスイングの微細な動きや因果関係を分析する能力も備えています。これにより、医療画像の診断支援や法務文書の分析、ソフトウェアのQAテストなど、高度な専門業務の自動化が加速します。

開発者向けには、新たなエージェント開発プラットフォーム「Google Antigravity」が登場しました。これは、エディタ、ターミナル、ブラウザを横断して動作するインテリジェントなエージェントを構築・管理するための基盤です。AIが単なるコード補完ツールから、現実世界で機能するコードを生成し、自律的にデバッグデプロイを行う「パートナー」へと進化します。Google AI Proなどのサブスクリプションで優先アクセスが提供され、エンジニア生産性を劇的に高めることが期待されます。

クリエイティブ領域では、Gemini 3をベースにした画像生成モデル「Nano Banana Pro」が、インフォグラフィックやスタジオ品質のビジュアル生成を実現しました。また、GoogleマップやAndroid AutoへのGemini統合も進み、運転中のナビゲーションやタスク処理が対話形式で完結するようになります。Googleはテキサス州への400億ドルのインフラ投資を含め、AIエコシステムの拡大を全方位で推進しており、ビジネスリーダーにとってAI活用の新たなフェーズが始まったと言えるでしょう。

OpenAIとNORAD提携、サンタ追跡に生成AIの新体験

伝統行事へのAI導入

NORADのサンタ追跡にAI機能追加
ChatGPT活用で家族体験を拡張
公式サイトにて無償公開

提供される3つのツール

写真をエルフに変える画像生成
子供の発想を塗り絵にする機能
対話型で物語を作る機能

OpenAIは12月1日、北米航空宇宙防衛司令部(NORAD)との提携を発表しました。60年以上の歴史を持つ恒例の「サンタ追跡」プログラムにChatGPT技術を導入し、ホリデー体験をデジタルに拡張します。

目玉は3つの生成AIツールです。写真をエルフ化する機能、子供のアイデアを塗り絵にする機能、空欄補充で物語を作る機能を提供。画像・テキスト生成技術を、直感的で楽しい体験へと昇華させました。

これらの機能はNORAD公式サイトから利用可能です。伝統行事に先端AIを組み込むことで、新たなエンターテインメントの形を提示しています。ビジネスリーダーにとっても、AIの親しみやすい応用例として参考になるでしょう。

Google検索に「Gemini 3」搭載、120カ国で利用可能に

検索機能の刷新と対象エリア

Google検索Gemini 3を統合
Pro・Ultra会員向けに120カ国で開始
高度な推論複雑なクエリを理解

推論能力と視覚化の進化

動的UIやツールをリアルタイム生成
インフォグラフィック等の可視化が可能

Googleは2025年12月1日、同社の最新AIモデル「Gemini 3」を検索機能「AI Mode」に導入し、約120の国と地域で提供を開始しました。Google AI ProおよびUltraの契約者は、英語環境においてこの高度な推論能力を活用できるようになります。

Gemini 3の最大の特徴は、最先端の推論能力とコーディング機能です。複雑な問いのニュアンスを把握するだけでなく、動的なレイアウトや対話型ツールをその場で生成し、従来の検索体験を劇的に向上させます。

あわせて、最新の画像生成モデル「Nano Banana Pro」もAI Modeに実装されました。Gemini 3 Proを基盤とするこのモデルは、検索エンジンの膨大な知識と連携し、インフォグラフィックなどの高度な資料作成を強力に支援します。

今回の機能拡張により、ユーザーはより深く実用的な回答を瞬時に得られるようになります。市場調査や分析を行うビジネスパーソンにとって、生産性を高める強力な武器となることは間違いありません。

独画像生成AIが3億ドル調達、評価額32.5億ドルへ

大型調達と豪華な投資家陣

シリーズBで3億ドルを調達
評価額32.5億ドルに到達
SalesforceNVIDIAが参加
CanvaやFigmaも出資

技術力と急速な普及

マスク氏のGrokが技術採用
最新モデルFlux 2を発表
4K解像度画像生成に対応
Stable Diffusion開発陣が創業

ドイツを拠点とする画像生成AI企業Black Forest Labsは12月1日、シリーズBラウンドで3億ドルを調達したと発表しました。今回の大型調達により、同社の企業評価額32.5億ドルへと急伸しています。

本ラウンドはSalesforce Venturesなどが主導し、a16zやNVIDIAといった有力VC・テク企業に加え、CanvaやFigmaなどのデザインプラットフォームも出資しました。調達資金は、さらなる研究開発(R&D;)に充てられます。

2024年8月の設立以来、同社は急速に市場シェアを拡大してきました。イーロン・マスク氏のAI「Grok」が同社モデルを採用したことで注目を集め、現在ではAdobeやPicsartなど、クリエイティブ領域の主要企業が技術を導入しています。

直近では最新モデル「Flux 2」を発表し、テキスト描画やレンダリング品質を向上させました。最大10枚の画像を参照してトーンを維持する機能や、4K解像度での生成を実現するなど、プロフェッショナル用途への対応を強化しています。

同社の共同創業者であるRobin Rombach氏らは、かつてStability AIでStable Diffusionの開発を主導した研究者たちです。その確かな技術的背景と実績が、短期間での巨額調達と市場からの高い信頼を支えています。

OpenAIとGoogle、需要急増でAI生成回数を制限

主要ツールの制限内容

Sora無料版は1日6動画へ制限
Google画像生成1日2枚に縮小
背景にホリデー需要と負荷増大

企業側の対応と戦略

OpenAI追加課金で購入可能
Google予告なしの変更を示唆
有料プランの優位性が高まる

OpenAIGoogleは2025年11月28日、ホリデーシーズンの需要急増を受け、主要な生成AIツールの利用制限を開始しました。インフラへの過度な負荷を軽減しつつ、収益化を加速させる狙いがあります。

OpenAI動画生成AI「Sora」では、無料ユーザーの上限が1日6本に設定されました。責任者は「GPUが溶けそう」と状況を説明し、追加生成が必要な場合は都度購入するよう促しています。

Google画像生成AI「Nano Banana Pro」の無料枠を従来の3枚から1日2枚に縮小しました。Gemini 3 Proへのアクセスも制限されており、今後も予告なく条件が変更される可能性があります。

今回の措置は無料ユーザーが対象で、有料プランの制限変更には言及されていません。ビジネスで安定的にAIを利用するためには、有料版の活用やリソース状況の継続的な確認が不可欠です。

2025年AI総括:GPT-5実用化と中国・小型モデルの台頭

OpenAIの進化と実用化加速

GPT-5と5.1が始動、ZenDeskで解決率9割事例も
Sora 2やブラウザAtlas、OSSモデルも全方位展開
コーディング特化モデルで長時間タスクが可能に

中国勢と多様なモデルの台頭

DeepSeekQwen3など中国OSSが世界を席巻
Google Gemma 3など超小型モデルが実用段階へ
MetaがMidjourneyと提携画像生成をSNS統合
Gemini 3やClaude Opus 4.5で競争激化

2025年11月、米VentureBeatは今年のAI業界を振り返る総括記事を公開しました。2025年は、特定の最強モデル一強ではなく、オープンソースや中国勢、エッジ向け小型モデルを含めた「エコシステムの多様化」が決定的となった年です。経営者エンジニアにとって、用途に応じて最適なAIを選択できる環境が整ったことが、今年最大の収穫と言えるでしょう。

OpenAIは待望のGPT-5およびGPT-5.1をリリースし、市場を牽引し続けました。初期の反応は賛否両論ありましたが、改良を経てZenDeskなどの企業導入が進み、顧客対応の自動解決率が80〜90%に達する事例も報告されています。さらに、動画生成AI「Sora 2」やブラウザ統合型「Atlas」、そして意外にもオープンウェイトモデルの公開など、全方位での攻勢を強めています。

特筆すべきは中国発のオープンソースモデルの躍進です。DeepSeek-R1やAlibabaのQwen3シリーズなどが、推論能力やコーディング性能で米国のフロンティアモデルに肉薄しています。MITなどの調査によれば、中国製モデルのダウンロード数は米国をわずかに上回る勢いを見せており、コストパフォーマンスを重視する企業にとって無視できない選択肢となりました。

「巨大化」へのカウンターとして、小型・ローカルモデルの実用性も飛躍的に向上しました。GoogleのGemma 3やLiquid AIのLFM2は、パラメータ数を抑えつつ特定タスクに特化し、エッジデバイスやプライバシー重視の環境での利用を可能にしました。すべての処理を巨大クラウドAIに依存しない、分散型のAI活用が現実味を帯びています。

画像生成や競合他社の動きも活発です。MetaはMidjourneyの技術ライセンスを取得し、自社SNSへの統合を進めるという驚きの戦略に出ました。一方、GoogleGemini 3に加え、ビジネス図解に強い画像生成モデル「Nano Banana Pro」を投入しています。AnthropicClaude Opus 4.5やBlack Forest LabsのFlux.2など、各領域でハイレベルな競争が続いています。

AI買物Ontonが750万ドル調達、家具からアパレルへ

ユーザー200万人突破と大型調達

MAUが5万から200万へ急増
750万ドルを追加調達し拡大へ
家具からアパレル・家電へ展開

幻覚を排除する独自AI技術

ニューロシンボリックAIを採用
LLMの弱点を補い論理的推論を実現
画像生成無限キャンバスで購買支援
従来EC比で3〜5倍のCV率達成

AI搭載ショッピング検索の米Ontonが、750万ドル資金調達を実施しました。同社の月間アクティブユーザー数は5万から200万人へと急成長しており、今回の資金で家具中心の事業をアパレルや家電へと拡大する計画です。

同社の核は「ニューロシンボリックAI」です。確率的なLLMの弱点である「幻覚」を排除し、例えば「ペット向き」なら「汚れに強い素材」を導き出すなど、商品データに基づいた論理的な検索結果を提供できる点が競合との差異です。

チャット形式にとどまらない視覚的なUXも特徴です。ユーザーは部屋の画像をアップロードして家具配置を試したり、無限キャンバス上で商品比較を行ったりでき、従来のECサイトと比較して3〜5倍のコンバージョン率を達成しています。

AI商品検索GooglePerplexityも参入する激戦区です。Ontonは旧名Deftから改称し、現在は10名の少数精鋭ですが、今後はエンジニア採用を強化し、家具での成功を基盤にアパレル分野でのシェア獲得を狙います。

OpenAI、企業データの保存先指定を日本含む世界へ拡大

日本含む10地域で選択可能

ChatGPT Enterprise等が対象
日本欧州など10地域を指定可能
各国のデータ規制へ準拠容易に
コンプライアンス懸念を解消

対象データと技術的制約

会話やファイルを域内保存
API利用時もプロジェクト単位で設定
推論処理は引き続き米国の場合も
学習へのデータ利用はなし

OpenAIは2025年11月25日、企業向けプランの顧客に対し、データを保存する地域(データレジデンシー)を指定できる機能を日本を含む世界各地へ拡大したと発表しました。これにより、厳格なデータ管理が求められる企業においても、各国の法規制に準拠しながらAI導入を進めやすくなります。

新たに対象となった地域は、日本米国英国、カナダ、韓国、シンガポール、インドオーストラリア、アラブ首長国連邦(UAE)、および欧州各国です。ChatGPT EnterpriseやEdu、APIプラットフォームを利用する顧客は、管理画面からデータを保管する物理的な場所を選択できるようになります。

今回の機能拡大は、データが国外に持ち出されることを制限する企業のセキュリティポリシーや、GDPRなどの地域規制への対応を支援するものです。指定した地域には、チャットの履歴、アップロードされたファイル、画像生成の成果物などが保存され、企業のコンプライアンスリスクを低減します。

技術的な仕様として、地域指定が適用されるのは「保管データ(Data at rest)」に限られる点には注意が必要です。AIが回答を生成する際の計算処理(推論)については、現時点では引き続き米国のサーバーで行われる場合があると報じられています。

OpenAIは、企業プランのデータがモデルのトレーニングには使用されない方針を改めて強調しています。データはAES-256で暗号化され、SOC 2 Type 2などの国際的なセキュリティ基準にも準拠しており、金融機関や行政機関などでも安心して利用できる環境整備が進んでいます。

Google動画生成Flow 画像モデル刷新と編集機能を追加

プロ級の画像生成と編集

新モデルNano Banana Pro搭載
被写界深度や照明を精密に制御
複数画像をブレンドし詳細保持

直感的操作と動画調整

手書きによる指示入力を実現
動画内のオブジェクト追加・削除
生成後のカメラワーク再調整

Google Labsは、動画生成ツール「Flow」に新画像モデル「Nano Banana Pro」を含む4つの主要な編集機能を追加しました。5月の公開以来、生成された動画は5億本を超えており、今回の更新でクリエイターが求めるより精密な制御と表現力を提供します。

特筆すべきは、有料購読者が利用可能な最新の画像モデル「Nano Banana Pro」です。被写界深度、照明、カラーグレーディングといったプロフェッショナルレベルの調整が可能になり、静止画のクオリティを劇的に向上させます。

「Images」タブでは、プロンプトだけでキャラクターの衣装やポーズ、カメラアングルを変更可能です。複数の参照画像をブレンドして、重要な詳細を維持しながら理想のフレームを作り込む機能も備えています。

言語化が難しい指示も直感的に行えます。画像に直接手書き(ドゥードゥル)を加えることでAIが意図を理解し、テキストプロンプトを練り上げる時間を削減します。

動画の一部だけを修正する機能も強化されました。他の要素を変えずにオブジェクトの追加が可能になり、不要な要素の削除機能も来月から実験的に導入されます。

生成後の動画に対しても、カメラの位置や軌道を調整する「再撮影」機能を追加しました。一から生成し直すことなく、異なる視点や動きを試行錯誤できるようになり、制作効率が高まります。

画像生成「FLUX.2」公開、一貫性と品質で商用利用を革新

商用特化の強力なモデル群

Proから軽量版まで4つのモデルを展開
最大10枚の画像参照で一貫性を維持
文字描画と物理的正確性が大幅向上

技術革新と高い経済性

320億パラメータの高性能を実現
NVIDIA連携でVRAM消費を40%削減
競合比で高品質かつ低コストを達成

独Black Forest Labsは11月25日、画像生成AI「FLUX.2」を発表しました。高画質を維持しつつ、企業が求める一貫性と制御性を大幅に強化し、本格的な商用ワークフローへの導入を狙います。

ラインナップは、最高性能の「Pro」、パラメータ制御可能な「Flex」、オープンウェイトの「Dev」、軽量版「Klein」の4種です。特に「Dev」は320億パラメータを誇り、開発検証において強力な選択肢となります。

最大の特徴は「マルチリファレンス機能」です。最大10枚の画像を読み込み、キャラや商品の細部を維持した生成が可能です。これにより、従来の課題だった生成ごとのバラつきを解消し、ブランドイメージの統一を容易にします。

コスト対効果も優秀です。ベンチマークでは、競合と比較して同等以上の品質を数分の一のコストで実現しています。API単価も安く設定されており、大量の画像生成を行う企業の収益性向上とコスト削減に大きく寄与します。

技術面では「VAE」を改良し、Apache 2.0ライセンスで完全オープン化しました。企業はこれを基盤に自社パイプラインを構築でき、ベンダー依存を避けつつ、セキュリティと品質を自社でコントロール可能になります。

NVIDIAとの協力により、FP8量子化技術を用いてVRAM使用量を40%削減しました。これにより、巨大なモデルでありながら、ComfyUIなどを通じて一般的なGPU環境でも効率的に動作させることが可能です。

FLUX.2は、企業のエンジニアクリエイターが「使える」ツールとして設計されています。APIによる手軽な導入と、自社ホストによる詳細な制御を両立できる点は、AI活用生産性を高めるための重要な要素となるでしょう。

GoogleがGemini 3発表も画像生成の安全性に重大な懸念

Gemini 3とエージェント機能

推論力とコーディング機能が大幅向上
雑務を自律処理するGemini Agent
話速やトーン調整可能なGemini Live

クリエイティブ機能とリスク

画像合成・図表作成のNano Banana Pro
詳細制御が可能な動画生成Veo 3.1
生成画像安全ガードレールに欠陥

Googleは11月21日、推論能力を強化した最新AIモデル「Gemini 3」や、高機能な画像生成ツール「Nano Banana Pro」を発表しました。生産性を高める新機能が多数追加された一方で、画像生成における安全対策の不備が指摘されており、ビジネス利用にはコンプライアンス面での注意が必要です。

Gemini 3では「Vibe Coding」と呼ばれるコーディング支援機能が飛躍的に向上したほか、カレンダー管理や手配業務を代行するGemini Agentが登場しました。音声対話機能Gemini Liveも進化し、話す速度やトーンの指示、特定のキャラクターになりきった対話が可能になるなど、ユーザー体験が洗練されています。

クリエイティブ領域では、新ツール「Nano Banana Pro」が画像のブレンドやポスター作成を容易にし、動画生成モデル「Veo 3.1」はキャラクターやスタイルの一貫性を保つ機能が強化されました。しかし米The Vergeの検証によると、Nano Banana Proでは歴史的な陰謀論や著作権侵害を含む画像が容易に生成可能であり、偽情報拡散のリスクが懸念されています。

Google最新AIが「買物代行」を実現、年末の時短を加速

自律型AIによる買物革命

指定予算内でGoogle自動決済を代行
AIが店舗に電話し在庫状況を確認
曖昧な要望から最適ギフトを提案

移動と計画の最適化

マップ上で経由地や駐車場を自然に相談
Gemini 3が視覚的な旅程を作成

管理とクリエイティブ

新モデルNano Bananaで高度画像編集
Gmailで購入品や配送を一元管理

Googleは2025年11月21日、ブラックフライデーやホリデーシーズンに向け、GeminiやPixelを活用してタスクを効率化する最新AI機能を発表しました。これらは単なる情報検索の枠を超え、AIがユーザーの代理として購入手続きや店舗への在庫確認を行う「エージェント型」への進化を象徴しており、多忙なビジネスパーソンの生産性を劇的に向上させる可能性を秘めています。

最大の注目点は、AIが実務を代行する「エージェント機能」の実装です。新たに導入されたAgentic Checkoutでは、商品の価格を追跡し、指定した予算を下回った瞬間にGoogleが自動で購入を完了させることが可能です。また、オンライン在庫が不明な商品については、AIが近隣店舗へ直接電話をかけて在庫を確認し、結果を報告してくれるため、商品探しや決済に費やす時間を大幅に削減できます。

移動や計画立案における意思決定支援も強化されました。GoogleマップにはGeminiが統合され、助手席の友人のように「途中で花を買える場所は?」「目的地の駐車場は?」といった質問に即答します。さらに、最新のGemini 3モデルを活用した旅行計画機能では、対話を通じて視覚的でインタラクティブな旅程表を生成できるため、複雑なスケジューリングが瞬時に完了します。

クリエイティブと情報管理の面でも進化が見られます。画像生成・編集モデルNano Banana Proを使えば、写真の角度変更や照明調整、集合写真の表情修正などがプロレベルで行えます。また、Gmailには購入履歴や配送状況を一元管理するタブが新設され、スプレッドシートでの予算管理機能と合わせ、年末の煩雑な事務作業をスマートに処理できるようになります。

Apple Shortcuts×AI統合で業務自動化が劇的進化

AIモデルを自由に選択可能

テキスト校正・要約・画像生成に対応
Use Modelで自由な指示が可能
デバイス内やChatGPTを選択可

自分専用ツールの構築

非構造化データからの情報抽出
メールからカレンダー登録を自動化
自分専用の業務効率を実現

Appleは「Shortcuts」にApple Intelligenceを統合し、AIによる高度な自動化を実現しました。従来の操作に加え、AIの判断や処理を組み込むことで、個人の生産性を飛躍的に高める機能として注目されています。

特筆すべきは「Use Model」アクションの追加です。ユーザーはデバイス内のローカルモデルやChatGPTを選択し、任意のプロンプトでテキスト処理が可能です。これにより校正や要約に加え、複雑なデータ整形も容易になりました。

例えば、メール等の非構造化テキストからイベント情報を抽出する活用法があります。クリップボードの内容から日時や場所をAIに特定させ、カレンダーへ自動登録する仕組みを作ることで、日々の入力作業を大幅に短縮できます。

本機能は、AIを単なる対話相手ではなく、既存業務を強化する「部品」として扱う重要性を示しています。自らの課題に合わせAIツールを自作できる環境は、ビジネスパーソンの生産性向上に直結する強力な武器となるでしょう。

穴埋め式AI画像生成「Mixup」公開、元Google開発陣

穴埋め式でプロンプト不要

写真や手書きを高品質なAI画像に変換
Mad Libs形式で空白を埋めるだけ
GoogleNano Bananaを採用

共有と予測可能性を重視

他者の成功レシピを再利用可能
生成結果の予測不可能性を解消
友人の写真を加工できるMixables

Things, Inc.は2025年11月21日、AI画像編集アプリ「Mixup」をiOS向けにリリースしました。元GoogleのJason Toff氏らが開発したこのアプリは、写真や落書きを基に、穴埋め形式のプロンプトを使って直感的にAI画像を生成できる点が特徴です。

既存の生成AIツールは適切な指示を考えるのが難しいという課題がありましたが、Mixupはこれを「レシピ」として共有可能にすることで解決しました。他者の成功事例をテンプレートとして利用できるため、ユーザーは創造的な負担なく高品質な画像を作成できます。

技術基盤にはGoogleの「Nano Banana」モデルを採用しており、元の画像の特徴を不気味にならずに維持することが可能です。また、生成結果とプロンプトをセットで表示することで、AI画像生成における出力の予測不可能性を低減させています。

ソーシャル機能も強化されており、フォローした友人の写真を素材として利用できる「Mixables」機能を搭載しています。現在は招待制で、無料クレジットを使い切った後はサブスクリプション形式での課金となります。

Swatch×OpenAI、「世界に一つ」の時計を対話型AIでデザイン

AIで自分だけの時計を生成

OpenAI画像生成技術を活用
ケース裏に「1/1」の刻印

ブランド資産と安全性の両立

40年分の自社アーカイブを学習
不適切画像を排除するガードレール
CEOは「自由度」確保に注力

今後の展望と課題

スイスで先行開始、順次世界展開
人気モデルMoonSwatchは未対応
複雑な製造工程がボトルネック

スイスの時計メーカーSwatchは、OpenAIの技術を活用した新ツール「AI-DADA」を発表しました。ユーザーが入力するテキストに基づき、オリジナルの時計デザインを生成できるサービスです。11月21日からスイスで先行提供され、価格は約210ドル(約3.2万円)です。

最大の特徴は、生成AIによる「世界に一つだけのデザイン」を実現する点です。ユーザーは1日3回までプロンプト入力が可能で、生成結果は同社の「New Gent」モデルに適用されます。完成品の裏蓋には「1/1」のマークが刻印され、その希少性が保証されます。

AIモデルは、Swatchの過去40年間にわたるデザインアーカイブを優先的に参照します。これにより、ブランドの文脈を踏まえた生成が可能です。また、CEOはOpenAIの標準的な制限を一部緩和し、より自由で創造的な表現を許容するよう調整したとしています。

一方で、大ヒット商品「MoonSwatch」への対応は、製造工程の複雑さを理由に見送られました。しかし、同社は将来的な対応や他モデルへの展開について含みを残しています。デジタル技術と製造業の融合による、新たな顧客体験の創出として注目されます。

Google新画像AI「Nano Banana Pro」 正確な文字と高度編集で業務変革

文字・図解・論理に強いプロ仕様

Gemini 3 Pro基盤の高度な推論
画像内の文字レンダリングが飛躍的向上
検索連携で正確なインフォグラフィック生成
照明やアングルなど細部編集が自在

企業実装と開発者向け機能

最大4K解像度の高精細出力に対応
キャラやブランド一貫性を維持可能
API・Vertex AI経由で業務アプリに統合
SynthID透かしで生成元を明示

Googleは2025年11月20日、最新の画像生成AIモデル「Nano Banana Pro(正式名:Gemini 3 Pro Image)」を発表しました。同社の最新LLM「Gemini 3 Pro」の推論能力を基盤とし、従来の画像生成AIが苦手としていた正確なテキスト描写や、複雑な指示への忠実性を大幅に強化しています。プロフェッショナルや企業利用を想定し、高解像度出力や高度な編集機能を備え、生産性向上に直結するツールとして設計されています。

本モデル最大の特徴は、テキストレンダリングの正確さと論理的な構成力です。画像内に長文や複雑なタイトルをスペルミスなく配置できるほか、多言語対応によりパッケージデザインの翻訳やローカライズも瞬時に行えます。また、Google検索と連携してリアルタイム情報を取得し、天気予報やスポーツ結果などのデータを反映した信頼性の高いインフォグラフィックを一発で生成することも可能です。

クリエイティブ制作の現場で求められる高度な制御機能も搭載されました。ユーザーは照明(昼から夜へ)、カメラアングル、被写界深度などを後から調整できるほか、最大14枚の参照画像を合成して一つのシーンを作り上げることができます。特に、キャラクターや製品の一貫性を保ったまま別のアングルやシーンを生成する機能は、広告制作やストーリーボード作成における工数を劇的に削減します。

企業導入を見据え、エコシステムへの統合も進んでいます。開発者Gemini APIやGoogle AI Studioを通じて利用できるほか、Vertex AI経由でのエンタープライズ利用も可能です。生成画像には不可視の電子透かし「SynthID」が埋め込まれ、AI生成コンテンツの透明性を担保します。価格は標準画像で約0.13ドルからと高めですが、学習データへの利用除外など、企業向けのセキュリティ基準を満たしています。

Poeが複数AIモデル併用のグループチャット機能を開始

200以上のモデルを集約

最大200人のユーザーが参加可能
200種以上のAIを利用可能
GPT-5.1など最新モデルに対応

チームでの創造的活用

複数AIと同時コラボが可能
画像動画生成もチャット内で完結
デバイス間で履歴を即時同期

コラボレーションの新潮流

OpenAIも類似機能を試験運用中
1対1から協働空間へ進化
独自ボットの作成・共有も可能

Quoraが運営するAIプラットフォーム「Poe」は18日、複数のAIモデルを併用できるグループチャット機能を開始しました。最大200人のメンバーと共に、200種類以上のAIモデルを一つの会話内でシームレスに活用できる画期的な機能です。

特筆すべきはモデルの多様さです。最新のGPT-5.1Claude 4.5 Sonnet動画生成Sora 2 Proなど、目的に応じて最適なモデルを使い分けられます。これにより、単なる対話を超えたマルチモーダルな協働作業が可能になります。

この動きは、AIチャットボットが「個人の助手」から「チームの協力者」へと進化する流れを象徴しています。OpenAIも試験運用を始めており、今後はAIを交えた多人数での共創がビジネスや日常の標準的なスタイルになっていくでしょう。

活用例として、チームでのブレインストーミングが挙げられます。検索に強いAIで情報を集め、画像生成AIで資料を作るなどの連携が可能です。独自のボットを作成・共有することで、未知のユースケースが生まれることも期待されています。

ChatGPT、チーム協業の新機能 日本で先行公開

チームでAIと共同作業

日本など4地域で試験導入
最大20人が同時利用可能
無料プランから利用できる
招待リンクで簡単参加

最新モデルと安全設計

高性能なGPT-5.1 Autoを搭載
画像生成・ファイル共有も可
会話内容は学習データに不使用
人間同士の会話は上限対象外

OpenAIは2025年11月14日、日本、ニュージーランド、韓国、台湾の4地域で、ChatGPTの新機能「グループチャット」のパイロット版を公開しました。これにより、最大20人のユーザーが単一のチャット空間でAIと対話しながら共同作業できます。本機能はチームでの生産性向上や新たなコラボレーションの形を模索する企業にとって、重要な試金石となりそうです。

グループチャットの利用は簡単です。新規または既存のチャットでアイコンを選び、参加者を招待するだけ。共有リンクでの参加も可能で、無料プランを含む全ユーザーが対象です。グループはサイドバーに整理され、簡単にアクセスできます。既存の会話から派生させても、元の対話は保護される設計となっています。

この新機能は、最新のGPT-5.1 Autoモデルを搭載。文脈に応じて最適なモデルを自動で選択し、高度な対話を実現します。さらに、ウェブ検索画像生成、ファイルアップロードといった既存の強力な機能もグループ内で利用可能です。特筆すべきは、人間同士のメッセージ交換はプランごとの利用上限にカウントされない点でしょう。

OpenAIプライバシー保護を重視しています。グループチャットでの会話は、ユーザー個人の応答を最適化する「メモリ」機能から完全に独立しており、モデルの学習データとして使用されることはありません。これにより、機密性の高いアイデアの議論やプロジェクトの共同作業も安心して行えます。未成年者向けのコンテンツフィルターも標準で搭載されています。

本機能は、ChatGPTを単なる対話ツールから「共有のコラボレーション空間」へと進化させるOpenAIの戦略の第一歩です。MicrosoftAnthropicといった競合も共同作業機能を強化しており、AIアシスタント市場の競争は新たな局面に入りました。今回のパイロット運用で得られたフィードバックを基に、今後、対象地域や機能が拡充される見込みです。

企業にとって、この機能は大きな可能性を秘めています。エンジニアチームのブレインストーミング、マーケティング部門のコンテンツ共同制作、さらにはデータ分析チームの知見共有など、部門横断的なプロジェクトでの活用が期待されます。API経由での利用は現時点で未定ですが、今後の動向が企業のAI導入戦略を大きく左右するでしょう。

AIの母、3D世界生成モデル「Marble」発表

「空間知能」が拓く新境地

テキストや動画から3D世界を生成
AIの次なるフロンティアと位置付け
Unreal Engine等と互換

Marbleの概要と可能性

月額20ドルからの商用プラン提供
映画制作や建築ロボット工学で活用
企業のデータ可視化にも応用可能

「AIの母」として知られるスタンフォード大学のフェイフェイ・リー教授が共同設立したWorld Labsは今週、初の商用製品「Marble」を発表しました。テキストや画像から3D世界を自動生成するこのAIモデルは、同社が提唱する「空間知能」という新領域を切り拓くものです。同社はこの分野をAIの次なるフロンティアと位置づけ、既に2億3000万ドルを調達しています。

「Marble」は、ユーザーが入力したプロンプトに基づき、ダウンロード可能な3D環境を構築します。生成されたデータは、ゲーム開発で広く使われるUnreal EngineUnityといったツールと互換性があり、専門家でなくとも迅速にアイデアを形にできるのが特徴です。これにより、制作プロセスの大幅な効率化が期待されます。

リー氏は、「空間知能」を「今後10年の決定的な課題」と定義しています。従来のテキストや画像生成AIの次に来る大きな波であり、AIが3D世界を認識し、対話し、生成する能力を持つことで、全く新しい応用が可能になると考えています。このビジョンが、昨年秋の大型資金調達につながりました。

活用範囲は多岐にわたります。映画制作者がロケハンやVFXのたたき台を作ったり、建築家が設計案を即座に視覚化したりすることが可能です。さらに、ロボット工学におけるシミュレーション環境の構築や、科学的発見のためのデータ可視化など、エンタープライズ領域での活用も期待されています。

「Marble」には4つの料金プランが用意されています。無料版から、月額35ドルで商用利用権が付与されるプロ版、月額95ドルで生成回数が最大75回となるマックス版まで、多様なニーズに対応しています。個人クリエイターから大企業まで、幅広い層の利用を見込んでいます。

World Labsの共同創業者ベン・マイルデンホール氏は、「人間のチームだけでは膨大な時間と労力がかかる世界構築を、AIが劇的に変える」と語ります。アイデアの創出から編集までのサイクルを高速化することで、人間の想像力を超える空間創造が加速するかもしれません。今後の展開が注目されます。

NVIDIA新GPU、AI学習ベンチマークで全制覇

Blackwell Ultraの圧倒的性能

MLPerf全7部門を完全制覇
LLM学習でHopper比4倍以上の性能
Llama 3.1 405Bをわずか10分で学習
唯一全テストに結果を提出した企業

新技術が支える記録更新

史上初のNVFP4精度での計算を導入
GB300 NVL72システムが初登場
画像生成モデルでも最高性能を記録
広範なパートナーエコシステムを証明

NVIDIAは、AIの性能を測る業界標準ベンチマーク「MLPerf Training v5.1」において、新GPUアーキテクチャ「Blackwell Ultra」を搭載したシステムで全7部門を制覇し、大規模言語モデル(LLM)の学習速度で新記録を樹立しました。この結果は、同社の技術的優位性とプラットフォームの成熟度を改めて示すものです。

今回初登場したBlackwell Ultra搭載の「GB300 NVL72」システムは、前世代のHopperアーキテクチャと比較して、同数のGPUでLLMの事前学習性能が4倍以上に向上しました。新しいTensor Coreや大容量メモリが、この飛躍的な性能向上を支えています。

性能向上の鍵は、MLPerf史上初となるNVFP4精度での計算です。より少ないビット数でデータを表現し、計算速度を大幅に高める新技術を導入。NVIDIAは、精度を維持しながらこの低精度計算を実用化した唯一の企業となりました。

大規模な学習においても新記録を達成しました。5,000基以上のBlackwell GPUを連携させることで、大規模モデル「Llama 3.1 405B」の学習をわずか10分で完了。これは、NVFP4の採用とスケーリング効率の向上による成果です。

今回から追加された新しいベンチマーク、軽量LLM「Llama 3.1 8B」と画像生成モデル「FLUX.1」でも、NVIDIA最高性能を記録しました。これは、同社のプラットフォームが最新の多様なAIモデルに迅速に対応できる汎用性の高さを示しています。

DellやHPEなど15のパートナー企業もNVIDIAプラットフォームで参加し、広範なエコシステムを証明しました。NVIDIA1年周期で革新を続けており、AI開発のさらなる加速が期待されます。AI導入を目指す企業にとって、その動向はますます重要になるでしょう。

GoogleフォトAI編集、新モデルでiOSにも拡大

新AIモデルで編集が進化

最新AIモデルNano Banana搭載
サングラス除去など個人に最適化した修正
写真を絵画風などに作風変換する新機能

対話型編集、iOSへ拡大

声やテキストで編集指示する機能がiOS対応
写真検索「Ask Photos」も多言語・多地域へ展開
メッセージアプリでもAI画像編集が可能に

Googleは2025年11月11日、同社の最新画像編集AIモデル「Nano Banana」を搭載し、「Googleフォト」と「Googleメッセージ」の機能を大幅に強化すると発表しました。今回のアップデートでは、声やテキストで編集を指示できる会話型編集機能がiOSにも拡大されるのが最大の目玉です。これにより、膨大な数のiPhoneユーザーも、より直感的かつ高度なAI写真編集機能を利用できるようになります。

機能強化の核となるのが、最新AIモデルNano Bananaです。このモデルにより、従来より高品質な画像生成・編集が可能になりました。例えば「友人のサングラスを外して」といった指示で、その人物の他の写真を参考に、違和感なくサングラスを消すといった個人に最適化された修正が実現します。また、写真をルネサンス絵画風やモザイクアート風に変換するなど、創造性を刺激する機能も追加されました。

特に注目すべきは、これまでAndroid端末に限定されていた会話型編集機能『Help me edit』iOSへの展開です。iPhoneユーザーは今後、複雑な編集ツールを操作することなく、「空をもう少し青くして」といった自然な言葉で、思い通りの写真編集が可能になります。これは、Appleの純正写真アプリとの競争において、Googleの大きな強みとなる可能性があります。

編集機能だけでなく、写真の活用を促進する新機能も拡充されます。Android向けには、プロのポートレート風やホリデーカードなど、人気の編集をすぐに適用できる「AIテンプレート」が導入されます。また、自然言語で写真を検索できる「Ask Photos」機能は、新たに100以上の国と17の言語に対応し、世界中のユーザーが利用できるようになります。

さらに、AIによる画像編集機能は「Googleメッセージ」アプリにも『Remix』として統合されます。これにより、チャット内で友人から送られてきた写真を直接編集し、全く新しい画像に作り変えて返信するなど、コミュニケーションをより豊かにする新しい体験が可能になります。この機能はAndroid限定で提供が開始されます。

今回のアップデートは、GoogleがAI技術を自社サービスに深く統合し、ユーザー体験を根本から変革しようとする強い意志の表れです。単なる写真の保管・編集ツールから、AIを駆使して思い出を再発見し、創造性を高め、コミュニケーションを促進するプラットフォームへと進化を遂げようとしています。

Adobe Firefly、生成AIを統合した新基盤

Fireflyの統合機能

着想から制作までを支援
複数AIモデルを一元管理
画像動画音声のフル生成
手間を省くクイックアクション

独自のクレジット制度

機能ごとにクレジットを消費
モデルや出力品質で変動
有料プランは標準機能が無制限

商用利用について

アドビ製モデルは商用利用可
パートナー製モデルは要注意

アドビが提供する「Firefly」は、単なる画像生成AIではありません。アドビ自社モデルに加え、GoogleOpenAIなどのサードパーティ製AIモデルを統合した、クリエイティブワークフローのための包括的な生成AIツール群です。画像動画の生成から編集、アイデア出しまで、あらゆるクリエイティブ作業を一つのプラットフォーム上で完結させることを目指しています。

Fireflyの機能は大きく4つに分類されます。無限のキャンバスでアイデアを練る「着想」、テキストから画像動画を生成する「生成」、動画の自動キャプション付けなどを行う「制作」、そしてファイル変換といった定型作業を効率化する「クイックアクション」です。これらを組み合わせることで、制作プロセス全体を加速させます。

Fireflyの利用には「生成クレジット」という独自の制度が採用されています。使用するAIモデルや出力品質に応じて消費クレジット数が変動する従量課金的な側面を持ちます。例えば、Googleの最新モデルは高コストに設定されるなど、機能によって消費量が異なるため、利用計画には注意が必要です。

料金プランは無料版から月額200ドルのプレミアム版まで4種類が用意されています。有料プランでは、基本的な生成機能が無制限で利用でき、割り当てられたクレジットをより高度な「プレミアム機能」に集中して使用できます。Creative CloudのProプランにもFirefly Pro相当の機能が含まれます。

ビジネスユーザーにとって最も重要な商用利用については、明確な指針が示されています。アドビが自社データでトレーニングしたFireflyモデルで生成したコンテンツは商用利用が可能です。一方、パートナー企業が提供するモデルを使用する場合は、著作権侵害のリスクがないか個別に確認する必要があります。

Adobe Fireflyは、乱立する生成AIツールを一つに集約し、クリエイターや企業がAIをよりシームレスに活用するための強力な基盤となりつつあります。今後、クリエイティブ産業の生産性を大きく変革する可能性を秘めていると言えるでしょう。

拡散モデルAIに5千万ドル、コード生成を高速化

資金調達と背景

Inceptionが5千万ドルを調達
スタンフォード大教授が主導
MSやNVIDIAなど大手も出資

技術的な優位性

画像生成技術をテキスト・コードに応用
逐次処理から並列処理へ移行
低遅延・低コストでのAI開発
毎秒1000トークン超の生成速度

AIスタートアップのInceptionは11月6日、テキストおよびコード生成向けの拡散モデル開発のため、シードラウンドで5000万ドル(約75億円)を調達したと発表しました。スタンフォード大学の教授が率いる同社は、画像生成AIで主流の技術を応用し、従来のモデルより高速かつ効率的なAI開発を目指します。

拡散モデルは、GPTシリーズなどが採用する自己回帰モデルとは根本的に異なります。自己回帰モデルが単語を一つずつ予測し、逐次的に文章を生成するのに対し、拡散モデルは出力全体を反復的に洗練させるアプローチを取ります。これにより、処理の大幅な並列化が可能になります。

この技術の最大の利点は、圧倒的な処理速度です。Inceptionのモデル「Mercury」は、ベンチマークで毎秒1,000トークン以上を生成可能だと報告されています。これは従来の技術を大幅に上回る速度であり、AIの応答時間(レイテンシー)と計算コストを劇的に削減する可能性を秘めています。

今回の資金調達はMenlo Venturesが主導し、MicrosoftのM12ファンドやNvidiaのNVenturesなど、業界を代表する企業や投資家が参加しました。この事実は、テキスト生成における拡散モデルという新しいアプローチへの高い期待を示していると言えるでしょう。

テキスト生成AIの分野では自己回帰モデルが主流でしたが、特に大規模なコードベースの処理などでは拡散モデルが優位に立つ可能性が研究で示唆されています。Inceptionの挑戦は、今後のソフトウェア開発のあり方を大きく変えるかもしれません。

英AI著作権裁判、Stability AIが実質勝소

判決の要点

商標権侵害は認定
著作権侵害は棄却
AI学習の合法性は判断せず
Stability AIが実質勝訴

今後の焦点

米国での同種訴訟の行方
クリエイターとAI企業の対立
法整備の遅れが浮き彫りに
和解や提携の動きも活発化

英国高等法院は11月5日、画像生成AI「Stable Diffusion」を巡り、ストックフォト大手ゲッティイメージズが開発元のStability AIを訴えていた裁判で、Stability AI側に有利な判決を下しました。ゲッティのウォーターマーク(透かし)を再現したことによる商標権侵害は認定されたものの、AIの学習データ利用という核心的な著作権問題については判断が回避され、法的な不透明さが残る結果となりました。

判決の焦点は、著作権と商標権の侵害の有無でした。裁判所は、Stable Diffusionがゲッティの透かし入り画像を生成した点を商標権侵害と認定しました。一方で、著作権の二次的侵害については「AIモデルは著作権物を保存・複製していない」としてゲッティの主張を退け、Stability AIが実質的に勝訴した形です。

しかし、今回の裁判で最も注目された「著作権で保護された画像のAI学習への利用」という根幹的な論争に決着はつきませんでした。これは、ゲッティ側が証拠不十分を理由に裁判の途中でこの主要な訴えを取り下げたためです。結果として、英国におけるAIと著作権の明確な法的指針は示されないままとなりました。

この問題は、舞台を米国に移して争いが続きます。ゲッティはカリフォルニア州でもStability AIを相手に同様の訴訟を起こしており、そちらの判決が次の焦点です。一方で、AI企業と権利者の間では対立だけでなく、音楽業界のように戦略的提携に至るケースも出てきており、その動向は一様ではありません。

AI開発者経営者にとって、今回の判決は一安心材料かもしれません。しかし、AIの学習プロセスにおける著作権リスクが完全に払拭されたわけではない点に注意が必要です。各国の司法判断や法整備の動向を注視し、自社のAI開発・利用戦略を慎重に検討し続ける必要があるでしょう。

NVIDIA RTX、AIクリエイティブを劇的加速

AI制作の劇的な高速化

RTX 50シリーズのAI特化コア
生成AIモデルが最大17倍高速
主要制作アプリ135種以上を最適化

動画・3Dワークフロー革新

4K/8K動画もプロキシ不要で編集
リアルタイムでの3Dレンダリング
AIによるノイズ除去と高解像度化

配信・ストリーミング支援

専用エンコーダーで高画質配信
AIアシスタントによる配信作業の自動化

NVIDIAは、クリエイティブカンファレンス「Adobe MAX」において、同社のGeForce RTX GPU動画編集、3D制作、生成AIなどのクリエイティブな作業をいかに高速化するかを明らかにしました。AI時代に求められる膨大な計算処理を専用ハードウェアで実行し、アーティストや開発者生産性を飛躍的に向上させるのが狙いです。

RTX GPUの強みは、AI処理に特化した第5世代Tensorコアや、3Dレンダリングを高速化する第4世代RTコアにあります。さらにNVIDIA Studioが135以上のアプリを最適化し、ハードウェア性能を最大限引き出すことで、安定した制作環境を提供します。

特に生成AI分野で性能は際立ちます。画像生成AI「Stable Diffusion」は、Apple M4 Max搭載機比で最大17倍高速に動作。これによりアイデアの試行錯誤を迅速に行え、創造的なプロセスを加速させます。

動画編集では4K/8K等の高解像度コンテンツが課題でした。RTX GPUは専用デコーダーにより、変換作業なしでスムーズな編集を実現します。AIエフェクトの適用や書き出し時間も大幅に短縮され、コンテンツ公開までの速度が向上します。

3D制作の現場も大きく変わります。レイトレーシングを高速化するRTコアと、AIで解像度を高めるDLSS技術により、これまで時間のかかったレンダリングがリアルタイムで可能に。アーティストは結果をすぐに確認でき、創造的な作業に集中できます。

ライブ配信もより身近になります。専用エンコーダーNVENCがCPU負荷を軽減し、ゲーム性能を維持したまま高品質な配信を実現します。AIアプリ「Broadcast」を使えば、特別なスタジオがなくても背景ノイズ除去やカメラ補正が簡単に行えます。

NVIDIAのRTX GPUは、個別のタスク高速化だけでなく、制作ワークフロー全体を革新するプラットフォームです。AIを活用して生産性と収益性を高めたいクリエイターや企業にとって、不可欠なツールとなることは間違いないでしょう。

マイクロソフト、初の独自AI画像生成モデルを公開

独自モデル「MAI-Image-1」

MS初の独自開発AI画像生成モデル
モデル名は「MAI-Image-1」
写実的な風景や照明の生成に強み
速度と品質の両立をアピール

OpenAI依存脱却への布石か

BingとCopilotで提供開始
OpenAIモデルと並行して提供
Copilot音声ストーリーにも活用
AI開発の主導権確保を狙う動き

マイクロソフトは2025年11月4日、同社初となる自社開発のAI画像生成モデル「MAI-Image-1」を発表しました。この新モデルは、検索エンジンBingの画像生成機能やCopilotで既に利用可能となっています。大手IT企業がOpenAIへの依存度を下げ、独自のAI開発を加速させる動きとして注目されます。

「MAI-Image-1」は、特に食べ物や自然の風景、芸術的な照明、そして写実的なディテールの表現に優れているとされます。マイクロソフトは「速度と品質の両立」を強調しており、ユーザーはアイデアを素早く視覚化し、試行錯誤を重ねることが容易になります。

この新モデルは、Bing Image Creatorにおいて、OpenAIのDALL-E 3やGPT-4oと並ぶ選択肢の一つとして提供されます。また、Copilot音声合成機能では、AIが生成した物語に合わせてアートを自動生成する役割も担い、コンテンツ制作の幅を広げます。

今回の発表は、マイクロソフトがAI開発の主導権を確保しようとする大きな戦略の一環です。同社は8月にも独自の音声・テキストモデルを発表しており、OpenAIへの依存からの脱却を段階的に進めていると見られます。独自技術の強化は、今後の競争優位性を左右する鍵となるでしょう。

一方でマイクロソフトは、CopilotOpenAIの最新モデルGPT-5を導入するなど、マルチAIモデル戦略も同時に推進しています。自社開発と外部の高性能モデルを使い分けることで、あらゆるニーズに対応する構えです。最適なAI活用のバランスをどう取るのか、同社の動向から目が離せません。

ホワイトハウス新ホール、AI酷似の欠陥は人為ミス

AI生成を疑う声

行き止まりの階段
不自然に融合した窓
AI特有の不整合性に酷似
設計図との矛盾も多数

専門家が指摘する真相

AIではなく人為的エラー
拙速な計画と品質管理の欠如
通常の監督プロセスを省略
人間の作業ミスが原因

トランプ米大統領が公開したホワイトハウス新ホールの物理模型が、専門家から批判を浴びています。行き止まりの階段など、AI生成物に見られるような奇妙な欠陥が複数指摘されましたが、真相はAIではなく人為的なエラーのようです。拙速な計画進行が背景にあると見られています。

模型には、壁で行き止まりになる階段や不自然に融合した窓、設計図にない余分な柱など、構造上の矛盾が多数見られます。これらは、近年注目される画像生成AIが作り出す非論理的な描写と酷似しており、当初はAI使用の憶測を呼びました。

しかし、複数の建築専門家はこれを「お粗末な人間の仕事」と一蹴します。イリノイ大学のポール・プライスナー教授は「AIのせいにできるものではなく、品質管理がないだけだ」と指摘。極端に急がされたスケジュールが、初歩的なミスの原因だと分析しています。

この異例の速さの背景には、トランプ大統領による監督プロセスの軽視があります。政府建造物のデザインを審査する美術委員会の委員を全員解任し、通常経るべきレビューを省略して計画を強行したことが、今回の品質低下を招いたとみられています。

AI技術が浸透する現代において、その特有の「欠陥」が、人間の作業品質を測る一つの指標になりつつあるのかもしれません。今回の事例は、技術の有無に関わらず、厳格な品質管理と監督プロセスがいかに重要であるかを浮き彫りにしています。

AI発想支援Mixboard、180カ国超で提供開始

AIでアイデアをカタチに

実験的なAIコンセプトボード
テキストや画像自由に配置
AIによる画像生成・編集機能

世界展開と機能アップデート

提供国を180カ国以上に拡大
ユーザーの声でボード面積が4倍
企画や設計など多様な用途で活用

Googleは2025年10月30日、AIを活用した実験的なコンセプトボード「Mixboard」の提供を、新たに180カ国以上に拡大したと発表しました。このツールは、AIによる画像やテキストの生成・編集機能を持ち、ユーザーがアイデアを視覚的に探求し、具体化することを支援します。ビジネスの企画から個人の創作活動まで、幅広い活用が期待されます。

Mixboardの核となるのは、Google画像モデル「Gemini」を基盤とする「Nano Banana」です。ユーザーは簡単な指示で画像新規生成したり、既存の画像を編集したりできます。また、テキストブロックの自動生成や、手持ちの画像をボードにインポートすることも可能で、直感的な操作でアイデアを自由に配置、整理できます。

今回の発表では、提供国の拡大に加え、大幅な機能改善も行われました。9月の提供開始以降に寄せられたユーザーからのフィードバックを反映し、ボードの面積を従来の4倍に拡張。これにより、より複雑で大規模なアイデアも、一つのボード上でストレスなく展開できるようになりました。

すでにMixboardは多様なシーンで活用されています。公式ブログでは、パーティの企画、DIYプロジェクトの設計、アイデアのストーリーボード化といった事例が紹介されています。視覚的なブレインストーミングツールとして、チームでの共同作業や個人の創造性を飛躍的に高める可能性を秘めています。

Mixboardは、最新技術を試す「Google Labs」発の実験的なプロジェクトです。今回のグローバル展開と機能強化は、AIが創造的なプロセスを支援するツールとして本格的に普及する一歩と言えるでしょう。今後のさらなる進化に注目が集まります。

Figma、AI動画生成Weavy買収 デザイン機能強化へ

買収の概要

デザイン大手Figmaがイスラエル企業を買収
買収額は非公開、従業員20名が合流
ブランド「Figma Weave」として統合予定

Weavyの強み

複数AIモデルで画像動画を生成
プロンプト微調整可能な高度編集機能
ノードベースで生成物を分岐・リミックス

今後の展望

当面はスタンドアロン製品として提供
Figmaのプラットフォームに順次統合

デザインプラットフォーム大手のFigmaは10月30日、AIによる画像動画生成を手がけるイスラエルのスタートアップWeavyを買収したと発表しました。Weavyの従業員20名がFigmaに合流し、同社の技術は新ブランド「Figma Weave」として将来的にはFigmaのプラットフォームに統合されます。この買収により、FigmaはデザインプロセスにおけるAI生成能力を大幅に強化する狙いです。

Weavyは2024年にテルアビブで設立された新興企業です。創業から1年足らずで、シードラウンドにて400万ドルを調達するなど注目を集めていました。同社のツールは、ユーザーが複数のAIモデルを組み合わせて高品質な画像動画を生成し、プロ向けの編集機能で細かく調整できる点が特徴です。

Weavyの技術的な強みは、その柔軟な生成プロセスにあります。ユーザーは無限キャンバス上で、画像生成動画生成プロンプトを組み合わせるなど自由な発想でメディアを作成できます。この「ノードベース」のアプローチにより、生成結果を分岐させたり、リミックスしたりと、創造的な試行錯誤と改良が容易になります。

Figmaによると、Weavyは当面スタンドアロン製品として提供が継続されます。その後、新ブランド「Figma Weave」としてFigmaのプラットフォーム全体に統合される計画です。Figmaのディラン・フィールドCEOは、Weavyの「シンプルさ、親しみやすさ、そしてパワフルさのバランス」を高く評価しており、統合によるシナジーに期待を寄せています。

AIデザインツールの市場は競争が激化しています。AI検索Perplexityデザインツールチームを買収するなど、大手テック企業によるAIクリエイティブ領域への投資が活発化しています。今回の買収は、デザインワークフローのあらゆる段階にAIを組み込もうとするFigmaの強い意志を示すものであり、今後の業界の動向を占う上で重要な一歩と言えるでしょう。

OpenAI、推論で安全性を動的分類する新モデル公開

新モデルの特長

開発者安全方針を直接定義
推論ポリシーを解釈し分類
判断根拠を思考過程で透明化
商用利用可能なオープンモデル

従来手法との違い

ポリシー変更時の再学習が不要
大量のラベル付きデータが不要
新たな脅威へ迅速な対応が可能

性能と実用上の課題

小型ながら高い分類性能を発揮
処理速度と計算コストが課題

OpenAIは2025年10月29日、開発者が定義した安全方針に基づき、AIが推論を用いてコンテンツを動的に分類する新しいオープンウェイトモデル「gpt-oss-safeguard」を発表しました。このモデルは、従来の大量データに基づく分類器とは異なり、ポリシー自体を直接解釈するため、柔軟かつ迅速な安全対策の導入を可能にします。研究プレビューとして公開され、コミュニティからのフィードバックを募ります。

最大の特徴は、AIの「推論能力」を活用する点です。開発者は自然言語で記述した安全方針を、分類対象のコンテンツと共にモデルへ入力します。モデルは方針を解釈し、コンテンツが方針に違反するかどうかを判断。その結論に至った思考の連鎖(Chain-of-Thought)」も示すため、開発者は判断根拠を明確に把握できます。

このアプローチは、従来の機械学習手法に比べて大きな利点があります。従来、安全方針を変更するには、数千件以上の事例データを再ラベル付けし、分類器を再学習させる必要がありました。しかし新モデルでは、方針テキストを修正するだけで対応可能です。これにより、巧妙化する新たな脅威や、文脈が複雑な問題にも迅速に適応できます。

例えば、ゲームのコミュニティサイトで不正行為に関する投稿を検出したり、ECサイトで偽レビューを特定したりと、各サービスの実情に合わせた独自の基準を容易に設定・運用できます。大規模なデータセットを用意できない開発者でも、質の高い安全分類器を構築できる道が開かれます。

性能評価では、社内ベンチマークにおいて、基盤モデルである「gpt-5-thinking」を上回る精度を示しました。一方で、特定の複雑なリスクに対しては、大量のデータで専用に訓練された従来の分類器に劣る場合があることや、推論プロセスに伴う計算コストと処理遅延が課題であることも認めています。

OpenAIは、社内ツール「Safety Reasoner」で同様のアプローチを既に採用しており、GPT-5画像生成AI「Sora 2」などの安全システムの中核を担っています。今回のオープンモデル公開は、こうした先進的な安全技術を広く共有し、コミュニティと共に発展させることを目指すものです。モデルはHugging Faceからダウンロード可能で、Apache 2.0ライセンスの下で自由に利用、改変、配布ができます。

Meta、SNSにAI生成コンテンツ大量投入へ

AIが拓くSNSの新時代

友人・家族中心の第一期
クリエイター中心の第二期
AI生成コンテンツ第三の波

レコメンド技術が鍵

AI投稿を深く理解するシステム
ユーザーに最適なコンテンツを提示
AI動画アプリ「Vibes」で実験

好調な業績が後押し

第3四半期売上は26%増の好業績
「Vibes」で200億超画像生成

Metaのマーク・ザッカーバーグCEOは2025年10月29日の第3四半期決算発表で、FacebookInstagramなどのソーシャルフィードにAI生成コンテンツを大量に統合する計画を明らかにしました。AIによってコンテンツ作成が容易になることを背景に、これをソーシャルメディアの「第三の時代」を切り拓く重要な戦略と位置づけています。

ザッカーバーグ氏は、ソーシャルメディアの進化を二つの時代に分けて説明しました。第一の時代は友人や家族の投稿が中心、第二の時代はクリエイターコンテンツの台頭です。そして今、AIがもたらすコンテンツの爆発的な増加が、第三の大きな波になるとの見方を示しました。これは、私たちの情報消費のあり方を根本から変える可能性があります。

この変革の鍵を握るのが、レコメンデーションシステムです。AIが生成した膨大な投稿をシステムが「深く理解」し、個々のユーザーにとって最も価値のあるコンテンツを的確に表示する能力が、これまで以上に重要になるとザッカーバーグ氏は強調します。コンテンツの質と量のバランスをどう取るかが、今後の大きな課題となるでしょう。

Metaは既にこの未来に向けた布石を打っています。AI動画フィードアプリ「Vibes」では、ユーザーによって200億以上画像が生成されるなど、具体的な成果も出始めています。これはAIが可能にする全く新しいコンテンツ体験のほんの一例に過ぎません。

この大胆なAI戦略を支えているのが、同社の好調な業績です。第3四半期の売上は前年同期比26%増の512.4億ドルに達しました。潤沢な資金を背景に、MetaはAI分野への積極的な投資を続け、ソーシャルメディアの未来を再定義しようとしています。

Extropic、省エネAIチップでデータセンター覆す

新方式「熱力学チップ」

GPUとは根本的に異なる仕組み
熱のゆらぎを利用して計算
確率的ビット(p-bit)で動作
数千倍のエネルギー効率目標

初の試作機と将来性

初の実動ハードウェアを開発
AIラボや気象予測企業で試験
次世代機で拡散モデルを革新へ
データセンター電力問題に挑戦

スタートアップのExtropic社が、データセンターの常識を覆す可能性を秘めた新型コンピュータチップの最初の実動ハードウェアを開発しました。この「熱力学的サンプリングユニット(TSU)」は、従来のチップより数千倍のエネルギー効率を目指しており、AIの爆発的な普及に伴う莫大な電力消費問題への画期的な解決策として注目されています。

TSUは、GPUなどが用いる0か1のビットとは根本的に異なります。熱力学的な電子のゆらぎを利用して確率そのものを扱う「確率的ビット(p-bit)」で動作します。これにより、AIモデルや気象予測など、複雑なシステムの確率計算を極めて効率的に行えるようになります。この革新的なアプローチが、省エネ性能の鍵です。

同社は今回、初の試作機「XTR-0」を開発し、一部のパートナー企業への提供を開始しました。提供先には、最先端のAI研究を行うラボや気象モデリングを手がけるスタートアップ、さらには複数の政府関係者が含まれており、実環境での有用性の検証が始まっています。

パートナーの一社である気象予測AI企業Atmo社のCEOは、この新技術に大きな期待を寄せています。Extropicのチップを使えば、様々な気象条件が発生する確率を従来よりはるかに効率的に計算できる可能性があると述べており、より高解像度な予測モデルの実現につながるかもしれません。

Extropic社は、将来の展望も具体的に示しています。同社が発表した論文では、数千個のp-bitを搭載した次世代チップで、画像生成AIなどに用いられる「拡散モデル」を効率化できると説明。来年には25万p-bitを搭載したチップ「Z-1」の提供を目指しています。

この独自のアプローチは、業界専門家からも高く評価されています。ある専門家は「従来のトランジスタのスケーリングが物理的な限界に達する中、Extropic社の物理情報処理へのアプローチは、今後10年で変革をもたらす可能性がある」と指摘しています。

AIデータセンターへの巨額投資が続く一方で、そのエネルギー需要は深刻な課題です。Extropic社の挑戦は、ハードウェアの根本的な革新によってこの問題を解決しようとするものです。たとえ成功確率がわずかでも、試す価値のある重要な取り組みだと言えるでしょう。

Googleの教育AI、米1000大学で1000万人利用

教育現場でAI活用が加速

米国1000以上の高等教育機関が導入
利用学生数は1000万人を突破
MITやブラウン大学など名門校も採用
教育機関向けにデータ保護されたAIを提供

学習から就活まで支援

小テストや学習ガイドの個別生成
論文執筆のための情報要約・分析
証明写真や部屋の画像生成機能

Googleは2025年10月28日、同社の生成AI「Gemini for Education」が、米国の1000以上の高等教育機関で導入され、1000万人以上の学生に利用されていると発表しました。学習支援から就職活動まで幅広く活用されており、教育現場におけるAIの浸透が急速に進んでいます。

導入機関にはマサチューセッツ工科大学(MIT)やブラウン大学といった名門校も含まれます。Googleは、教育機関向けにデータ保護を強化したAIツールを無償で提供しており、これが急速な普及を後押ししていると考えられます。

学生教員は、Geminiを用いて試験対策用の小テストを作成したり、研究プロジェクトで必要な情報を要約・分析したりしています。また、寮の部屋のデザイン案や就職活動用の証明写真を生成するなど、学業以外でのクリエイティブな活用も広がっています。

今後は、簡単な指示(プロンプト)だけでプレゼンテーション資料を自動で作成し、Googleスライドにエクスポートする機能などが追加される予定です。これにより、学生教員生産性はさらに向上すると期待されます。

Gemini for Education」と研究ノートツール「NotebookLM」は、教育機関が利用する生産性向上スイートの種類を問わず、無償で導入可能です。GoogleはAI人材育成も視野に入れ、教育分野でのエコシステム構築を急いでいます。

Adobe、画像・音声生成AIを全方位で強化

Fireflyが大幅進化

新モデルFirefly Image 5登場
プロンプトレイヤー編集が可能に
独自スタイルでカスタムモデル作成

AIアシスタント登場

PhotoshopとExpressに搭載
自然言語で複雑な編集を自動化
複数アプリを統括するMoonlight

音声・動画生成も強化

動画に合わせたBGMを自動生成
テキストから高品質なナレーション生成

アドビは2025年10月28日、年次カンファレンス「Adobe Max 2025」で、生成AI機能群の大幅なアップデートを発表しました。中核となる画像生成AI「Firefly」の新モデルや、Photoshopなどに搭載されるAIアシスタント、BGMやナレーションを自動生成する音声ツールを公開。クリエイティブ制作の生産性と表現力を飛躍的に高めることを目指します。

画像生成AIの最新版「Firefly Image 5」は、性能が大きく向上しました。ネイティブで最大4メガピクセルの高解像度画像に対応するほか、オブジェクトを個別に認識しプロンプトで編集できるレイヤー機能を搭載。クリエイター自身の作品を学習させ、独自の画風を持つカスタムモデルを作成することも可能になります。

「Photoshop」と「Express」には、新たにAIアシスタントが導入されます。これにより、ユーザーは「背景を削除して」といった自然言語の指示で、複雑な編集作業を自動化できます。専門的なツール操作を覚える必要がなくなり、あらゆるスキルレベルのユーザーが、より直感的にアイデアを形にできるようになるでしょう。

動画制作者にとって画期的な音声生成機能も追加されました。「Generate Soundtrack」はアップロードされた動画の内容を解析し、最適なBGMを自動生成します。「Generate Speech」はテキストから自然なナレーションを作成。これらは商用利用も可能で、コンテンツ制作の効率を劇的に改善します。

将来構想として、複数アプリを統括するAIエージェント「Project Moonlight」も発表。このAIはCreative CloudやSNSアカウントと連携し、ユーザーの作風やブランド戦略を学習。一貫性のあるコンテンツの企画から制作、投稿戦略の立案までを支援する、まさに「クリエイティブディレクター」のような役割を担います。

アドビは自社モデルだけでなく、GoogleGeminiなどサードパーティ製AIモデルの採用も進めています。今回の発表は、クリエイティブの全工程にAIを深く統合し、制作プロセスそのものを変革しようとする同社の強い意志を示すものです。クリエイター生産性向上と、新たな表現の可能性が大きく広がりそうです。

画像生成AIの悪用、偽造領収書で経費不正が急増

生成AIによる不正の現状

画像生成AIで領収書を偽造
不正書類の14%がAI製との報告
90日で100万ドル超の不正請求も
財務担当者の3割が不正増を実感

偽造の手口と対策

テキスト指示だけで数秒で作成可能
専門家も「目で見て信用するな
経費精算システムのAI検知が重要

画像生成AIの進化が、企業の経費精算に新たな脅威をもたらしています。欧米企業で、従業員がOpenAIGPT-4oなどのAIを使い、偽の領収書を作成して経費を不正請求する事例が急増。経費管理ソフト各社は、AIによる不正検知機能の強化を急いでいます。これは、テクノロジーの進化がもたらす負の側面と言えるでしょう。

不正の規模は深刻です。ソフトウェアプロバイダーのAppZenによると、今年9月に提出された不正書類のうち、AIによる偽造領収書は全体の約14%を占めました。昨年は一件も確認されていなかったことからも、その増加ペースの速さがうかがえます。フィンテック企業Rampでは、新システムがわずか90日間で100万ドル以上の不正請求書を検出しました。

現場の危機感も高まっています。経費管理プラットフォームMediusの調査では、米国英国の財務専門家約3割が、OpenAIの高性能モデル「GPT-4o」が昨年リリースされて以降、偽造領収書の増加を実感していると回答。新たなAI技術の登場が、不正行為の明確な転換点となったことが示唆されています。

生成される領収書は極めて精巧で、人間の目での判別はほぼ不可能です。世界的な経費精算プラットフォームであるSAP Concurの幹部は「もはや目で見て信用してはいけない」と顧客に警告を発しています。同社では、AIを用いて月に8000万件以上コンプライアンスチェックを行い、不正の検出にあたっています。

なぜ、これほどまでに不正が広がったのでしょうか。従来、領収書の偽造には写真編集ソフトを扱う専門スキルや、オンライン業者への依頼が必要でした。しかし現在では、誰でも無料で使える画像生成AIに簡単なテキストで指示するだけで、わずか数秒で本物そっくりの領収書を作成できてしまうのです。

AI開発企業も対策を進めています。OpenAIは、規約違反には対処し、生成画像にはAIが作成したことを示すメタデータを付与していると説明します。しかし、悪意ある利用を完全に防ぐことは困難です。企業はもはや性善説に頼るのではなく、AIを活用した検知システムの導入が喫緊の課題となっています。

AIが作る偽の豪華休暇、新たな現実逃避市場が台頭

AIで偽の自分を生成

自分の顔写真から簡単生成
豪華な休暇を疑似体験
SNSでの見栄とは違う目的

現実逃避と自己実現

低所得者層が主な利用者
「引き寄せの法則」をAIで実践
叶わぬ願望を仮想体験

新たな課金モデル

少量画像生成課金誘導
C向けAIアプリの新潮流

AI技術を活用し、自分が豪華な休暇を楽しんでいるかのような偽の画像を生成するスマートフォンアプリが新たな注目を集めています。これらのアプリは、経済的な理由で旅行に行けない人々などに、一種の「デジタルな現実逃避」を提供。SNSでの見栄を張るためだけでなく、より良い人生を願う「引き寄せ」の一環として利用する動きが、特にアジアの若者などの間で広がっています。

この動きは、高級ブランドの模倣品を購入したり、プライベートジェット風のセットで写真を撮ったりする、従来の「富を偽る」行為の延長線上にあります。しかし、その目的は他者への誇示から、個人的な精神的満足へとシフトしている点が特徴です。AIが可能にした、よりパーソナルで没入感の高い体験が、新たな需要を生み出していると言えるでしょう。

具体的な事例として、インドネシアの状況が挙げられます。OpenAIコンサルタントによると、月収400ドル以下の低・中所得者層が集まるFacebookグループでは、ランボルギーニと写る自分など、AIが生成した豪華な体験写真が数多く共有されています。これは「決して生きられないであろう人生」を仮想的に体験する、現代的な現実逃避の形と言えます。

Metaデザイナーが開発した「Endless Summer」というアプリも、この潮流を象徴しています。このアプリは「燃え尽き症候群に陥った時に、偽の休暇写真で理想の生活を引き寄せる」というコンセプトを掲げています。数枚の自撮り写真を提供するだけで、世界中の観光地にいるかのような自分の画像を生成できる手軽さが特徴です。

ビジネスモデルとしては、数枚の画像を無料で生成させた後、より多くの画像を求めて有料プランへ誘導する手法が一般的です。例えば「Endless Summer」では30枚の画像生成に3.99ドルが必要となります。しかし、生成される画像の質はアプリによってばらつきがあり、本人とは似ても似つかない場合も少なくありません。

この「AIによる現実逃避」サービスは、消費者向けAIアプリの新たな市場可能性を示唆しています。一方で、デジタルな偽りの自己像への没入が、現実世界との乖離を助長するリスクもはらんでいます。経営者開発者は、人間の心理的な欲求を捉えたサービス開発と、その倫理的な課題の両面に目を向ける必要がありそうです。

ChatGPT、社内データ横断検索で業務を革新

社内情報の検索エンジン化

SlackやDriveと直接連携
複数アプリを横断した情報検索
アプリ切替不要で作業効率化

高精度な回答と信頼性

GPT-5搭載で高精度な回答
回答には出典を明記し信頼性確保
曖昧な質問にも多角的に回答

利用上の注意点

機能利用には手動選択が必要
ウェブ検索画像生成同時利用不可

OpenAIは2025年10月24日、法人および教育機関向けChatGPTに新機能「company knowledge」を導入したと発表しました。この機能は、SlackGoogle Driveといった社内ツールと連携し、組織内の情報を横断的に検索できるものです。アプリを切り替える手間を省き、情報探索の効率を飛躍的に高めることを目的としています。

新機能の最大の特徴は、ChatGPT社内情報のハブとして機能する点です。ユーザーは使い慣れたチャット画面から、Slackの会話、SharePointの文書、Google Driveの資料などを直接検索できます。これにより、散在する情報の中から必要なものを迅速に見つけ出すことが可能になります。

この機能は、最新のGPT-5モデルを基盤としています。複数の情報源を同時に検索・分析し、より包括的で精度の高い回答を生成するよう特別に訓練されています。これにより、単純なキーワード検索では得られなかった洞察や要約を提供します。競合のAnthropic社も同様の機能を発表しており、AIの業務活用競争が激化しています。

回答の信頼性も重視されています。すべての回答には明確な出典が引用として表示されるため、ユーザーは情報の出所を簡単に確認できます。例えば、顧客との打ち合わせ前に、関連メールや過去の議事録を基にしたブリーフィング資料を自動で作成するといった活用が可能です。

「来年の会社目標はどうなったか?」といった曖昧な質問にも対応します。ChatGPTは複数の情報源から関連情報を探し出し、矛盾する内容を整理しながら、総合的な回答を提示します。日付フィルター機能も備え、時系列に沿った情報検索も得意とします。

ただし、利用にはいくつかの注意点があります。現時点では、この機能を使うには会話を開始する際に手動で選択する必要があります。また、有効化している間はウェブ検索やグラフ・画像の生成といった他の機能は利用できません。OpenAIは今後数ヶ月で機能拡張を予定しています。

Mistral、企業向けAI開発・運用基盤を発表

AI開発の本番運用を支援

試作から本番運用への移行を促進
EU拠点のインフラデータ主権を確保
専門家以外も使える開発ツール

統合プラットフォームの3本柱

システムの振る舞いを可視化する可観測性
RAGも支える実行ランタイム
AI資産を一元管理するAIレジストリ

豊富なモデルと柔軟な展開

オープンソースから商用まで多数のモデル
クラウドやオンプレミスなど柔軟な展開

2025年10月24日、フランスのAIスタートアップMistral AIは、企業がAIアプリケーションを大規模に開発・運用するための新プラットフォーム「Mistral AI Studio」を発表しました。多くのAI開発が試作段階で止まってしまう課題を解決し、信頼性の高い本番システムへの移行を支援することが目的です。Googleなど米国勢に対抗する欧州発の選択肢としても注目されます。

同社はAI Studioを、AI開発における「プロダクションファビリック(生産基盤)」と位置付けています。AIモデルのバージョン管理や性能低下の追跡、コンプライアンス確保など、多くのチームが直面するインフラ面の課題解決を目指します。これにより、アイデアの検証から信頼できるシステム運用までのギャップを埋めます。

プラットフォームは3つの柱で構成されます。AIシステムの振る舞いを可視化する「可観測性」、検索拡張生成(RAG)なども支える実行基盤「エージェントランタイム」、そしてAI資産を一元管理する「AIレジストリ」です。これらが連携し、開発から監視、統制まで一貫した運用ループを実現します。

AI Studioの強みは、オープンソースから高性能な商用モデル、さらには画像生成音声認識モデルまでを網羅した広範なモデルカタログです。これにより企業は、タスクの複雑さやコスト目標に応じて最適なモデルを試し、柔軟に構成を組むことが可能になります。選択肢の多さは開発の自由度を高めます。

Pythonコードを実行する「コードインタプリタ」やWeb検索など、多彩な統合ツールも特徴です。これにより、単なるテキスト生成にとどまらず、データ分析やリアルタイムの情報検索、さらには画像生成までを一つのワークフロー内で完結させる、より高度なAIエージェントの構築が可能になります。

導入形態も柔軟です。クラウド経由での利用に加え、自社インフラに展開するオンプレミスやセルフホストにも対応。企業のデータガバナンス要件に応じて最適な環境を選べます。また、不適切なコンテンツをフィルタリングするガードレール機能も備え、安全なAI運用を支援します。

Mistral AI Studioの登場は、企業におけるAI活用の成熟度が新たな段階に入ったことを示唆します。モデルの性能競争から、いかにAIを安全かつ安定的に事業へ組み込むかという運用フェーズへ。同プラットフォームは、その移行を力強く後押しする存在となるでしょう。

グーグル、AIでハロウィン演出術。最新モデル活用法公開

画像・動画生成の最新AI

Nano Bananaで幽霊風の画像作成
90年代ホラー映画風ポスターを生成
ペットのコスチューム画像を自動生成
Veo 3.1で高品質なショート動画作成

アイデア創出からツール開発まで

Google Photosで写真をハロウィン風に加工
Mixboardでコスチューム案を視覚化
Canvasでカボチャ彫刻用アプリ開発

Googleは2025年10月24日、ハロウィンシーズンに向けて、同社の最新AIツール群を活用した画像動画の作成術を公式ブログで公開しました。画像生成モデル「Nano Banana」や動画生成モデル「Veo」などを使い、パーティーの招待状からSNSコンテンツまで手軽に作成する具体的なプロンプトを紹介しており、企業の季節イベント向けマーケティングのヒントとなりそうです。

中核となるのは画像生成モデルNano Bananaです。ユーザーは自身の写真と特定のプロンプトを組み合わせるだけで、ビクトリア朝時代の幽霊風ポートレートや90年代ホラー映画風のポスターなど、ユニークな画像を生成できます。精緻なプロンプトの記述方法も公開されており、プロンプトエンジニアリングの実践的な好例と言えるでしょう。

動画生成では、最新モデルVeo 3.1」が活躍します。プロンプトへの追従性が向上し、より物語性の高い動画作成が可能になりました。静止画を不気味なアニメーションに変換したり、テキストから秋の風景を描写したグリーティング動画を生成したりと、SNSマーケティングでの高い応用可能性を秘めています。

既存サービスへのAI統合も進んでいます。Google Photos」にはワンタップで写真をハロウィン風に加工する新機能が追加されました。また、アイデア出しツール「Mixboard」はコスチュームのブレインストーミングに、開発ツール「Canvas」は画像からカボチャの彫刻用テンプレートアプリを作成するといった実用的な活用法も示されています。

今回の発表は、AIが専門家だけでなく一般ユーザーにも浸透し、創造性を手軽に引き出すツールとなっている現状を示しています。企業はこれらのAIツールを季節イベントのプロモーションや顧客エンゲージメント向上にどう活用できるか、具体的な検討を始める好機と言えるでしょう。

ChatGPT、社内情報横断検索で業務の文脈を理解

新機能「Company Knowledge」

法人向けプランで提供開始
社内ツールと連携し横断検索
GPT-5ベースで高精度な回答
回答には明確な出典を引用

具体的な活用シーン

顧客フィードバックの戦略化
最新情報でのレポート自動作成
プロジェクトのリリース計画立案

エンタープライズ級の安全性

既存のアクセス権限を尊重
データはモデル学習に利用不可

OpenAIは2025年10月23日、法人向けChatGPTに新機能「Company Knowledge」を導入しました。この機能は、SlackGoogle Driveといった社内の各種ツールと連携し、組織固有の情報を横断的に検索。利用者の業務文脈に合わせた、より正確で具体的な回答を生成します。社内に散在する情報を集約し、意思決定の迅速化業務効率の向上を支援することが目的です。

新機能の核となるのは、GPT-5を基盤とする高度な検索能力です。複数の情報源を同時に参照し、包括的で精度の高い回答を導き出します。生成された回答にはすべて明確な出典が引用されるため、ユーザーは情報の出所をたどり、内容の信頼性を容易に確認できます。これにより、安心して業務に活用できるのが大きな特徴です。

例えば、顧客との打ち合わせ前には、Slackの最新のやり取り、メールでの詳細、Google Docsの議事録などを基に、ChatGPT自動でブリーフィングを作成します。また、キャンペーン終了後には、関連するデータを各ツールから抽出し、成果レポートを生成することも可能です。このように、手作業による情報収集の手間を大幅に削減します。

Company Knowledgeは、単なる情報検索にとどまりません。社内で意見が分かれているような曖昧な問いに対しても、各ツールの議論を要約し、異なる視点を提示する能力を持ちます。例えば「来年の会社目標は?」と尋ねれば、議論の経緯や論点を整理してくれます。これにより、チームの次のアクションを促すことができます。

企業導入で最も重要視されるセキュリティも万全です。この機能は、各ユーザーが元々持つアクセス権限を厳格に尊重します。OpenAIが企業のデータをモデル学習に利用することはなく、SSOやIP許可リストなど、エンタープライズ水準のセキュリティ機能も完備。管理者はアクセス制御を柔軟に設定できます。

現在、この機能は手動で有効にする必要があり、Web検索画像生成とは併用できませんが、将来的にはこれらの機能統合が予定されています。また、AsanaやGitLabなど連携ツールも順次拡大しており、今後さらに多くの業務シーンでの活用が期待されます。

ChatGPT、成人向けエロティカ生成を12月解禁へ

OpenAIの方針大転換

12月よりエロティカ生成を解禁
認証済み成人ユーザーが対象
CEOは「成人の自由」を主張

新たなAIとの関係性

親密な対話が常態化する可能性
ユーザー定着率の向上が狙いか
人間関係を補完する新たな選択肢

浮上するリスクと課題

個人情報のプライバシー漏洩懸念
感情の商品化によるユーザー操作

OpenAIは2025年12月に実施するアップデートで、AIチャットボットChatGPT」の利用規約を改定し、年齢認証済みの成人ユーザーに限り「エロティカ」を含む成熟したテーマのコンテンツ生成を許可する方針です。同社のサム・アルトマンCEOがSNSで公表しました。この方針転換は、AIと人間のより親密な関係性を促し、ユーザーエンゲージメントを高める可能性がある一方、プライバシー倫理的な課題も提起しています。

アルトマンCEOはSNSへの投稿で、今回の変更は「成人の自由」を尊重する同社の大きな姿勢の一部だと説明。「我々は世界の倫理警察ではない」と述べ、これまでの方針を大きく転換する考えを示しました。かつて同社は、自社モデルを成人向けコンテンツに利用した開発者に対し、停止命令を送付したこともありました。

この動きは、ユーザーとAIの関係を根本的に変える可能性があります。専門家は、人々が自身の性的嗜好といった極めてプライベートな情報をAIと共有することが常態化すると指摘。これにより、ユーザーのプラットフォームへの滞在時間が伸び、エンゲージメントが向上する効果が期待されます。

一方で、この変化を肯定的に捉える声もあります。専門家は、人々が機械と性的な対話を試みるのは自然な欲求だとし、AIコンパニオンが人間関係を代替するのではなく、現実世界では満たせないニーズを補完する一つの選択肢になり得ると分析しています。

最大の懸念はプライバシーです。チャット履歴が万が一漏洩すれば、性的指向などの機微な個人情報が流出しかねません。また、ユーザーの性的欲求がAI企業の新たな収益源となる「感情の商品化」につながり、ユーザーが感情的に操作されるリスク専門家は指摘しています。

今後、テキストだけでなく画像音声の生成も許可されるのか、詳細はまだ不明です。もし画像生成が解禁されれば、悪意あるディープフェイクの拡散も懸念されます。OpenAIがどのような年齢認証や監視体制を導入するのか、その具体的な実装方法が今後の大きな焦点となるでしょう。

EA、Stability AIと提携しゲーム開発を革新

提携の目的と背景

ゲーム大手EAとStability AIが提携
ゲーム制作のワークフローを革新
AIを「信頼できる味方」と位置付け

共同開発の具体例

リアルな質感表現(PBR)を加速
指示で3D環境を自動プレビュー

クリエイターへの影響

反復作業を高速化し生産性向上
クリエイター創造的業務に注力
迅速なプロトタイプ制作が可能に

ゲーム開発大手Electronic Arts (EA)は2025年10月23日、画像生成AI「Stable Diffusion」で知られるStability AIとの戦略的提携を発表しました。両社は生成AIモデルやツールを共同開発し、ゲーム制作のワークフローを革新します。この提携は、開発プロセスの高速化と、アーティストやデザイナーの創造性を最大限に引き出すことを目的としています。

EAはこの提携を通じて、AIを「信頼できる味方」と位置付けています。反復的な作業をAIに任せることで、開発者がより創造的な業務に集中できる環境を整えます。ただし、同社は「ストーリーテリングの中心は人間であり続ける」と強調しており、AIはあくまでクリエイターを支援する存在であるとの姿勢を明確にしています。

共同開発の第一弾として、リアルな質感を表現する「フィジカリーベースドレンダリング(PBR)」マテリアルの作成を加速させるツールに着手します。また、簡単な指示(プロンプト)から3D環境全体を瞬時にプレビューするAIシステムの開発も進め、コンセプト制作の速度と精度を飛躍的に高める計画です。

ゲーム業界におけるAI活用はEAに限りません。例えば、人気ゲーム「PUBG」の開発元であるKraftonも「AI First」戦略を掲げ、AI分野への大規模投資を発表しています。大手企業によるAI導入の動きは今後も加速し、業界全体の競争環境を大きく変える可能性があります。

EAのアンドリュー・ウィルソンCEOは以前からAIを事業の「まさに核」と述べており、今回の提携はその方針を具現化するものです。投資家の間では、AIによるコスト削減が収益性を大幅に向上させるとの期待も高まっています。このパートナーシップは、ゲーム開発の未来を占う重要な一歩と言えるでしょう。

Snapchat、画像生成AIレンズを米国で無料開放

プロンプトで画像生成

自由な指示で画像を生成・編集
自撮り写真をエイリアンなどに加工
ハロウィーンの仮装案にも活用
友人やストーリーで共有可能

競合追撃とユーザー拡大

MetaOpenAIなど競合の台頭
有料プラン限定から全ユーザーへ提供
まずは米国でサービス開始
カナダ、英国、豪州へも展開予定

Snapは10月22日、同社の人気アプリSnapchatにおいて、初の自由入力プロンプト型AI画像生成機能「Imagine Lens」を米国で無料公開しました。これまでは有料プラン限定でしたが、全ユーザーが利用可能になります。MetaOpenAIなど競合が高度なAIツールを投入する中、若者ユーザーの維持・獲得を狙う戦略的な一手とみられます。

この新機能を使えば、ユーザーは自撮り写真に「私をエイリアンにして」といったプロンプトを入力するだけで、ユニークな画像に加工できます。また、「不機嫌な猫」のように、全く新しい画像を生成することも可能です。作成した画像は友人とのチャットやストーリーで共有でき、ハロウィーンの仮装を試すといった実用的な使い方も提案されています。

今回の無料開放の背景には、SNS市場におけるAI開発競争の激化があります。Metaの「Meta AI」やOpenAI動画生成AI「Sora」など、競合他社がより高度なAI機能を次々と発表。若年層ユーザーの関心を引きつけるため、Snapも主力機能の一つであるAIレンズを無料化し、競争力を維持する投資に踏み切った形です。

これまで「Imagine Lens」は、有料プラン「Lens+」および「Snapchat Platinum」の加入者のみが利用できる限定機能でした。今回の拡大により、無料ユーザーも一定回数画像生成が可能になります。サービスはまず米国で開始され、今後カナダ、英国オーストラリアなど他の主要市場へも順次展開される計画です。

Google、誰でも数分でAIアプリ開発

「感覚」でアプリ開発

専門知識が不要なUI
プロンプトから自動生成
多様なAIモデルを統合
リアルタイムでの編集

創造性を刺激する機能

アイデアを自動で提案
65秒でプロトタイプ完成
GitHub連携やデプロイ
無料で試せる手軽さ

Googleは2025年10月21日、同社のAI開発プラットフォーム「Google AI Studio」に、プログラミング初心者でも数分でAIアプリケーションを開発・公開できる新機能「vibe coding」を追加したと発表しました。このアップデートにより、アイデアを持つ誰もが、専門知識なしで自身のアプリを具現化し、市場投入までの時間を劇的に短縮することが可能になります。

新機能の核心は、刷新された「Build」タブにあります。利用者はGemini 2.5 Proをはじめ、動画理解AIの「Veo」や画像生成AI「Imagine」など、Googleの多様なAIモデルを自由に組み合わせられます。「作りたいアプリ」を文章で説明するだけで、システムが必要なコンポーネントを自動で組み立て、アプリの雛形を生成します。

生成されたアプリは、インタラクティブなエディタですぐに編集できます。画面左側ではAIとの対話を通じてコードの修正や提案を受けられ、右側のエディタではソースコードを直接編集可能です。このハイブリッドな開発環境は、初心者から熟練の開発者まで、あらゆるスキルレベルのユーザーに対応します。

アイデアが浮かばないユーザーを支援する「I'm Feeling Lucky」ボタンもユニークな機能です。ボタンを押すたびに、AIがランダムなアプリのコンセプトと必要な設定を提案。これにより、偶発的な着想から新たなサービスが生まれる可能性を秘めています。

その実力は確かです。海外メディアVentureBeatの記者が「サイコロを振るアプリ」と指示したところ、わずか65秒でアニメーション付きの多機能なウェブアプリが完成しました。完成したアプリはGitHubへの保存や、Googleインフラを使ったデプロイも数クリックで完了します。

この新機能は無料で利用を開始でき、高度な機能を利用する場合のみ有料APIキーが必要となります。Googleは、AI開発のハードルを劇的に下げることで、開発者コミュニティの裾野を広げ、AIエコシステムのさらなる活性化を狙っていると考えられます。今回の発表は、今後予定されている一連のアップデートの第一弾とされています。

AIで偽の休暇写真、燃え尽き世代の新需要

新アプリの概要

AIで偽の休暇写真を自動生成
開発者Meta社プロダクトデザイナー
GoogleGeminiモデルを活用

ターゲットと収益モデル

多忙な燃え尽き症候群の層
最初の6枚は無料で試用可能
追加画像生成従量課金制
レトロな雰囲気の写真が特徴

Meta社のプロダクトデザイナーが、AIで偽の休暇写真を生成するiPhoneアプリ「Endless Summer」を公開しました。燃え尽き症候群に悩む多忙なビジネスパーソンを主なターゲットとし、実際に旅行せずとも世界中を旅しているかのような写真を手軽に作成できる点が特徴です。

このアプリは、Google画像生成モデル「Gemini Nano-Banana」を活用しています。ユーザーは自身の顔写真を基に、ボタンをタップするだけで、ビーチやヨーロッパの街並みなど、様々なシチュエーションの休暇写真をAIが自動で生成するシンプルな操作性を実現しています。

ビジネスモデルは、最初の6枚の画像生成を無料とし、それ以降は有料となる従量課金制を採用。30枚で3.99ドルといった価格設定で、手軽にAI体験を試せるように設計されています。毎朝自動で写真が届くオプション機能も提供しています。

開発の背景には、テック業界の過酷な労働文化「ハッスルカルチャー」があります。実際に休暇を取れない人々が、SNS上で「充実した生活」を演出したいというニーズを捉えたものと言えるでしょう。この現象は、AIが現実の代替体験を提供する新たな潮流を示唆しています。

生成される写真は、意図的にヴィンテージフィルムのような質感に仕上げられています。これは、完璧すぎない、より自然なライフスタイル感を演出する最近のトレンドを反映したものです。AI技術が、かつてのアナログな懐かしさを再現している点は非常に興味深いと言えます。

AI偽ヌード生成アプリ、被害者が運営停止求め提訴

提訴されたアプリの概要

写真から偽ヌード画像を生成
わずか3クリックの簡単操作
児童性的虐待コンテンツも作成

拡散を助長する仕組み

Telegramボットで自動宣伝・拡散
API提供で技術の悪用を拡大
多数の模倣アプリ・サイトが出現

驚異的な被害の規模

1日平均20万枚画像を生成
累計訪問者数は2700万人

AIで衣服を透視したかのような偽ヌード画像を生成するアプリ「ClothOff」が、17歳の被害者少女に提訴されました。訴状は、同アプリが児童性的虐待コンテンツ(CSAM)などを容易に生成・拡散できると指摘。原告は「絶え間ない恐怖」を訴え、アプリの運営停止などを求めています。

訴状によれば、ClothOffはInstagramなどの写真からわずか3クリックで、本物と見分けがつきにくい偽ヌード画像を生成できるとされます。これは非合意の性的画像だけでなく、未成年者を対象とした児童性的虐待コンテンツの生成にもつながる悪質な仕組みだと原告側は非難しています。

問題はアプリ単体にとどまりません。ClothOffは、自社の画像生成技術を外部サービスが組み込めるAPIを提供。これにより模倣サービスが乱立し、被害が拡大しています。さらにSNS「Telegram」上のボットがアプリを宣伝し、数十万人の登録者を集めるなど、拡散に拍車をかけていると指摘されています。

被害の規模は甚大です。訴状によると、ClothOffと関連サービスは1日平均で20万枚もの画像を生成し、累計訪問者数は2700万人を超えます。プレミアム機能として課金メニューも用意されており、運営側が偽ヌード画像の生成から直接利益を得ているビジネスモデルも問題視されています。

今回の訴訟は、生成AI技術の悪用がもたらす深刻な人権侵害と、それを助長するプラットフォームの責任を問うものです。技術者は自らの技術が社会に与える影響を、経営者はサービスが悪用されるリスクを直視する必要があるでしょう。AI時代の新たな法的・倫理的課題を突きつける事例です。

多機能とSNS連携で覇権、ByteDanceのAI『Doubao』

中国で最も人気なAIアプリ

月間利用者1.57億人中国首位
世界でも4番目に人気の生成AI
親しみやすいアバターとUI/UX

成功を支える『全部入り』戦略

チャットから動画生成まで多機能
AIに不慣れな層も取り込む設計
TikTok(Douyin)とのシームレスな連携

バイラル設計とエコシステム

SNSでの共有を促すバイラル設計
競合からユーザーの4割が流入
自動車など他デバイスへの展開

TikTokを運営する中国ByteDance社が開発したAIアシスタント「Doubao(豆包)」が、中国市場を席巻しています。2025年8月には月間アクティブユーザー数が1億5700万人に達し、競合のDeepSeekを抜いて国内首位となりました。その成功の裏には、チャットから画像動画生成までを網羅する多機能性と、ショート動画アプリ「Douyin(抖音)」と連携した巧みなバイラル戦略があります。

Doubaoの躍進は、データにも裏付けられています。中国のデータインテリジェンス企業QuestMobileによると、月間アクティブユーザー数は1億5700万人。競合のDeepSeekは1億4300万人で2位に後退しました。また、ベンチャーキャピタルa16zの調査では、ChatGPTGeminiに次ぐ世界で4番目に人気の生成AIアプリにランクインしています。

Doubaoの最大の特徴は「全部入り」とも言える包括的な機能です。テキスト対話だけでなく、画像生成、短い動画作成、データ分析、AIエージェントのカスタマイズまで、一つのアプリで完結します。これはまるで、ChatGPT、Midjourney、Sora、Character.aiといった複数の最先端ツールを一つに集約したような体験をユーザーに提供するものです。

なぜ、この「全部入り」戦略が受け入れられたのでしょうか。それは、DoubaoがAIに詳しくない一般ユーザーを明確にターゲットにしているからです。親しみやすいアバターやカラフルなUIに加え、テキスト入力より音声動画での対話を好む層を取り込み、AI利用のハードルを劇的に下げることに成功しました。

成功のもう一つの柱が、ByteDanceの得意とするSNS連携とバイラル設計です。ユーザーはDoubaoで生成したコンテンツを、Douyin(中国TikTok)ですぐに共有できます。逆にDouyinの動画要約をDoubaoにさせることも可能です。この利便性と楽しさが爆発的な拡散を生み、ユーザーエンゲージメントを高めています。

競合のDeepSeekがモデルの性能や論理的タスクに注力する一方、Doubaoは消費者向けアプリとしての完成度で差をつけました。QuestMobileのデータでは、DeepSeekを離れたユーザーの約4割がDoubaoに移行したとされています。これは、ByteDanceが長年培ってきた「アプリ工場」としての開発力が発揮された結果と言えるでしょう。

ByteDanceはスマートフォンの枠を超え、Doubaoをエコシステムの中核に据えようとしています。すでにスマートグラスや自動車メーカーとの提携を進めており、車載アシスタントやAIコンパニオンとしての搭載が始まっています。Doubaoは、私たちの生活のあらゆる場面に浸透するプラットフォームを目指しているのです。

日本政府、OpenAIに著作権侵害停止を公式要請

政府が公式に「待った」

OpenAIへの正式な申し入れ
動画生成AI「Sora」が対象
漫画・アニメの無断利用を懸念

保護されるべき日本の文化

「かけがえのない宝」と表現
知的財産戦略担当大臣が言及
クールジャパン戦略にも影響

OpenAIが抱える課題

著作権問題への対応に苦慮
CEOは日本の創造性を評価

日本政府が、米OpenAI社に対し、動画生成AI「Sora」の学習データに日本の漫画やアニメを無断で使用しないよう正式に要請しました。知的財産戦略を担当する木内稔大臣が明らかにしたもので、日本の文化資産である著作物の保護を強く求める姿勢を示しています。生成AIの急速な進化に伴い、著作権侵害のリスクが改めて浮き彫りになった形です。

木内大臣は、漫画やアニメを「日本の誇るかけがえのない宝」と表現し、その創造性が不当に利用されることへの強い懸念を表明しました。この要請は内閣府から正式に行われたもので、「クールジャパン戦略」を推進する政府としても、クリエイターの権利保護は看過できない重要課題であるとの認識が背景にあります。

OpenAIは、Soraのリリース以降、著作権を巡る問題に直面しています。ユーザーによってマリオやピカチュウといった著名キャラクターが無断で生成される事例が相次ぎ、対応に苦慮しているのが現状です。今回の日本政府からの公式な申し入れは、同社が世界中で直面する著作権問題の新たな一石となる可能性があります。

一方で、OpenAIサム・アルトマンCEOは、かねてより「日本の卓越した創造性」への敬意を公言しています。同社の画像生成AIでも過去にスタジオジブリ風の画像が大量に生成されるなど、日本コンテンツがAIモデルに大きな影響を与えていることは明らかです。今回の要請を受け、同社が学習データの透明性確保や著作権者への配慮にどう踏み込むかが焦点となります。

AIが細胞変化を画像で予測、創薬の実験を代替

AI創薬の新モデル登場

新AIモデルMorphDiff
遺伝子情報から細胞画像を生成
実験前に薬の効果を可視化

コストと時間を大幅削減

高価な画像化実験を代替
作用機序の特定を高速化
画像に迫る予測精度を達成

ビジネスへの応用

新薬候補の優先順位付け
既存薬の再利用(リパーパシング)

アラブ首長国連邦のAI専門大学院大学MBZUAIの研究者らが、創薬プロセスを革新する可能性を秘めた新しいAIモデル「MorphDiff」を開発しました。このモデルは、薬物投与などによって変化する遺伝子の活動パターンをもとに、細胞がどのように変化するかを画像で高精度に予測します。これにより、時間とコストのかかる実験の一部をコンピュータ上のシミュレーションで代替することを目指します。

MorphDiffの核心は、画像生成AIで広く使われる「拡散モデル」技術の応用です。薬などの刺激によってどの遺伝子が活性化・不活性化したかという情報(トランスクリプトーム)を入力するだけで、摂動後の細胞のリアルな顕微鏡画像を生成できます。これにより、実験室で実際に細胞を培養し観察する前に、その結果をプレビューすることが可能になります。

この技術がもたらす最大の利点は、創薬研究における試行錯誤を大幅に削減できる点です。従来、何百万もの候補化合物の効果を一つ一つ画像化して評価するのは不可能でした。しかしMorphDiffを使えば、コンピュータ上で多数の化合物の効果をシミュレートし、有望な候補を効率的に絞り込めます。

生成される画像は単なる想像図ではありません。細胞の質感や内部構造といった数百もの生物学的特徴を正確に捉えており、その統計的分布は実際の実験データと区別がつかないレベルに達しています。この高い忠実性により、薬がどのように作用するかのメカニズム(MOA)を正確に推定するのに役立ちます。

具体的な応用例として、新薬候補のスクリーニングが挙げられます。未知の化合物が生み出す細胞変化の画像を予測し、既知の薬の作用パターンと比較することで、その化合物の潜在的な効果や副作用を迅速に評価できます。これは開発パイプライン全体の効率化に直結するでしょう。

現状では推論速度などの課題も残されていますが、今後の研究開発により、コンピュータ内での実験が現実の実験を強力に補完する未来が近づいています。この技術は、創薬研究のあり方を変え、より早く、より安価に新薬を届けるための重要な一歩となる可能性があります。

NVIDIA、卓上AIスパコン発表 初号機はマスク氏へ

驚異の小型AIスパコン

1ペタフロップスの演算性能
128GBのユニファイドメモリ
Grace Blackwellチップ搭載
価格は4,000ドルから提供

AI開発を個人の手に

最大2000億パラメータのモデル実行
クラウド不要で高速開発
開発者や研究者が対象
初号機はイーロン・マスク氏へ

半導体大手NVIDIAは2025年10月14日、デスクトップに置けるAIスーパーコンピュータ「DGX Spark」を発表しました。ジェンスン・フアンCEO自ら、テキサス州にあるSpaceXの宇宙船開発拠点「スターベース」を訪れ、初号機をイーロン・マスクCEOに手渡しました。AI開発の常識を覆すこの新製品は、15日から4,000ドルで受注が開始されます。

DGX Sparkの最大の特徴は、その小型な筐体に詰め込まれた圧倒的な性能です。1秒間に1000兆回の計算が可能な1ペタフロップスの演算能力と、128GBの大容量ユニファイドメモリを搭載。これにより、従来は大規模なデータセンターでしか扱えなかった最大2000億パラメータのAIモデルを、個人のデスク上で直接実行できます。

NVIDIAの狙いは、AI開発者が直面する課題の解決にあります。多くの開発者は、高性能なPCでもメモリ不足に陥り、高価なクラウドサービスデータセンターに頼らざるを得ませんでした。DGX Sparkは、この「ローカル環境の限界」を取り払い、手元で迅速に試行錯誤できる環境を提供することで、新たなAIワークステーション市場の創出を目指します。

この卓上スパコンは、多様なAI開発を加速させます。例えば、高品質な画像生成モデルのカスタマイズや、画像の内容を理解し要約する視覚言語エージェントの構築、さらには独自のチャットボット開発などが、すべてローカル環境で完結します。アイデアを即座に形にできるため、イノベーションのスピードが格段に向上するでしょう。

DGX Sparkは10月15日からNVIDIAの公式サイトやパートナー企業を通じて全世界で注文可能となります。初号機がマスク氏に渡されたのを皮切りに、今後は大学の研究室やクリエイティブスタジオなど、世界中のイノベーターの元へ届けられる予定です。AI開発の民主化が、ここから始まろうとしています。

Googleフォト、AIとの対話で写真編集を刷新

AIとの対話で簡単編集

米国Androidユーザー向けに提供
テキストや音声で編集を指示
「Help me edit」から起動
複雑な編集も一括で実行可能

多彩な編集プロンプト例

不要な反射や映り込みを除去
ペットに衣装を合成
古い写真を鮮明に復元
背景を拡張し構図を改善

Googleが、写真編集アプリ「Googleフォト」に、AIとの対話を通じて画像を編集できる新機能を導入しました。2025年10月14日、まずは米国Androidユーザーを対象に提供を開始。ユーザーは「Help me edit」機能から、テキスト入力や音声で「窓の反射を消して」などと指示するだけで、AIが自動で高度な編集を実行します。専門的なスキルがなくとも、誰もが直感的に写真を加工できる時代の到来です。

この新機能の利用方法は極めてシンプルです。Googleフォトで編集したい写真を開き、「Help me edit」ボタンをタップ。後は、実現したいことを自然な言葉で話したり、入力したりするだけでAIが意図を汲み取り、編集作業を代行します。これにより、これまで複数のツールや複雑な操作を要した作業が、ワンステップで完了するようになります。

具体的な活用例は多岐にわたります。例えば、商品写真の窓ガラスに映り込んだ不要な反射の除去や、背景の整理といった実用的な修正が瞬時に可能です。さらに、古い記録写真を鮮明に復元したり、複数の修正指示を一度にまとめて実行したりすることもできます。これにより、マーケティング資料や報告書の質を、手間をかけずに向上させることが期待できるでしょう。

加えて、この機能は創造性の発揮も支援します。ペットの写真にハロウィンの衣装を合成したり、殺風景な丘をヒマワリ畑に変えたりといった、遊び心のある編集も可能です。「犬が月面でスキーをしている写真」のような非現実的な画像生成も、簡単な指示で実現できます。ビジネスにおけるクリエイティブ制作の新たな可能性が広がります。

今回のアップデートは、AIが専門家のスキルを民主化する象徴的な事例と言えるでしょう。画像編集の専門知識がないビジネスパーソンでも、高品質なビジュアルコンテンツを迅速に作成できるようになります。生産性の向上はもちろん、新たなアイデア創出のツールとして、経営者エンジニアにとっても注目すべき機能ではないでしょうか。

マイクロソフト、自社開発画像生成AIを発表

MAI-Image-1の主な特徴

初の自社開発画像生成AI
フォトリアル画像に強み
高速画像生成を実現
LMArenaでトップ10入り

開発の背景と戦略

OpenAI依存からの脱却模索
クリエイターフィードバックを反映
安全性の確保にコミット
自社AIモデルへの投資を拡大

マイクロソフトAIが13日、初の自社開発によるテキストto画像生成モデル「MAI-Image-1」を発表しました。これは同社のAI戦略における重要な一歩であり、OpenAIへの依存低減にもつながる可能性があります。

MAI-Image-1は、クリエイティブプロフェッショナルの意見を取り入れ、画一的でない出力を目指しました。稲妻や風景などのフォトリアリスティック画像生成に優れ、処理速度も大型モデルより高速です。

このモデルは、AIモデルの性能を人間が評価するベンチマークサイト「LMArena」ですでにトップ10に入る実績を上げており、その技術力の高さが示されています。

今回の発表は、マイクロソフトOpenAIとの関係が複雑化する中、自社開発のAI能力を強化する戦略の一環です。音声生成AI「MAI-Voice-1」など、自社モデルのラインナップ拡充を進めています。

同社は安全で責任ある結果の確保にコミットしていると強調します。しかし、実際の安全性ガードレールについてはまだ評価されておらず、今後の検証が待たれるでしょう。

Google、欧州など大学生にGeminiを1年間無償提供

無償提供の概要

対象は欧州・中東・アフリカの大学生
1年間無料のAI Proプラン
12月9日までの申込が必要
18歳以上の学生が対象

利用可能な主要機能

最先端モデルGemini 2.5 Pro
調査レポート作成Deep Research
思考整理を支援NotebookLM
テキストから動画生成Veo 3

Googleは2025年10月13日、欧州・中東・アフリカ(EMEA)域内の大学生向けに、自社の最先端AIツール群「Google AI Proプラン」を1年間無償提供すると発表しました。18歳以上の学生が対象で、同年12月9日までの申込みが必要です。この取り組みは、次世代のAI人材育成と将来の労働力準備を目的としています。

無償提供されるのは、Gemini 2.5 Proへの拡張アクセスや、大規模な調査レポートを自動生成する「Deep Research」など、高度なAI機能を含むプランです。学生はこれらのツールを活用し、学業や創造的活動における生産性を大きく向上させることが可能になります。

さらに、音声動画の概要作成機能が強化された思考支援ツール「NotebookLM」や、テキスト・画像から高品質な動画を生成する「Veo 3」も利用可能です。これにより、学生は研究からプレゼンテーション準備まで、多岐にわたるタスクをAIサポートで進められます。

Googleは単なる答えの提供ではなく、理解を深め批判的思考を育むことを重視しています。そのため、質問やステップバイステップの支援で学習を導く「Guided Learning」モードも導入。複雑な数学の問題解決や論文構築などをサポートします。

学生は、最新の画像生成・編集モデル「Nano Banana」を使い、寮のデザインやクラブのロゴなど、アイデアを視覚的に具体化することもできます。創造性を刺激し、プロジェクトの初期段階を迅速に進めるツールとして活用が期待されます。

この施策は、教育者向けの「Gemini for Education」の拡充とも連動しています。Googleは世界中の大学と協力し、AIリテラシーの向上と個別化された学習支援の実現を目指していて、未来の担い手への投資を強化しています。

OpenAI、アジア16カ国で低価格プラン展開

ChatGPT Goの概要

月額5ドル以下の低価格プラン
メッセージ等の上限引き上げ
無料版の2倍のメモリ容量

アジア市場での急成長

東南アジアでユーザー4倍増
インドでは有料会員が倍増
一部で現地通貨決済に対応

激化するAI競争

Google同様プランを拡大
ユーザー8億人、OS化目指す

OpenAIは2025年10月9日、月額5ドル以下の低価格プラン「ChatGPT Go」をアジアの新たに16カ国で提供開始しました。この動きは、東南アジアで週次アクティブユーザーが最大4倍に急増するなど、同地域での需要の高まりを受けたものです。Googleとの市場獲得競争が激化する中、OpenAIは成長市場での収益化とユーザー基盤の拡大を加速させます。

ChatGPT Go」は、無料版と比べて多くの利点を提供します。メッセージの送受信、画像生成、ファイルや画像のアップロードにおける1日あたりの上限が引き上げられます。さらに、メモリ容量は無料版の2倍となり、ユーザーの意図をより深く理解した、パーソナライズされた応答が可能になる点が特徴です。

今回の拡大対象は、マレーシア、タイ、フィリピン、ベトナムなど16カ国です。これらの国の一部では利便性を高めるため、現地通貨での支払いに対応します。先行して8月にインド、9月にインドネシアで導入されており、特にインドでは導入後に有料会員数が倍増するなど、大きな成功を収めています。

この動きの背景には、ライバルであるGoogleとの熾烈な競争があります。Googleも同様の価格帯の「Google AI Plus」プランを9月にインドネシアで開始し、その後40カ国以上に急拡大しています。両社は、成長著しいアジア市場で手頃な価格のAIサービスを提供し、シェア獲得を競っているのです。

OpenAIは先日開催した開発者会議で、ChatGPTの週次アクティブユーザーが全世界で8億人に達したと発表しました。さらに、ChatGPT内でSpotifyなどの外部アプリを直接利用できる機能を導入。単なるチャットボットから、アプリストアのような「OS」へと進化させる壮大な構想を明らかにしています。

2025年上半期に78億ドルの営業損失を計上するなど、AIインフラへの巨額投資が続くOpenAIにとって、収益化は大きな課題です。今回の低価格プランのアジア展開は、グローバルなユーザー基盤を拡大しつつ、持続的な成長に向けた収益源を確保するための重要な戦略的一手と言えるでしょう。

Figma、Google Gemini搭載でデザイン高速化へ

Gemini搭載の狙い

進化するデザイナーのニーズ対応
画像編集・生成機能の強化
ワークフローの大幅な高速化
画像生成遅延を50%削減

加速するAI業界の覇権争い

大手アプリへのAIモデル統合が加速
消費者への普及で優位性を確保
FigmaはOpenAIとも提携済み
非独占的なパートナーシップ戦略

デザインプラットフォーム大手のFigmaは10月9日、Googleとの提携を発表しました。Googleの最新AIモデル群「Gemini」を自社ツールに統合し、AIによる画像編集や生成機能を大幅に強化します。この提携は、製品デザイナーやチームの進化するニーズに応え、クリエイティブワークフローを劇的に高速化することが狙いです。

具体的には、高速な「Gemini 2.5 Flash」や高性能な「Gemini 2.0」、画像生成モデル「Imagen 4」がFigmaに導入されます。特にGemini 2.5 Flashは画像生成機能に組み込まれ、社内テストでは画像生成時の遅延を50%削減する成果を上げています。ユーザーはプロンプト入力だけで、画像の生成や変更を迅速に行えるようになります。

この提携は、AI業界の覇権争いを象徴する動きと言えるでしょう。OpenAIGoogleなどのAI開発企業は、巨大なユーザー基盤を持つ既存アプリケーションに自社モデルを統合することで、消費者への普及を一気に進めようと競っています。有力プラットフォームとの連携が、市場での優位性を確立する鍵となっているのです。

興味深いのは、今回の提携非独占的である点です。FigmaはすでにOpenAIとも提携しており、ChatGPT内でFigmaの機能を利用できます。これは、特定のAI技術に依存するのではなく、デザイナーにとって最適なツールを柔軟に提供するというFigmaのプラットフォーム戦略を明確に示しています。

一方、Googleにとってもこの提携は重要です。同社は法人向けAIプラットフォーム「Gemini Enterprise」を発表したばかり。Figmaとの連携は、企業の既存ワークフローにAIをシームレスに組み込むというGoogleの戦略を具体化するショーケースとなります。

多くの企業で生成AIの試験導入が難航する中、GoogleはFigmaのような成功事例を通じて、AIが生産性向上に直結する投資であることを証明したい考えです。今回の提携は、専門ツールへのAI統合が今後さらに加速することを示唆しています。

Google AI、コア製品を劇的進化 9月のChrome/Search/Gemini刷新まとめ

コア製品のAI統合

ChromeGeminiブラウジングアシスタント搭載
Searchにリアルタイム視覚検索(Search Live)導入
複雑な多段階質問に対応するAIモードの拡充
Android Gboardにトーン修正・文法校正AI

Geminiと次世代技術

カスタムAI「Gems」の共有機能でコラボを促進
Nano Bananaによる高度な画像生成・編集機能

Googleは2025年9月、AI技術を中核製品全体に深く統合し、利用者体験の劇的な向上を発表しました。これはChrome、Search、Geminiアプリといった主要サービスに留まらず、教育分野や次世代ロボティクスまで多岐にわたります。特に、生産性向上に直結する機能が多数リリースされており、AIを使いこなしたい経営者エンジニア層にとって見逃せないアップデートです。

ウェブブラウザと検索機能は、AIアシスタント化を加速させています。ChromeではGeminiがブラウジングアシスタントとして機能し、開いているタブ全体を横断して質問に回答可能です。また、SearchのAIモードは、複雑な多段階質問に対応するだけでなく、日本語を含む多言語対応を拡大し、グローバルでの利用を促進しています。

特に画期的なのは、Search Liveの導入です。これは、リアルタイムの音声会話にスマートフォンのカメラフィードを共有する機能を組み合わせ、現実世界の課題解決をリアルタイムで支援します。また、AndroidのGboardにはAIライティングツールが追加され、トーンの修正やスペル・文法の校正が端末内で自動で行えるようになり、モバイル生産性が向上しました。

GeminiアプリはAI活用ハブとしての地位を固めています。特に、特定の目的に合わせてカスタマイズしたAIモデル「Gems」の共有機能が追加され、チーム内での共同作業や情報共有が容易になりました。さらに、DeepMind開発の画像生成・編集モデル「Nano Banana」の活用が広がり、クリエイティブな作業の可能性を広げています。

学習領域では、AIが個々のユーザーに最適化された学習を実現します。NotebookLMは、利用者のメモに基づきフラッシュカードやクイズを自動生成し、パーソナライズされた学習ガイドを提供します。スンダー・ピチャイCEOはAI教育への10億ドルのコミットメントを強調し、「Gemini for Education」を全米の高校に提供すると発表しました。

長期的な視点では、Google DeepMindが「物理エージェント」の時代を宣言し、ロボティクスモデルを強化しました。Gemini Robotics 1.5/ER 1.5は、ロボットが環境を認識し、推論し、複雑なマルチステップタスクを処理する能力を飛躍的に高めます。また、Gemini 2.5が国際プログラミングコンテストで金メダル級の成績を収め、その推論能力を証明しています。

Google、AIプレミアム機能の提供国を世界77カ国へ拡大

サービス拡大の概要

提供国が世界77カ国に拡大
新規加入者向けに6カ月間50%割引
最新AIモデルによる生産性向上を支援

主なプレミアム機能

画像動画生成機能の利用制限緩和
Gmail/DocsへのGemini統合
ノート作成AI「NotebookLM」へのアクセス拡大
Google Oneの200GBストレージ付属

Googleは7日、AIサブスクリプションサービス「Google AI Plus」の提供国を大幅に拡大すると発表しました。新たに36カ国を追加し、合計77カ国で利用可能となります。これは、最新のAIモデルと機能を活用し、ユーザーの生産性を高めるための戦略的な一歩です。

Google AI Plusの最大の利点は、GeminiがGmailやDocsといった主要アプリに組み込まれる点です。これにより、メール作成やドキュメント要約などの日常業務をAIで自動化し、ビジネスパーソンの業務効率を飛躍的に向上させます。

さらに、画像生成・編集モデルである「Nano Banana」や、動画生成機能の利用制限が緩和されました。また、高度なノート作成AIである「NotebookLM」へのアクセスも拡大しており、研究や分析を行うユーザーにとって強力なツールとなります。

本プランは、高度なAIモデルをより低価格で利用できるように設計されています。サービス拡大を記念し、新規加入者に対しては最初の6カ月間が50%割引になる期間限定の優待も提供されます。

UCLAが光でAI画像を超高速生成、低消費電力とプライバシーを両立

光学AIの3大革新性

生成速度は光速レベルを達成
電子計算より低消費電力で稼働
デジタル情報を保護するプライバシー機能を搭載

技術構造と動作原理

デジタルとアナログのハイブリッド構造
光の位相パターンを利用したアナログ領域での計算
「知識蒸留」プロセスによる学習効率化
画像生成単一の光パスで実行(スナップショットモデル)

米カリフォルニア大学ロサンゼルス校(UCLA)の研究チームは、生成AIのエネルギー問題を解決する画期的な技術として、「光学生成モデル」を発表しました。電子ではなく光子を用いることで、AI画像生成光速レベルで実現し、従来の拡散モデルが抱える高い消費電力とCO2排出量の削減を目指します。この技術は、処理速度の向上に加え、強固なプライバシー保護機能も提供します。

学生成モデルは、デジタルプロセッサとアナログの回折プロセッサを組み合わせたハイブリッド構造です。まず、デジタル領域で教師モデルから学習したシード(光の位相パターン)を作成します。このシードにレーザー光を当て、回折プロセッサが一瞬でデコードすることで、最終的な画像を生成します。生成計算自体は、光を使ったアナログ領域で実行されるのが特徴です。

UCLAのAydogan Ozcan教授によると、このシステムは「単一のスナップショット」でエンドツーエンドの処理を完了します。従来の生成AIが数千ステップの反復を必要とするのに対し、光の物理を利用することで、処理時間が大幅に短縮され、電力効率が劇的に向上します。画質を向上させる反復モデルも開発されており、高い品質を実現しています。

本モデルの大きな利点の一つは、データのプライバシー保護能力です。デジタルエンコーダーから生成される位相情報は、人間には理解できない形式であるため、途中で傍受されても専用のデコーダーなしには解読できません。これにより、生成された情報を特定ユーザーのみが復号できる形で暗号化する仕組みを構築できます。

研究チームは、この技術をデジタルコンピュータエコシステム内の代替品ではなく、「視覚コンピューター」として位置づけています。特に、デバイスが直接人間の目に画像を投影するAR(拡張現実)やVR(仮想現実)システムにおいて、処理システムとして活用することで、クラウドからの情報伝達と最終的な画像生成を光速かつ高効率で実現できると期待されています。

Google Gemini、UI刷新で視覚体験を強化へ

新UIの狙いと特徴

チャット形式からフィード形式
視覚的なプロンプト利用を促進
ユーザーエンゲージメントの向上
競合OpenAIとの差別化戦略

背景と今後の展望

OpenAISora」の成功が影響か
画像モデル「Nano Banana」の人気活用
Androidアプリのコードから発見
公式発表はまだ未定

Googleが、同社のAIアプリ「Gemini」で、UI(ユーザーインターフェース)の大幅な刷新をテストしている可能性が浮上しました。これはチャット形式から、目を引く画像付きのプロンプト案が並ぶスクロール型フィードへの移行を目指すものです。背景には、競合であるOpenAI動画編集アプリ「Sora」の成功があるとみられています。

新しいUIはAndroidアプリのコード解析から発見されたもので、まだ一般公開されていません。画面上部に「画像生成」といったショートカットを配置し、その下には創造性を刺激する具体的なプロンプト画像付きでフィード形式で表示されます。

この刷新の狙いは、ユーザーにAIの機能を自ら探させるのではなく、アプリ側から魅力的な活用法を提案することにあります。「写真を宇宙にテレポートさせる」といった楽しい提案で、ユーザーの利用を促し、エンゲージメントを高めることを目指しているのです。

競合の動向も、この変更を後押ししていると考えられます。App Storeで首位を獲得したOpenAIの「Sora」や、シンプルなUIを持つ「ChatGPT」に対し、Gemini視覚的な魅力と使いやすさで差別化を図る戦略でしょう。ユーザー体験の競争は新たな段階に入っています。

Googleは自社の強みも活かします。9月にGeminiApp Storeのトップに押し上げたAI画像モデルNano Bananaの人気を、この新UIでさらに活用する狙いです。視覚的な機能とUIを連動させ、相乗効果を狙うと考えられます。

Googleの広報担当者は「現時点で発表することはない」とコメントしており、このUIが実際に導入されるかは未定です。しかし、この動きはAIアプリの競争が、機能だけでなくユーザーを惹きつける体験のデザインへと移行していることを明確に示しています。

Google新画像AI、編集・生成の常識を覆す

驚異の編集・生成能力

文脈を理解し一貫性を維持
本人そっくりの人物画像を生成
自然言語によるピクセル単位の修正
AIが曖昧な指示も的確に解釈

新たな創造性の探求

スケッチからリアルな画像を生成
古い写真の修復・カラー化も可能
最大3枚の画像を融合し新画像を創造
開発者向けツールとのシームレスな連携

Googleは2025年8月下旬、Geminiアプリに搭載された新しい画像生成・編集AIモデル「Nano Banana」を発表しました。このモデルはテキストと画像を同時に処理するネイティブなマルチモーダル能力を持ち、リリースからわずかな期間で50億以上の作品を生み出すなど世界中で注目を集めています。専門的なツールを不要にするその革新的な機能は、ビジネスにおける創造性の常識を大きく変える可能性を秘めています。

Nano Bananaの最大の強みは、シーンやキャラクターの一貫性を維持する能力です。一度生成した人物の服装やポーズ、背景だけを変更するなど、連続した編集が可能です。これにより、従来のAIが生成しがちだった「本人とは少し違う」違和感を解消し、広告素材のバリエーション作成や製品プロモーションなど、より実用的な応用が期待されます。

さらに、自然言語による「ピクセル単位の編集」も注目すべき機能です。「ソファの色を赤に変えて」といった簡単な指示で、画像内の特定要素だけを他の部分に影響を与えることなく修正できます。これにより、インテリアデザインシミュレーションや、WebサイトのUIモックアップ修正といったタスクを、専門家でなくとも直感的に行えるようになります。

このモデルは、曖昧な指示から文脈を読み取って画像を生成したり、古い写真を歴史的背景を理解した上で修復・カラー化したりすることも可能です。また、最大3枚の画像を組み合わせて全く新しい画像を創造する機能もあり、アイデアの着想からプロトタイピングまでの時間を大幅に短縮し、これまでにないクリエイティブな表現を可能にします。

エンジニア開発者にとってもNano Bananaは強力なツールとなります。Geminiアプリ内のCanvasやGoogle AI Studioと統合されており、画像ベースのアプリケーションを容易に構築できます。実際に、1枚の写真から様々な時代のスタイルに合わせた画像を生成する「PictureMe」のようなアプリが、社内のプロジェクトから生まれています。

Nano Bananaは、単なる画像生成ツールにとどまりません。専門的なスキルがなくとも誰もがアイデアを形にできる「創造性の民主化」を加速させます。Googleはすでに次の改良に取り組んでおり、この技術が今後、企業のマーケティングや製品開発にどのような革新をもたらすか、引き続き目が離せないでしょう。

MS、AI統合新プラン発表 ChatGPTと同額でOfficeも

新プラン「M365 Premium」

OfficeとAIを統合した新プラン
Copilot ProとM365 Familyを統合
月額19.99ドルで提供

ChatGPT Plusに対抗

ChatGPT Plusと同額で提供
Officeアプリと1TBストレージが付属
生産性アプリとのシームレスな連携が強み

職場利用も可能に

個人契約で職場のOfficeもAI対応
企業データは保護され安全性も確保

Microsoftは2025年10月1日、AIアシスタントCopilot Pro」と生産性スイート「Microsoft 365 Family」を統合した新サブスクリプションプラン「Microsoft 365 Premium」を発表しました。月額19.99ドルという価格は、競合するOpenAIの「ChatGPT Plus」と同額に設定。Officeアプリと高度なAI機能をバンドルすることで、個人の生産性向上市場での覇権を狙います。

この新プランは、個人事業主や高い生産性を求めるプロフェッショナルを主なターゲットとしています。WordやExcelなどのOfficeデスクトップアプリの利用権(最大6人)、1人あたり1TBのクラウドストレージに加え、GPT-4oによる画像生成などCopilot Proの全機能が含まれます。Microsoftは「競合と比較して否定できない価値がある」と自信を見せています。

月額19.99ドルという価格設定は、明らかにChatGPT Plusを意識したものです。OpenAIが汎用的なAI機能で先行する一方、Microsoftは「生産性は我々のDNAだ」と述べ、Officeアプリに深く統合されたAI体験を強みとしています。使い慣れたツール内でシームレスにAIを活用できる点が、最大の差別化要因となるでしょう。

特に注目すべきは、個人契約のAI機能を職場で利用できる仕組みです。個人としてM365 Premiumを契約していれば、職場のPCにインストールされたOfficeアプリでもAI機能が有効になります。企業のデータは個人のアカウントと分離され、セキュリティコンプライアンスは維持されるため、IT管理者も安心して導入を検討できます。

この新プランの導入に伴い、単体の「Copilot Pro」は新規販売が停止されます。Microsoftは、AI機能をOfficeスイートと一体化させる戦略を鮮明にしました。既存のPersonalおよびFamilyプラン加入者にも一部のAI機能が解放されるなど、同社のサブスクリプション体系は、AIを核として大きく再編されつつあります。

Meta、AIとの会話データを広告に活用へ

AIデータ活用の新方針

AIとの会話内容を広告に利用
12月16日からポリシー改定
ユーザーによる拒否は不可

対象となるデータとサービス

チャットボットとの会話履歴
FacebookInstagramで反映

プライバシーへの配慮と例外

EU・英国韓国適用除外
センシティブな話題は利用対象外

Metaは、傘下のAIアシスタントとの会話データをターゲティング広告に利用する方針を明らかにしました。2025年12月16日からプライバシーポリシーを改定し、FacebookInstagramのユーザーに対し、よりパーソナライズされた広告コンテンツを提供します。この動きは、巨大IT企業によるAI製品の収益化競争が新たな段階に入ったことを示唆しています。

具体的には、ユーザーがMeta AIと「ハイキング」について話した場合、ハイキング用品の広告が表示されるようになります。このデータ活用はチャットボットとの会話だけでなく、Ray-Ban MetaスマートグラスでAIが分析した音声画像データ、AI画像生成ツール「Imagine」での操作なども対象となり、ユーザーの行動が多角的に分析されます。

ユーザーにとって重要なのは、このデータ利用を拒否(オプトアウト)できない点です。Metaの各種サービスで同一アカウントにログインしている場合、例えばWhatsAppでのAIとの会話がInstagram広告に影響を与える可能性があります。ユーザーに許されているのは、既存の広告設定メニューから表示される広告の好みを調整することのみです。

プライバシーへの配慮として、Metaは宗教的信条や政治的見解、健康状態といったセンシティブな情報に関する会話は広告に利用しないと説明しています。また、欧州連合(EU)、英国韓国では、現地の厳格なプライバシー規制のため、この新方針は当面適用されません。

Metaの狙いは明確です。中核事業である広告ビジネスを、AIから得られる新たなデータで強化することにあります。月間10億人以上が利用するMeta AIは、ユーザーの興味関心を深く知るための新たな情報の宝庫です。これまで無料で提供してきたAI製品を、広告という収益の柱に直結させる戦略です。

AI製品の収益化は業界全体の課題です。OpenAIChatGPT内での商品購入機能を発表し、GoogleがAI検索への広告導入を計画するなど、各社が模索を続けています。Metaの今回の動きは、データ活用による広告モデルという、同社の成功方程式をAI時代にも適用する明確な一手と言えるでしょう。

Google、AIで巨匠の作風を学び椅子をデザイン

AIとデザイナーの協業

Googleと著名デザイナーの協業
生成AIでデザインを試作
有機的な作風をAIが学習

独自モデルで創造性を拡張

独自スケッチでAIを訓練
言語化と対話で出力を調整
金属3Dプリンタで実物化
創造性を拡張する協業ツール

Google DeepMindは、世界的に著名なデザイナーであるロス・ラブグローブ氏と協業し、生成AIを用いてユニークな椅子をデザインしました。ラブグローブ氏独自のスケッチ群を学習データとし、画像生成モデルをファインチューニング。AIとの対話を通じて氏の作風を反映した新たなアイデアを生み出し、最終的に金属3Dプリンターで物理的なプロトタイプを制作しました。これはAIが創造的プロセスを支援する強力なツールとなり得ることを示す事例です。

プロジェクトの目的は、生成AIを用いてコンセプト作りから物理的な製品まで一貫してデザインを完遂することでした。題材に選ばれたのは、機能が固定されつつも形状の自由度が高い「椅子」。デザイナー独自のスタイルやニュアンスをAIがどこまで正確に捉え、表現できるかという、古典的かつ本質的なデザインの課題に挑戦しました。

開発チームは、ラブグローブ氏が厳選したスケッチの高品質なデータセットを作成。これをGoogleのテキスト画像生成モデル「Imagen」に学習させ、ファインチューニングを行いました。このプロセスにより、モデルはラブグローブ氏のデザイン言語の核となる特有の曲線や構造的論理、有機的なパターンを組み込み、氏の作風に根差した新しいコンセプトを生成できるようになったのです。

成功の鍵は、デザイナーとAIの「対話」にありました。チームは、氏のデザイン語彙を言語化し、AIへの指示(プロンプト)を工夫することで、出力の精度を高めました。例えば、あえて「椅子」という単語を使わず類義語で指示を出し、より多様な形状や機能の探求を促しました。この試行錯誤が、AIを単なるツールから共同制作者へと昇華させたのです。

AIとの協業プロセスを経て生み出された数々のコンセプトから、ラブグローブ氏のチームは最終的なデザインを選定。金属3Dプリンティング技術を用いて、AIが生成したデジタルデータを実物の椅子として作り上げました。ラブグローブ氏は「AIが、ユニークで並外れた何かをプロセスにもたらしうることを示している」と、この成果を高く評価しています。

この事例は、AIが人間の専門性や創造性を代替するのではなく、むしろ拡張するための強力なパートナーになり得ることを明確に示しています。自社の製品開発やサービス設計において、AIをいかに「協業相手」として活用するか経営者エンジニアにとって、その可能性を探る貴重なヒントとなるでしょう。

ChatGPT、子の安全を守る保護者機能と新システム

保護者による利用制限

ティーンのアカウントと連携
利用時間や機能を個別設定
自傷行為の兆候を親へ通知
保護者向けリソースページ開設

会話の自動安全化

有害な会話を自動検知
高精度モデルへ自動切替
安全な応答を生成する新機能
過保護との批判も、改善期間を設定

OpenAIは2025年9月29日、対話型AI「ChatGPT」に、保護者がティーンエイジャーの利用を管理する「ペアレンタルコントロール」と、有害な会話を検知して安全なモデルに切り替える「セーフティルーティングシステム」を導入しました。これは、過去にChatGPTがティーンエイジャーの自殺に関与したとされる訴訟などを受け、AIの安全性と倫理的責任を高めるための重要な一歩です。企業のリーダーや開発者は、AIのリスク管理における先進事例として注目すべきでしょう。

新たに導入されたペアレンタルコントロールでは、保護者が自身のアカウントとティーンのアカウントを連携させ、利用を細かく管理できます。利用できない時間帯の設定や、ボイスモード、画像生成、メモリ機能の無効化が可能です。また、システムが自傷行為の兆候を検知した場合、保護者に通知する機能も実装されました。

もう一つの柱が「セーフティルーティングシステム」です。ユーザーとの会話が感情的にデリケートな内容になった場合、それを自動検知し、より安全な応答ができる最新モデル「GPT-5-thinking」へ会話の途中で切り替えます。単に応答を拒否するのではなく、安全な形で応答を生成する新技術が活用されています。

今回の機能強化の背景には、AIがユーザーに与える精神的な影響への懸念があります。特に、過去にティーンエイジャーがChatGPTとの長期間の対話の末に自ら命を絶ったとして、遺族がOpenAIを提訴する事件が発生しました。AIプラットフォームを運営する企業として、ユーザー保護と社会的責任を果たすための具体的な対策が求められていたのです。

これらの安全機能は専門家から歓迎される一方、一部ユーザーからは「過保護すぎる」といった批判的な声も上がっています。OpenAIもシステムの完璧性を認めておらず、今後120日間の改善期間を設けフィードバックを反映させる方針です。安全性と利便性のバランスをいかに取るかが今後の課題となります。

Meta、AI動画の新フィード『Vibes』を開始

AI動画の発見と創作

AI生成の短尺動画専用フィード
クリエイター作品からの着想を促進
プロンプト表示で制作過程を可視化

リミックスとSNS連携

音楽画像・アニメーションの変更機能
Instagram等への簡単クロス投稿
MetaのAIエコシステム拡大戦略

Metaは9月26日、AIが生成した短尺動画を発見・共有するための新フィード「Vibes」を、Meta AIアプリ内で公開しました。この機能は、クリエイターやコミュニティが作成したAI動画をユーザーがリミックス(再編集)し、新たな創作活動を促すことを目的としています。

「Vibes」は、以前ユーザーがAIとの対話やプロンプトを共有していた「Discover」フィードに代わるものです。テキスト中心の共有から、動画コンテンツの創作と発見に焦点を移したことは、MetaのAI戦略における重要な転換点と言えるでしょう。

フィード上の動画には、生成に使用されたプロンプトが併記されており、ユーザーは制作の裏側を覗くことができます。さらに、音楽画像、アニメーションを変更する「リミックス機能」を活用し、独自の作品をVibesやInstagramFacebookに手軽にクロス投稿できます。

この動きは、Metaが全社的に進めるAI機能統合の一環です。同社はFacebookInstagramなど主力製品にAI画像生成機能を組み込むほか、先日には画像生成AIの有力企業Midjourneyとの提携も発表しました。MetaはAIによるコンテンツ制作エコシステムの構築を加速させています。

Meta、OpenAIから研究者獲得 超知能開発を加速

Metaは2025年9月、AI開発競争の激化を背景に、OpenAIの著名な研究者ヤン・ソン氏を「Meta Superintelligence Labs」の研究責任者として採用しました。この動きは、マーク・ザッカーバーグCEOが今夏から進める人材獲得攻勢の一環です。ソン氏は、OpenAI出身のシェンジア・ジャオ氏の直属となり、超知能開発を加速させる狙いがあります。AI分野におけるトップ人材の獲得競争が、さらに激しさを増していることを示しています。 ソン氏はOpenAIで戦略的探査チームを率いていました。スタンフォード大学の博士課程在学中には、OpenAI画像生成モデル「DALL-E 2」の開発に貢献した画期的な技術を開発した実績を持ちます。彼の専門知識は、大規模で複雑なデータセットを処理するモデルの能力向上に貢献すると期待されています。 今回の採用は、ザッカーバーグCEOが今夏に開始した大規模な人材獲得攻勢の一環です。MetaOpenAIGoogleAnthropicなどから、これまでに少なくとも11人のトップクラスの研究者を引き入れています。CEO自らが主導し、AI開発体制の強化を急いでいることがうかがえるでしょう。 ソン氏が所属する研究所は、同じくOpenAI出身のシェンジア・ジャオ氏が7月から率いています。ジャオ氏はChatGPTGPT-4の開発にも携わった人物で、MetaOpenAIからの人材を中核に据えて開発を進めていることが鮮明になっています。AIの最先端を走る人材の獲得は、企業の競争力を左右する重要な要素です。 一方で、Metaの超知能研究所からは、設立発表後に少数の研究者が離脱する動きも見られます。一部は古巣のOpenAIに戻るなど、トップ人材の流動性は非常に高まっています。企業は優秀な人材を惹きつけ、維持し続けることが大きな課題となっているのです。

Google、AIムードボード「Mixboard」公開 テキストでアイデア創出

Googleは9月24日、AIを活用したムードボード作成アプリ「Mixboard」のパブリックベータ版を米国で公開しました。このサービスは、テキスト指示だけでAIがアイデアを画像化し、ムードボードを作成できるのが特徴です。Pinterestなどの競合サービスと異なり、利用者は既存の画像コレクションを必要とせず、創造的なアイデア出しを手軽に始められます。 Mixboardの最大の特徴は、テキストプロンプトを入力するだけでAIがアイデアを具現化してくれる点です。利用者は手持ちの画像がなくても、ゼロからプロジェクトを開始できます。創造性を刺激するためのテンプレートも用意されており、誰でも手軽にムードボード作りを始められる設計になっています。どのようなアイデアを形にできるでしょうか。 このアプリの中核を担うのは、Googleの最新画像編集モデル「Nano Banana」です。このモデルは、複雑な編集指示を理解し、リアルな画像を生成する能力に優れています。先に公開され人気を博したAIアプリ「Gemini」の成功を支えたのもこの技術であり、その性能の高さが証明されています。 Mixboardは、Pinterestのコラージュ機能と直接競合します。しかし、Pinterestが利用者のピン留めした画像などを使うのに対し、MixboardはAIによる画像生成を起点とします。これにより、まだ形になっていない漠然としたアイデアを探求するプロセスを強力にサポートできるのが強みです。 GoogleはMixboardの用途として、インテリアデザインの考案、イベントテーマのブレインストーミング、DIYプロジェクトのアイデア出しなどを挙げています。画像とテキストを組み合わせて、多角的な視点からアイデアを練ることが可能で、ビジネスや個人の創造活動に大きく貢献することが期待されます。 デジタルムードボードは、特に若年層の間で人気が高まっています。Pinterestのコラージュアプリ「Shuffles」がTikTokでバイラルヒットした例もあります。Mixboardは、こうした市場の需要に応え、AI技術でクリエイティブな表現を支援する新たなツールとして注目されます。 Mixboardは現在、米国の利用者を対象にGoogle Labsでパブリックベータ版として提供されています。利用者は生成した画像を再生成して新たなアイデアを得たり、ボードの内容からAIにテキストを生成させたりすることもできます。フィードバック用のDiscordコミュニティも開設されています。

Google、月額5ドルのAIプランを新興国40カ国超に拡大

Googleは9月24日、月額約5ドルの安価なAIサブスクリプションプラン「AI Plus」を、インドネシアやメキシコなど40カ国以上で提供開始しました。標準プランが高価な新興国市場で有料ユーザーを獲得し、先行するOpenAIに対抗する狙いです。この動きは、世界のAIサービス市場の勢力図に影響を与える可能性があります。 このプランでは、最新AIモデル「Gemini 2.5 Pro」へのアクセスが可能です。加えて、画像生成ツール「Flow」や動画生成ツール「Veo 3 Fast」など、クリエイティブな作業を支援する機能も含まれます。GmailやDocsといったGoogleの各種アプリ内でもAI機能が使えるようになり、業務効率の向上が期待できます。 さらに、AIリサーチアシスタントNotebookLM」の拡張機能や、200GBのクラウドストレージも提供されます。専門的な情報収集や資料作成、データ保管といったビジネスシーンでの実用性を高めており、コストパフォーマンスに優れたサービス内容となっています。 この動きの背景には、OpenAIとの激しい顧客獲得競争があります。OpenAIインドネシアなどで月額5ドル未満の「ChatGPT Go」を展開済みです。月額20ドルの標準プランが浸透しにくい市場で、両社は低価格戦略を加速させ、次なる巨大市場の主導権を争っています。 月額料金は多くの国で約5ドルに設定されていますが、ネパールやメキシコなど一部地域では、最初の6ヶ月間は50%割引が適用されます。巨大IT企業による価格競争は、今後さらに多くの地域で高機能なAIツールの普及を後押しすることになるでしょう。

Google、AI Plusプランを40カ国に追加、新興国市場へ展開加速

Googleは9月23日、AIサブスクリプションプラン「AI Plus」の提供国を新たに40カ国拡大したと発表しました。インドネシアでの先行導入が好評だったことを受け、より手頃な価格で高度なAIツールを世界中に提供する狙いです。対象はアジア、アフリカ、中南米の新興国が中心で、グローバルな利用者層の拡大を目指します。 「AI Plus」プランでは、Geminiアプリでの画像生成・編集や動画生成モデル「Veo 3 Fast」の利用上限が引き上げられます。さらに、Gmail、Docs、Sheetsといった主要な生産性ツールにGeminiが統合され、業務効率の大幅な向上が期待できるでしょう。ビジネスの現場でAIをどう活用できるか、試金石となりそうです。 このプランには、AI搭載のデジタルノート「NotebookLM」の利用上限拡大や、Googleフォト、ドライブ、Gmailで使える200GBのストレージも含まれます。また、これらの特典は最大5人の家族と共有可能で、個人利用だけでなく小規模なチームでの活用も視野に入ります。 新たに追加されたのは、ベトナム、フィリピン、ナイジェリア、メキシコ、ウクライナなど40カ国です。Googleは、価格を各国の市場に合わせて設定することで、新興国市場でのAIサービスの普及を加速させる戦略です。手頃な価格設定が、新たなビジネスチャンスを生むかもしれません。

Googleフォト、対話型AI編集を全Androidユーザーに拡大

Googleは2025年9月23日、米国Googleフォトの対話型AI編集機能を対象の全Androidユーザーに展開開始しました。音声やテキストで指示するだけで、同社のAI「Gemini」が写真を自動で編集します。これにより、専門知識がなくても高度な写真編集が可能となり、クリエイティブな表現の幅が広がります。 この新機能は、アプリ内の「Help me edit」ボタンから利用できます。ユーザーは編集ツールやスライダーを直接操作する必要がありません。代わりに「もっと明るくして」「背景の人を消して」といった自然な言葉で指示を出すだけで、AIが意図を汲み取り、写真を編集します。 この機能は、Googleの高性能AIモデル「Gemini」の能力を活用しています。当初は最新スマートフォン「Pixel 10」の利用者向けに限定公開されていましたが、今回、対象機種が大幅に拡大されました。これにより、より多くのユーザーが最先端のAI技術を手軽に体験できます。 簡単な明るさ調整や不要物の除去はもちろん、古い写真の修復といった高度な編集も可能です。さらに「ペットのアルパカをハワイのワイキキに移動させて」のような、現実にはない創造的な画像生成にも対応し、写真編集の楽しみを広げます。 一度の指示で終わりではありません。AIによる編集結果に対して「もう少しこうして」といった追加の指示を出すことで、対話しながら微調整を重ね、理想の仕上がりに近づけることができます。「make it better(もっと良くして)」といった曖昧な指示から始めることも可能です。 現在の提供対象は、米国在住で18歳以上のユーザーに限定され、言語は英語のみです。また、GoogleはAIで生成・編集された画像であることを示す技術標準「C2PA」にも対応しており、コンテンツの信頼性確保にも配慮しています。

OpenAI、インドネシアで廉価版ChatGPT投入、Google追撃

OpenAIは、インドネシアで廉価版サブスクリプションプラン「ChatGPT Go」を開始しました。料金は月額75,000ルピア(約4.50ドル)です。8月に開始したインド市場での成功を受け、新興国への展開を加速します。この動きは、同市場で先行する米Googleの類似プランに対抗するもので、生成AIの顧客基盤拡大を狙います。 ChatGPT Goプランは、無料版と月額20ドルの「Plus」プランの中間に位置します。無料版の10倍の利用上限が設定され、質問やプロンプトの送信、画像生成、ファイルアップロードがより多く利用できます。また、過去の会話を記憶する能力が向上し、ユーザーごとに最適化された応答が期待できます。 先行して同プランを導入したインドでは、有料購読者数が2倍以上に増加したといいます。価格を抑えたプランが新興市場のユーザー獲得に有効であることを証明したかたちです。この成功が、今回のインドネシアへの迅速な展開につながったのでしょう。各市場の特性に合わせた価格戦略の重要性を示唆しています。 この動きは、競合するGoogleへの直接的な対抗策です。Googleは今月初め、インドネシアで同様の価格帯の「AI Plus」プランを先行して発表しました。同プランでは、高性能な「Gemini 2.5 Pro」や画像動画生成ツール、200GBのクラウドストレージなどを提供しており、競争は激化しています。 AI大手が新興国で廉価版プランの投入を急ぐ背景には、将来の巨大市場での主導権争いがあります。一度ユーザー基盤を確立すれば、長期的な収益源となるためです。日本企業も、海外市場へAIサービスを展開する際には、現地の経済状況に合わせた価格設定と競合の動向を分析することが成功の鍵となるでしょう。

フアンCEOがGemini「Nano Banana」を絶賛、AIは「格差解消の機会」

フアン氏熱狂のAI画像生成

Google Geminiの「Nano Banana」を熱狂的に称賛
公開後数日で3億枚画像生成増を記録
AIの民主化を推進する技術と評価

CEOの高度なAI活用術

日常業務や公開スピーチ作成にAIを多用
AIを「考えるパートナー」として活用
タスクに応じて複数モデルを使い分け

英国AI市場への戦略

NVIDIA英国AIインフラ企業に6.83億ドルを出資
英国のAI潜在能力を高く評価し謙虚すぎると指摘

NVIDIAのジェンスン・フアンCEOは、Google GeminiのAI画像生成ツール「Nano Banana」を熱狂的に称賛しました。同氏はロンドンで英国への大規模AI投資を発表した際、AIは「技術格差を解消する最大の機会」であると主張。AIの未来について非常に楽観的な見解を示しています。

フアンCEOが熱狂的に支持するNano Bananaは、公開から数日でGemini画像生成数を3億枚急増させた人気機能です。これは、背景の品質を維持したまま、顔や動物などのオブジェクトに精密な編集を可能にする点が評価され、ユーザーに広く受け入れられています。

フアン氏は日常業務から公開スピーチの準備まで、AIを積極的に利用しています。AIワープロを使用することで、自身の状況や意図を記憶し、適切な提案を行う「思考のパートナー」として生産性を劇的に高めていると説明しています。

同氏はタスクに応じてAIモデルを厳密に使い分けています。技術的な用途にはGeminiを、芸術的な要素が強い場合はGrokを、高速な情報アクセスにはPerplexityを、そして日常的な利用にはChatGPTを楽しむと述べています。

さらに重要なリサーチを行う際には、フアン氏独自の高度な検証プロセスを採用しています。同じプロンプト複数のAIモデルに与え、互いの出力結果を批判的に検証させてから、最適な成果を選び出す手法です。

フアン氏は、AIは電気やインターネットのように、すべての人に開かれ、誰一人として取り残されてはならないという哲学を持っています。「この技術は使い方が非常に簡単であり、技術格差を埋める最大のチャンスだ」と強調し、AIの民主化を訴えています。

NVIDIAは、英国データセンター構築企業Nscaleに対し、6億8300万ドル(約1,000億円超)の株式投資を実施しました。フアン氏は、英国が産業革命やDeepMindの創出に貢献した歴史を踏まえ、同国のAI進展における潜在能力を高く評価しています。

インドがGoogle画像AI「Nano Banana」世界一の市場に

世界最大の利用規模

インドNano Banana利用数世界No.1に浮上
GeminiアプリのDL数がリリース後667%急増
1~8月のDL数は米国より55%高い水準

爆発的成長の要因

90年代ボリウッド風など独自のトレンドが拡大
伝統衣装「AIサリー」ブームの創出
フィギュア化などグローバルトレンドの拡散源

収益性と安全対策

アプリ内課金成長率が米国を大きく凌駕
SynthIDによるAI生成画像の識別

Google画像生成AI「Nano Banana」(正式名称Gemini 2.5 Flash Image)が、インドで爆発的な人気を集め、現在、利用規模において世界最大の市場となりました。独自のレトロポートレートやボリウッド風の画像生成といったローカルトレンドが牽引し、Geminiアプリはインドの主要アプリストアで無料チャートのトップを独占しています。

この人気により、インドでのGeminiアプリのダウンロード数は、Nano Bananaのアップデート後、わずか2週間で667%もの急増を記録しました。世界第2位のスマートフォン市場であり、オンライン人口を抱えるインドでの爆発的な普及は、AIモデルのグローバル展開において極めて重要な試金石となります。

Google DeepMindによると、インドユーザーの特徴は、その利用の仕方にあるといいます。特に注目されているのが、1990年代のボリウッドスタイルを再現するレトロポートレート生成です。また、インドの伝統衣装「サリー」を着用したビンテージ風画像、通称「AIサリー」ブームも発生しています。

インドユーザーは、単にローカルな画像生成に留まりません。例えば、自分自身をミニチュア化する「フィギュアトレンド」はタイで始まりましたが、インドで大きな牽引力を得たことで、世界的な流行へと拡大しました。インドは、AIトレンドを消費するだけでなく、拡散する主要なハブとなりつつあります。

利用規模だけでなく、収益性の面でもインド市場は高い潜在力を示しています。アプリ内課金(IAP)の全体額はまだ米国に及びませんが、Nano Bananaリリース後のIAP成長率は18%を記録し、これは世界平均の11%や、米国市場の1%未満を大きく凌駕しています。

一方で、私的な写真を用いた画像生成に伴うプライバシーやデータ悪用の懸念も指摘されています。これに対しGoogleは、AI生成画像であることを識別するため、目に見える透かしに加え、SynthIDと呼ばれる隠しマーカーを埋め込むことで、安全性の向上を図っています。

Geminiが新AI画像モデルでApp Store首位獲得

ランキング勢力図の変化

米国iOSChatGPTを抜き首位 (9/12)
世界108カ国でiPhone総合Top 5入り
Google Playでは26位から2位に急伸

DLと収益の爆発的成長

9月のDL数が前月比45%増を記録
Nano Banana導入後、新規ユーザー2300万人
iOS収益が1月比1,291%増を達成

GoogleのAIチャットアプリ「Gemini」が、新画像編集AIモデル「Nano Banana」の導入により、モバイルアプリ市場で記録的な成長を見せています。特に米国iOSApp Storeでは、長らく首位を維持していたOpenAIChatGPTを抜き、トップの座を獲得しました。

Geminiは9月12日に米国App Store総合ランキング1位を達成し、現在もその座を維持しています。また、AndroidプラットフォームのGoogle Playでも、9月8日の26位から一気に2位まで躍進。AIアプリ市場の勢力図が大きく変化しています。

アプリインテリジェンス企業Appfiguresのデータによると、9月のダウンロード数は前月比45%増となり、わずか半月で1,260万ダウンロードを記録しました。さらに世界108カ国でiPhone総合アプリのTop 5に入るなど、グローバルな浸透が加速しています。

この成長の最大の要因は、ユーザーが複雑な画像編集やリアルな画像生成を容易に行えるようになった「Nano Banana」モデルへの高い評価です。同モデル導入後、新規ユーザーは2,300万人を超え、共有された画像5億枚以上に達しています。

利用者の増加は収益にも直結しています。iOSにおけるGeminiの年間収益は630万ドルに達しており、特に「Nano Banana」がリリースされた8月の収益は160万ドルでした。これは1月と比較して1,291%もの大幅な伸びです。

M365 Copilot Chatが無料化、主要Officeアプリで生産性を底上げ

無料化の対象と範囲

全てのM365ビジネスユーザーが対象
Word、Excelなど主要5アプリに搭載
Copilot Chatサイドバーを実装
追加ライセンス費用は不要

提供される主要機能

ドキュメントの迅速な下書き・要約
スプレッドシートのデータ分析を支援
開いたファイル内容を理解し回答
Webベースの安全なAIチャット利用

Microsoftは、全てのMicrosoft 365ビジネスユーザーを対象に、WordやExcelなどの主要Officeアプリケーション内でAI機能「Copilot Chat」の無料提供を開始しました。これにより、ドキュメントの下書きやデータ分析といった生成AIの基本機能が、追加費用なしで利用可能になります。これは、企業やチームの生産性向上を強力に後押しする戦略的な動きです。

今回搭載されたのは、アプリ内で利用できるCopilot Chatサイドバーです。ユーザーが開いているファイルの内容を瞬時に理解し、関連性の高い回答を返す「コンテンツアウェア」なチャット機能が特徴です。例えば、Wordでの文書の書き換えや、PowerPointでのスライド作成補助などを、すぐに開始できます。

ただし、月額30ドル/ユーザーの有償ライセンス「Microsoft 365 Copilot」は引き続き提供されます。有償版は、単一ファイルに限定されず、企業全体の作業データに基づいて推論できる点で無料版と一線を画します。真の全社的なAI活用を目指す企業には、引き続き有償版の検討が必要です。

さらに、有償ライセンスユーザーは、最新技術であるGPT-5への優先アクセス権や、ファイルアップロード、画像生成といった高度な機能を利用できます。また、応答速度の向上や、ピーク利用時でも安定した可用性といった技術的な優位性も享受できます。

今回の無料化は、既存のビジネスプランの価格調整を伴わず実施されました。企業は、AI活用のハードルが大幅に下がることで、従業員のAIリテラシー向上と生産性改善を同時に進めることが可能になります。日常業務へのAI浸透を加速させる、重要な施策と言えるでしょう。