画像(マルチモーダル)に関するニュース一覧

MITとIBM、次世代AIの信頼・効率・知識基盤を強化

AIの信頼性を高める

LLM回答の不確実性を精密に評価
ナレッジグラフ連携で幻覚を抑制
強化学習データ検索を効率化

計算効率と表現力の向上

Transformer計算コストを削減
線形アテンションで処理を高速化
新方式の位置エンコーディング表現力を向上

視覚データの高度な活用

合成チャートでVLM学習を促進
画像から描画コードを自動生成・改良

マサチューセッツ工科大学(MIT)とIBMの研究者らが、AIの信頼性、効率性、知識に基づいた推論能力を向上させる複数の研究プロジェクトを推進しています。博士課程の学生が中心となり、LLMの回答の不確実性を評価する新手法や、計算コストを削減する次世代アーキテクチャなどを開発。これらの成果は、より実用的で価値の高いAIモデルを様々な分野へ展開することを目的としています。

企業のAI活用における最大の課題は、その回答が信頼できるかという点です。これに対し、研究チームはLLMの回答の不確実性を評価する新たな手法を開発しました。これは評価用モデル(プローブ)自体の信頼性を測り、誤った警告を防ぎます。さらに、外部のナレッジグラフと連携させ、AIの「幻覚」を抑制する強化学習フレームワークも構築しています。

大規模モデルの運用には膨大な計算コストが伴います。特にTransformerモデルは、入力データが長くなるほど計算量が爆発的に増加する課題を抱えていました。研究チームは線形アテンションなどの技術を採用することでこの問題を解決。より少ない計算資源で、より長いシーケンスを高速に処理できる次世代アーキテクチャの開発を進めています。

人間のように視覚情報を深く理解するAIも研究対象です。あるチームは、グラフやチャートを読み解き、それを生成するPythonコードを出力する合成データセット「ChartGen」を開発。これにより、財務・科学レポートの自動分析が期待できます。また、デザイン画像を基に質感を再現するプログラムを自己改良しながら生成するシステムも構築しています。

これらの研究は、それぞれがAIの核心的な課題に取り組んでいます。信頼性の確保、効率性の向上、そしてマルチモーダルな推論能力の強化は、AIが実験段階を終え、現実世界のビジネスや科学の現場で不可欠なツールとなるための重要な布石です。個々の技術革新が連携し、より強力で費用対効果の高いAIシステムの実現を加速させるでしょう。

拡散モデルAIに5千万ドル、コード生成を高速化

資金調達と背景

Inceptionが5千万ドルを調達
スタンフォード大教授が主導
MSやNVIDIAなど大手も出資

技術的な優位性

画像生成技術をテキスト・コードに応用
逐次処理から並列処理へ移行
低遅延・低コストでのAI開発
毎秒1000トークン超の生成速度

AIスタートアップのInceptionは11月6日、テキストおよびコード生成向けの拡散モデル開発のため、シードラウンドで5000万ドル(約75億円)を調達したと発表しました。スタンフォード大学の教授が率いる同社は、画像生成AIで主流の技術を応用し、従来のモデルより高速かつ効率的なAI開発を目指します。

拡散モデルは、GPTシリーズなどが採用する自己回帰モデルとは根本的に異なります。自己回帰モデルが単語を一つずつ予測し、逐次的に文章を生成するのに対し、拡散モデルは出力全体を反復的に洗練させるアプローチを取ります。これにより、処理の大幅な並列化が可能になります。

この技術の最大の利点は、圧倒的な処理速度です。Inceptionのモデル「Mercury」は、ベンチマークで毎秒1,000トークン以上を生成可能だと報告されています。これは従来の技術を大幅に上回る速度であり、AIの応答時間(レイテンシー)と計算コストを劇的に削減する可能性を秘めています。

今回の資金調達はMenlo Venturesが主導し、MicrosoftのM12ファンドやNvidiaのNVenturesなど、業界を代表する企業や投資家が参加しました。この事実は、テキスト生成における拡散モデルという新しいアプローチへの高い期待を示していると言えるでしょう。

テキスト生成AIの分野では自己回帰モデルが主流でしたが、特に大規模なコードベースの処理などでは拡散モデルが優位に立つ可能性が研究で示唆されています。Inceptionの挑戦は、今後のソフトウェア開発のあり方を大きく変えるかもしれません。

Google、誰でもAIアプリ開発「Opal」を世界展開

ノーコードでAIアプリ開発

Google製のノーコードAIツール
提供国を160カ国以上に拡大
アイデアを数分でMVPとして具現化

ビジネスを変える3つの活用法

リサーチや報告書作成の自動化
マーケティング用コンテンツ大量生成
反復的な定型業務の効率化
語学学習など新規事業の迅速検証

Googleは11月6日、ノーコードAIミニアプリ開発ツール「Opal」を世界160カ国以上に拡大したと発表しました。これにより、プログラミング不要で独自のAIアプリを開発し、業務効率化や新規事業の検証に活用できるようになります。

Opalの強力な用途が、複雑な業務プロセスの自動化です。Webから最新情報を自動収集し、分析してGoogleスプレッドシートにまとめるアプリや、週次報告書を生成するアプリなどが開発されています。反復タスクをAIに任せ、人はより創造的な業務に集中できます。

マーケティング分野でも導入が進んでいます。製品コンセプトからブログ記事やSNS投稿、広告スクリプトまでを一括で生成。パーソナライズされたキャンペーン用の画像とテキストを組み合わせるなど、拡張性の高い活用も可能です。

Opalはアイデアを迅速に形にするツールでもあります。起業家わずか数分でMVP(実用最小限の製品)を構築し、市場の需要を素早く検証できます。語学学習アプリや旅行プランナー、クイズ生成ツールなど、多様なミニアプリが生まれています。

Opalの世界展開はAI開発の民主化を加速させます。専門家でなくとも、誰もが自らのアイデアをAIで具現化できる環境が整いました。貴社の生産性向上や新規事業創出に、Opalを活用してみてはいかがでしょうか。

英AI著作権裁判、Stability AIが実質勝소

判決の要点

商標権侵害は認定
著作権侵害は棄却
AI学習の合法性は判断せず
Stability AIが実質勝訴

今後の焦点

米国での同種訴訟の行方
クリエイターとAI企業の対立
法整備の遅れが浮き彫りに
和解や提携の動きも活発化

英国高等法院は11月5日、画像生成AI「Stable Diffusion」を巡り、ストックフォト大手ゲッティイメージズが開発元のStability AIを訴えていた裁判で、Stability AI側に有利な判決を下しました。ゲッティのウォーターマーク(透かし)を再現したことによる商標権侵害は認定されたものの、AIの学習データ利用という核心的な著作権問題については判断が回避され、法的な不透明さが残る結果となりました。

判決の焦点は、著作権と商標権の侵害の有無でした。裁判所は、Stable Diffusionがゲッティの透かし入り画像を生成した点を商標権侵害と認定しました。一方で、著作権の二次的侵害については「AIモデルは著作権物を保存・複製していない」としてゲッティの主張を退け、Stability AIが実質的に勝訴した形です。

しかし、今回の裁判で最も注目された「著作権で保護された画像のAI学習への利用」という根幹的な論争に決着はつきませんでした。これは、ゲッティ側が証拠不十分を理由に裁判の途中でこの主要な訴えを取り下げたためです。結果として、英国におけるAIと著作権の明確な法的指針は示されないままとなりました。

この問題は、舞台を米国に移して争いが続きます。ゲッティはカリフォルニア州でもStability AIを相手に同様の訴訟を起こしており、そちらの判決が次の焦点です。一方で、AI企業と権利者の間では対立だけでなく、音楽業界のように戦略的提携に至るケースも出てきており、その動向は一様ではありません。

AI開発者経営者にとって、今回の判決は一安心材料かもしれません。しかし、AIの学習プロセスにおける著作権リスクが完全に払拭されたわけではない点に注意が必要です。各国の司法判断や法整備の動向を注視し、自社のAI開発・利用戦略を慎重に検討し続ける必要があるでしょう。

Pinterest、オープンソースAIでコスト減と高性能両立

オープンソースAIの威力

桁違いのコスト削減`を実現
プロプライエタリモデルと`同等の性能`
Pinterestの特定用途に最適化

PinterestのAI活用戦略

ビジュアルAIでの活用を拡大
AIアシスタントで商品発見を支援
独自モデルとOSSを定期的に比較

背景と市場の反応

ホリデー商戦の売上予測は弱気
発表を受け株価は21%以上下落

画像共有サービス大手Pinterestは、オープンソースのAIモデルを活用することで、コストを大幅に削減しつつ高いパフォーマンスを維持できるとの見解を明らかにしました。11月5日の決算説明会でビル・レディCEOが言及したもので、ファインチューニング(微調整)により、大手モデルに匹敵する性能を桁違いに低いコストで実現できるとしています。

レディCEOは特にビジュアルAI分野での有効性を強調。定期的な比較テストの結果、ファインチューニングしたオープンソースモデルは、主要なプロプライエタリモデルと「`同等の性能`」を「`桁違いに低いコスト`」で達成できると述べました。これにより、多くのユースケースでオープンソースモデルへの移行を進める方針です。

この戦略は、同社の厳しい業績見通しを背景としています。ホリデー商戦の売上予測が市場予想を下回り株価が急落する中、AI投資の費用対効果が大きな課題となっていました。オープンソース活用は、コストを抑えながらイノベーションを推進するための具体的な回答と言えるでしょう。

同社はAIアシスタント「Pinterest Assistant」など、AI活用を積極的に進めています。今回の発表は、プロプライエタリモデルへの依存を減らし、自社のユースケースに最適化したAIを低コストで運用するというIT業界の新たな潮流を示すものです。経営者エンジニアにとって示唆に富む事例ではないでしょうか。

OpenAI、企業顧客100万人突破 史上最速で成長

驚異的な成長スピード

企業顧客数が100万人を突破
史上最速のビジネスプラットフォーム
Enterprise版シート数は前年比9倍
Work版シート数は700万席を突破

生産性を高める新機能群

GPT-5搭載のAgentKitで業務自動化
Codexコードレビュー時間を半減
マルチモーダル対応で多様な業務へ
企業の75%がプラスのROIを報告

OpenAIは、法人向けサービスの利用企業が世界で100万社を突破し、史上最速で成長するビジネスプラットフォームになったと発表しました。ChatGPT for Workのシート数も700万席を超え、2ヶ月で40%増と急拡大しています。消費者向けChatGPTの普及を背景に、業務自動化を支援する新ツール群も投入し、企業のAI活用を後押しします。

企業向けサービスの勢いは数字にも表れています。有料の法人顧客は100万人を超え、特に大企業向けのChatGPT Enterpriseのシート数は前年比で9倍に達しました。この成長は、AIが単なる実験的ツールから、事業運営に不可欠な基盤へと移行している現状を明確に示しています。

この急成長の背景には、消費者向けChatGPTの圧倒的な普及があります。週に8億人が利用するサービスに慣れ親しんでいるため、従業員が抵抗なく業務でAIを使い始められます。これにより、企業は導入時の摩擦を減らし投資対効果(ROI)を早期に実現できるのです。

OpenAIは企業の本格導入を支援するため、新ツール群も発表しました。社内データと連携する「AgentKit」や、コード生成を支援する「Codex」の利用が急増。画像音声も扱えるマルチモーダル機能も強化し、より幅広い業務での活用を可能にしています。

実際に多くの企業が成果を上げています。ウォートン校の調査では、導入企業の75%がプラスのROIを報告。求人サイトIndeedは応募数を20%増加させ、シスコはコードレビュー時間を半減させるなど、具体的なビジネス価値を生み出しています。

自社ツールへの組み込みも進んでいます。CanvaやShopifyなどがChatGPTと連携し、新たな顧客体験を創出しています。OpenAIは、単なるツール提供者にとどまらず、「仕事のOS」を再定義するプラットフォームとなることを目指しており、その動きは今後さらに加速しそうです。

ロボットの眼が進化、MITが高速3D地図作製AIを開発

AIと古典技術の融合

AIで小さな部分地図を生成
部分地図を結合し全体を再構築
古典的手法で地図の歪みを補正
カメラの事前較正が不要

高速・高精度な応用

数秒で複雑な空間を3D地図化
誤差5cm未満の高い精度を実現
災害救助や倉庫自動化に応用
VR/ARなど拡張現実にも期待

マサチューセッツ工科大学(MIT)の研究チームが、ロボット向けに大規模環境の3D地図を高速かつ高精度に作成する新しいAIシステムを開発しました。このシステムは、最新の機械学習と古典的なコンピュータービジョン技術を融合。災害救助や倉庫の自動化など、ロボットが複雑なタスクを遂行する上での大きな障壁を取り除く画期的な成果として注目されます。

従来、ロボットの自己位置推定と地図作製を同時に行う「SLAM」技術は、課題を抱えていました。古典的な手法は複雑な環境で失敗しやすく、最新の機械学習モデルは一度に扱える画像数に限りがあり、大規模な空間の迅速なマッピングには不向きでした。いずれも、専門家による調整や特殊なカメラが必要となる場合が多くありました。

MITの新システムは、AIを用いて環境を小さな「部分地図」に分割して生成し、それらを古典的な手法で結合するアプローチを採用します。最大の革新は、AIが生成する地図の僅かな歪みを、柔軟な数学的変換を用いて補正する点にあります。これにより、大規模な地図でも矛盾なく正確に再構築することが可能になりました。

この手法の性能は目覚ましく、スマートフォンの動画からでも数秒で複雑な空間の3D地図を生成できます。MITの礼拝堂内部を撮影した実験では、再構築された地図の平均誤差は5cm未満という高い精度を達成しました。特殊なカメラや事前の較正が不要で、すぐに利用できる手軽さも大きな利点です。

この技術は、災害現場での救助ロボットのナビゲーション、倉庫内での自律的な物品管理、さらにはVR/ARといった拡張現実アプリケーションの品質向上にも貢献すると期待されています。研究者は、伝統的な幾何学の知見と最新AIの融合が、技術をよりスケーラブルにする鍵だと強調しています。

Googleマップ、Gemini搭載で会話型ナビへ進化

運転中の会話型操作

ルート上の複雑な条件検索
カレンダー登録など複数アプリ連携
音声による交通障害の報告

より直感的なルート案内

目印の建物を基準にした案内
ストリートビュー画像との連携
事前の交通障害アラート

周辺情報のAI検索

Googleレンズでかざして質問
建物の人気や特徴をAIが回答

Googleは2025年11月5日、地図アプリ「Googleマップ」に生成AI「Gemini」を統合し、ナビゲーション機能を大幅に強化すると発表しました。運転中にAIと対話しながら複雑な検索や操作ができる会話型体験や、目印となる建物を活用した直感的なルート案内が実現。より安全でストレスのない移動体験を目指します。

最大の目玉は、ハンズフリーの会話型運転体験です。「ルート沿いのビーガン対応レストラン」といった複雑な検索や、カレンダー登録などのアプリ連携も音声で完結。従来のGoogleアシスタントの役割をGeminiが完全に代替し、利便性を高めます。

ルート案内も大きく進化。「500メートル先」といった距離ベースではなく、「あのレストランの角を右折」といったランドマーク基準の直感的な案内に変わります。AIが膨大な場所情報とストリートビュー画像を照合し、実際に見える建物を特定することで実現しました。

ナビ未設定の通勤路でも交通渋滞などを事前通知する新機能も搭載。到着後は、Googleレンズで気になる建物にカメラをかざし「人気メニューは?」といった質問が可能に。移動前から到着後までシームレスな情報収集を実現します。

新機能はまず米国市場を中心にAndroidiOS向けに順次提供が開始されます。会話型ナビはGeminiが利用可能な全地域で展開し、将来的にはAndroid Autoにも対応予定。GoogleAIファースト戦略を象徴する動きです。

生成AI特有の「ハルシネーション」について、Google実世界のデータに根差しているため問題ないとの見解を示しました。信頼性の高いデータとAIの対話能力を組み合わせ、「すべてを知る副操縦士」のような存在を目指します。

NVIDIA RTX、AIクリエイティブを劇的加速

AI制作の劇的な高速化

RTX 50シリーズのAI特化コア
生成AIモデルが最大17倍高速
主要制作アプリ135種以上を最適化

動画・3Dワークフロー革新

4K/8K動画もプロキシ不要で編集
リアルタイムでの3Dレンダリング
AIによるノイズ除去と高解像度化

配信・ストリーミング支援

専用エンコーダーで高画質配信
AIアシスタントによる配信作業の自動化

NVIDIAは、クリエイティブカンファレンス「Adobe MAX」において、同社のGeForce RTX GPU動画編集、3D制作、生成AIなどのクリエイティブな作業をいかに高速化するかを明らかにしました。AI時代に求められる膨大な計算処理を専用ハードウェアで実行し、アーティストや開発者生産性を飛躍的に向上させるのが狙いです。

RTX GPUの強みは、AI処理に特化した第5世代Tensorコアや、3Dレンダリングを高速化する第4世代RTコアにあります。さらにNVIDIA Studioが135以上のアプリを最適化し、ハードウェア性能を最大限引き出すことで、安定した制作環境を提供します。

特に生成AI分野で性能は際立ちます。画像生成AI「Stable Diffusion」は、Apple M4 Max搭載機比で最大17倍高速に動作。これによりアイデアの試行錯誤を迅速に行え、創造的なプロセスを加速させます。

動画編集では4K/8K等の高解像度コンテンツが課題でした。RTX GPUは専用デコーダーにより、変換作業なしでスムーズな編集を実現します。AIエフェクトの適用や書き出し時間も大幅に短縮され、コンテンツ公開までの速度が向上します。

3D制作の現場も大きく変わります。レイトレーシングを高速化するRTコアと、AIで解像度を高めるDLSS技術により、これまで時間のかかったレンダリングがリアルタイムで可能に。アーティストは結果をすぐに確認でき、創造的な作業に集中できます。

ライブ配信もより身近になります。専用エンコーダーNVENCがCPU負荷を軽減し、ゲーム性能を維持したまま高品質な配信を実現します。AIアプリ「Broadcast」を使えば、特別なスタジオがなくても背景ノイズ除去やカメラ補正が簡単に行えます。

NVIDIAのRTX GPUは、個別のタスク高速化だけでなく、制作ワークフロー全体を革新するプラットフォームです。AIを活用して生産性と収益性を高めたいクリエイターや企業にとって、不可欠なツールとなることは間違いないでしょう。

マイクロソフト、初の独自AI画像生成モデルを公開

独自モデル「MAI-Image-1」

MS初の独自開発AI画像生成モデル
モデル名は「MAI-Image-1」
写実的な風景や照明の生成に強み
速度と品質の両立をアピール

OpenAI依存脱却への布石か

BingとCopilotで提供開始
OpenAIモデルと並行して提供
Copilot音声ストーリーにも活用
AI開発の主導権確保を狙う動き

マイクロソフトは2025年11月4日、同社初となる自社開発のAI画像生成モデル「MAI-Image-1」を発表しました。この新モデルは、検索エンジンBingの画像生成機能やCopilotで既に利用可能となっています。大手IT企業がOpenAIへの依存度を下げ、独自のAI開発を加速させる動きとして注目されます。

「MAI-Image-1」は、特に食べ物や自然の風景、芸術的な照明、そして写実的なディテールの表現に優れているとされます。マイクロソフトは「速度と品質の両立」を強調しており、ユーザーはアイデアを素早く視覚化し、試行錯誤を重ねることが容易になります。

この新モデルは、Bing Image Creatorにおいて、OpenAIのDALL-E 3やGPT-4oと並ぶ選択肢の一つとして提供されます。また、Copilot音声合成機能では、AIが生成した物語に合わせてアートを自動生成する役割も担い、コンテンツ制作の幅を広げます。

今回の発表は、マイクロソフトがAI開発の主導権を確保しようとする大きな戦略の一環です。同社は8月にも独自の音声・テキストモデルを発表しており、OpenAIへの依存からの脱却を段階的に進めていると見られます。独自技術の強化は、今後の競争優位性を左右する鍵となるでしょう。

一方でマイクロソフトは、CopilotOpenAIの最新モデルGPT-5を導入するなど、マルチAIモデル戦略も同時に推進しています。自社開発と外部の高性能モデルを使い分けることで、あらゆるニーズに対応する構えです。最適なAI活用のバランスをどう取るのか、同社の動向から目が離せません。

Google、ボスニア・ヘルツェゴビナ全土を360度公開

ストリートビュー提供開始

3万km超を走破し全土を撮影
主要都市や幹線道路を網羅
PCやスマホで手軽に仮想旅行

歴史遺産をバーチャル体験

首都サラエボの歴史地区
モスタルのスタリ・モスト(古橋)
複数のUNESCO世界遺産を収録
東西文化が融合する独特の景観

Googleは2025年11月4日、地図サービス「Googleマップ」のストリートビュー機能を、ボスニア・ヘルツェゴビナで提供開始したと発表しました。ストリートビューカーが国内の主要都市や幹線道路など総距離3万キロメートル以上を走行して撮影したパノラマ画像により、ユーザーはPCやスマートフォンから同国の豊かな自然や歴史的街並みを仮想的に探索できます。

バルカン半島に位置し、東西の文化が交差する同国のデジタルアーカイブ化は、ビジネスパーソンにとって大きな意味を持ちます。現地のインフラや都市の雰囲気を渡航前に把握できるため、海外進出や市場調査の精度を高める貴重な情報源となるでしょう。地理的な制約を超えて、現地のリアルな情報を手軽に入手できる時代が到来したのです。

サービスの目玉の一つが、首都サラエボの探索です。オーストリア・ハンガリー帝国時代の壮麗な建築である市庁舎や、オスマン帝国時代からの歴史を持つ旧市街「バシチャルシヤ」など、歴史の重層性を体感できます。第一次世界大戦の引き金となった事件の現場、ラテン橋も鮮明に確認でき、歴史的文脈の理解を深めます。

ボスニア・ヘルツェゴビナが誇る複数のUNESCO世界遺産も、今や指先一つで訪問可能です。特に有名なのが、モスタルにある「スタリ・モスト(古橋)」。ネレトヴァ川に架かる優美なアーチ橋は、紛争からの復興の象徴です。このほか、ヴィシェグラードの「メフメド・パシャ・ソコロヴィッチ橋」など、歴史的価値の高い建造物を詳細に観察できます。

撮影範囲は首都圏に留まりません。第2の都市バニャ・ルカの「カステル要塞」や、風光明媚なトレビニェの丘に建つ修道院など、地方都市の魅力にも触れることができます。今回のサービス拡大は、観光や教育分野での活用はもちろん、グローバルなビジネス展開を目指す企業にとって、新たな情報収集のツールとなることは間違いありません。

AIで自然保護を加速 Googleが新ロードマップ発表

AIが可能にする3つの変革

惑星全体をリアルタイム監視
専門知識をスマホアプリで民主化
複雑な生態系の全体像を可視化

普及を加速する3つの提言

生物多様性データの収集を加速
オープンなAIモデルへの投資を優先
開発者現場の連携を強化

Googleと世界資源研究所(WRI)は、AIを活用して地球の自然保護と回復を加速するための新たなロードマップを発表しました。野生生物の個体数が過去50年で7割以上減少するなど、深刻化する生物多様性の危機に対し、AIが持つ膨大な情報処理能力で従来の課題を克服する狙いです。この提言は、テクノロジーが自然保護のあり方をどう変革しうるかを示しています。

なぜ今、AIが自然保護に不可欠なのでしょうか。従来の保護活動は、タイムリーなデータの欠如や、広大な生態系を監視するコストの高さといった障壁に直面してきました。AIは、人間には不可能な規模でデータを処理し、隠れたパターンを特定する能力で、これらの「古くからの障害」を打ち破る強力なツールとして期待されています。

報告書では、AIがすでに変革をもたらしている3つの領域を挙げています。第一に、惑星規模でのリアルタイム監視です。例えば「Global Fishing Watch」はAIを用いて数十億の衛星信号を解析し、違法漁業の監視や海洋生態系の保護に貢献。かつては想像もできなかった規模での状況把握を可能にしています。

第二に専門知識の民主化です。市民がスマホで撮影した動植物の写真をAIが識別するアプリはその好例です。第三に、生態系の全体像の可視化。衛星画像音声記録など多様なデータをAIが統合し、保護活動に最も効果的な場所を特定するのに役立っています。

さらに、AIの潜在能力を最大限に引き出すため、報告書は3つの提言を打ち出しています。①生物多様性に関するデータ収集の大幅な拡充インフラ整備、②誰もが利用できるオープンなAIモデルへの重点投資、③AI開発者現場の実践者や地域社会との連携強化です。

AIは強力なツールですが、真の変革はテクノロジーと人間の情熱が融合して初めて生まれます。GoogleとWRIは、AIツールを保全の最前線にいる人々の手に届けることで、人と自然が共に繁栄する未来を創造できると強調しています。今後の技術実装と社会への浸透が注目されます。

MIT、AI実用化を加速する新手法を開発

最適AIモデルを瞬時に選択

膨大なモデル群から最適解を特定
対話形式でアノテーション作業を削減
わずか25例でモデル選択も可能
野生動物の分類などで既に実証済み

高速かつ実行可能な解を保証

AIの速度と従来手法の信頼性を両立
電力網など複雑な最適化問題に対応
実行可能性を100%保証する新手法
従来比で数倍の高速化を達成

マサチューセッツ工科大学(MIT)の研究チームが、実世界の課題解決を加速する2つの画期的なAI手法を発表しました。最適なAIモデルを効率的に選ぶ「CODA」と、複雑な問題を高速かつ確実に解く「FSNet」です。これらの技術は、AI導入のボトルネックを解消し、企業の生産性や収益性向上に直結する可能性を秘めています。

AI活用が進む一方、膨大な公開モデルから自社の課題に最適なものを選ぶ作業は大きな壁でした。有名なリポジトリには190万ものモデルが存在し、その評価だけでプロジェクトが停滞することも。この「モデル選択のジレンマ」が、AI実用化の足かせとなっていました。

MITが開発した「CODA」は、この問題を解決します。対話形式で最も情報価値の高いデータへのラベル付けを促すことで、評価作業を劇的に効率化。研究では、わずか25個のサンプルで最適なモデルを特定できたケースもあります。これにより、迅速かつ的確なモデル選択が可能になります。

一方、電力網管理などの最適化問題では、速度と信頼性の両立が課題です。従来の数学的ソルバーは正確ですが時間がかかり、AI予測は高速でも物理制約を破る「実行不可能な解」を出すリスクを抱えていました。失敗が許されない領域では、AIの導入は困難視されてきたのです。

新手法「FSNet」は、AIの速度と従来手法の信頼性を融合させました。まずAIが最適解を高速に予測し、次にその予測値を基に従来のソルバーが制約条件を100%満たすように解を微調整します。この2段階アプローチにより、従来比で数倍の速度向上と、実行可能性の完全な保証を両立させました。

これらの手法は具体的な成果を上げています。「CODA」は野生動物の画像分類で有効性を実証し、「FSNet」は電力網最適化で従来手法を凌駕する性能を示しました。応用範囲は生態系保護から金融、製造業まで、あらゆる産業の意思決定を変革する可能性を秘めています。

「CODA」と「FSNet」は、AIを単なる予測ツールから、現実世界の複雑なオペレーションを支える信頼性の高いパートナーへと引き上げるものです。AI導入の障壁を下げ、その価値を最大化するこれらの研究は、企業の競争力を左右する重要な鍵となるでしょう。今後のビジネス実装への展開が期待されます。

AIがキャプチャを無力化、次世代認証は『見えない壁』へ

AI進化で認証は過去に

AIが歪んだ文字や画像容易に認識
従来のCAPTCHAはほぼ形骸化
ユーザー体験を損なう課題も露呈

主流は『見えない認証』

Google等が新方式を主導
ユーザーの行動パターンを裏側で分析
リスクスコアで人間かボットかを自動判定

残存する奇妙な認証の狙い

攻撃コストを高め採算割れを狙う
生成AIが知らない奇抜な問いで対抗

ウェブサイトで歪んだ文字や信号機の画像を選ぶ「CAPTCHA」を見かける機会が激減しています。これは、AI技術の進化でボットが容易に突破できるようになったためです。現在、GoogleCloudflareなどが主導し、ユーザーの行動パターンを裏側で分析する「見えない認証が主流となりつつあります。ウェブセキュリティの常識が、AIによって大きく塗り替えられようとしているのです。

CAPTCHAは2003年、「コンピュータには解けないが人間には解けるタスク」として登場しました。当初は有効でしたが、AIの画像・文字認識能力が向上するにつれて、その役割を終えつつあります。ユーザーにとっても、複雑化する認証多大なストレスとなっており、ウェブサイト側も新たな対策を模索する必要に迫られていました。

そこで登場したのが、Googleの「reCaptcha v3」やCloudflareの「Turnstile」といった新しい認証方式です。これらの技術は、ユーザーにタスクを課す代わりに、マウスの動きや入力速度といった行動データを分析します。そして、人間らしさをスコア化し、ボットの疑いがある場合にのみ追加の認証を求める仕組みで、ほとんどのユーザーは認証を意識することさえありません。

なぜこれらの高度な認証サービスは無料で提供されるのでしょうか。それは、膨大なトラフィックデータを収集することが目的だからです。Cloudflareは「インターネット上の全HTTPリクエストの20%を観測している」と公言しています。この巨大な学習データが、人間とボットを見分けるAIモデルの精度をさらに高め、サービスの競争力を支えているのです。

一方で、今もまれに奇妙なCAPTCHAに遭遇することがあります。セキュリティ企業Arkose Labsなどが提供するこれらの認証は、ボット撃退が主目的ではありません。攻撃にかかる時間的・金銭的コストを意図的に引き上げ、攻撃者の採算を悪化させる「コストプルーフ」という考え方に基づいています。

特に生成AIによる攻撃への対策として、AIの学習データに存在しないような奇抜な画像が使われます。例えば「鳥の頭と馬の影を持つカエルの絵」について質問するなど、AIの『知らない』領域を突くことで、人間とAIを区別します。これは、AI時代の新たなセキュリティ攻防の一端と言えるでしょう。

今後、ウェブ認証はさらに多様化していく見込みです。GoogleはQRコードのスキャンや特定のハンドジェスチャーといった新しい認証方法を導入しています。攻撃手法が日々進化するのに伴い、防御側も常に新しい技術を開発し続けなければなりません。AI時代のセキュリティは、終わりなき適応の競争なのです。

Perplexity、Gettyと画像契約 盗用疑惑払拭へ

盗用疑惑から正規契約へ

AI検索画像大手Getty提携
検索結果に正規画像を表示
過去の無断使用や盗用疑惑に対応

帰属表示で透明性を確保

画像クレジットと出典リンクを明記
AI回答の信頼性と正確性を向上
コンテンツホルダーとの新たな協力関係を構築

AI検索スタートアップPerplexityは10月31日、ストックフォト大手Getty Imagesと複数年のライセンス契約を締結したと発表しました。これにより、同社のAI検索ツールでGettyの画像が正規に表示されます。過去のコンテンツ盗用疑惑への対応であり、正規パートナーシップ構築への大きな一歩となります。

Perplexityはこれまで、複数の報道機関からコンテンツの無断利用を指摘されてきました。特に、ウォール・ストリート・ジャーナルの記事からGettyの画像を無断で引用したとされるケースは、著作権侵害の議論を呼びました。最近では10月に、ユーザーコンテンツを大規模に不正スクレイピングしたとしてRedditから提訴されるなど、法的な逆風が強まっていました。

今回の契約を通じて、Perplexity検索結果に表示される画像に対し、クレジットと元のソースへのリンクを明記します。これにより、ユーザーはコンテンツの出所を正確に把握できるようになります。同社は「帰属表示と正確性は、AI時代に人々が世界を理解する上で不可欠だ」と述べ、透明性の確保を強調しています。

Getty Imagesの戦略開発担当副社長も、この合意が「AI製品を強化する上で、適切に帰属表示された同意の重要性を認めるものだ」とコメントしました。大手コンテンツホルダーと新興AI企業の提携は、AIの倫理的な利用と持続可能なエコシステム構築に向けたモデルケースとなる可能性があります。

この動きは、Perplexityがこれまで著作権侵害の指摘に対し「フェアユース(公正な利用)」を主張してきた戦略からの大きな転換を示唆します。高まる法的リスクと社会的な批判を受け、同社はコンテンツホルダーとの直接的なパートナーシップを構築する路線へと舵を切った形です。この戦略転換が、他のAI開発企業にどのような影響を与えるかが注目されます。

OpenAIとMS、専門家委がAGI達成を判定する新契約

AGI達成の新たな枠組み

OpenAIとMSがAGIに関する契約を刷新
AGI達成の判断は専門家委員会が実施
OpenAIの営利企業への構造転換が完了

AIが拓く創造と課題

Adobe、強力なAIクリエイティブツールを発表
低品質なAIコンテンツ量産のリスクも指摘

AIコンテンツとSNSの未来

MetaなどがAIコンテンツをフィードで推進
クリエイター経済への構造的変化の可能性

OpenAIマイクロソフトは、AGI(汎用人工知能)の定義と、その達成を誰がどのように判断するかを定めた新たな契約を締結しました。この新契約では、AGIの達成は専門家委員会によって判定されるという枠組みが示されています。この動きは、AI技術がビジネスの核心に深く関わる新時代を象徴するものです。一方で、Adobeが発表した最新AIツールは、創造性の向上と低品質コンテンツの氾濫という、AIがもたらす二面性を浮き彫りにしています。

今回の契約更新で最も注目されるのは、「AGI達成の判定」という、これまで曖昧だったプロセスに具体的な仕組みを導入した点です。両社は、AGIが人類に広範な利益をもたらす可能性がある一方、その定義と管理には慎重なアプローチが必要だと認識しています。この専門家委員会による判定は、技術的なマイルストーンをビジネス上の重要な意思決定プロセスに組み込む画期的な試みと言えるでしょう。

この契約の背景には、OpenAIが完了させた組織再編があります。非営利団体を親会社とする営利企業へと構造を転換したことで、同社の企業価値はさらに高まる見込みです。AGIの開発はもはや純粋な研究テーマではなく、巨額の資金が動くビジネスの中心となり、そのガバナンス体制の構築が急務となっていたのです。

一方で、AI技術の実用化はクリエイティブ分野で急速に進んでいます。アドビは年次イベント「Adobe Max」で、画像動画の編集を自動化する強力なAIツール群を発表しました。これらのツールは、専門家の作業を劇的に効率化し、コンテンツ制作の生産性を飛躍させる可能性を秘めています。ビジネスリーダーやエンジニアにとって、見逃せない変化です。

しかし、AIの進化は光ばかりではありません。アドビの発表には、SNS向けのコンテンツを自動生成するツールも含まれており、一部では「スロップ・マシン(低品質コンテンツ量産機)」になりかねないと懸念されています。AIが生成した無価値な情報がインターネットに氾濫するリスクは、プラットフォームとユーザー双方にとって深刻な課題です。

こうした状況の中、MetaやYouTubeといった大手プラットフォームは、AIが生成したコンテンツを自社のフィードで積極的に推進する方針を打ち出しています。これにより、人間のクリエイターが制作したコンテンツとの競合が激化し、クリエイター経済のあり方そのものが変わる可能性があります。企業は自社のコンテンツ戦略を根本から見直す必要に迫られるかもしれません。

AGIの定義から日々のコンテンツ制作まで、AIはあらゆる領域で既存のルールを書き換え始めています。この技術革新は、新たな市場価値と収益機会を生み出す一方で、倫理的な課題や市場の混乱も引き起こします。経営者やリーダーは、この機会とリスクの両面を正確に理解し、自社のビジネスにどう組み込むか、戦略的な判断を下していくことが求められます。

ホワイトハウス新ホール、AI酷似の欠陥は人為ミス

AI生成を疑う声

行き止まりの階段
不自然に融合した窓
AI特有の不整合性に酷似
設計図との矛盾も多数

専門家が指摘する真相

AIではなく人為的エラー
拙速な計画と品質管理の欠如
通常の監督プロセスを省略
人間の作業ミスが原因

トランプ米大統領が公開したホワイトハウス新ホールの物理模型が、専門家から批判を浴びています。行き止まりの階段など、AI生成物に見られるような奇妙な欠陥が複数指摘されましたが、真相はAIではなく人為的なエラーのようです。拙速な計画進行が背景にあると見られています。

模型には、壁で行き止まりになる階段や不自然に融合した窓、設計図にない余分な柱など、構造上の矛盾が多数見られます。これらは、近年注目される画像生成AIが作り出す非論理的な描写と酷似しており、当初はAI使用の憶測を呼びました。

しかし、複数の建築専門家はこれを「お粗末な人間の仕事」と一蹴します。イリノイ大学のポール・プライスナー教授は「AIのせいにできるものではなく、品質管理がないだけだ」と指摘。極端に急がされたスケジュールが、初歩的なミスの原因だと分析しています。

この異例の速さの背景には、トランプ大統領による監督プロセスの軽視があります。政府建造物のデザインを審査する美術委員会の委員を全員解任し、通常経るべきレビューを省略して計画を強行したことが、今回の品質低下を招いたとみられています。

AI技術が浸透する現代において、その特有の「欠陥」が、人間の作業品質を測る一つの指標になりつつあるのかもしれません。今回の事例は、技術の有無に関わらず、厳格な品質管理と監督プロセスがいかに重要であるかを浮き彫りにしています。

Pinterest、声で探すAIアシスタントを導入

声で探す新しい買い物体験

音声入力専用のAIアシスタント
保存ピンに基づき服装を提案
結果を音声簡潔にナレーション
テキスト検索引き続き利用可能

技術と今後の展開

会話形式で直感的な操作を実現
社内開発のマルチモーダルAIが中核
曖昧な要望もAIが具体化
米国ベータ版を提供開始

ビジュアル探索プラットフォームのPinterestは10月30日、音声で対話できる新しいAIショッピングアシスタントのベータ版を米国で提供開始しました。この機能は、ユーザーが保存したコレクションや閲覧中の画像をもとに、パーソナライズされたファッションのアイデアを提案します。Z世代を中心に、より会話的で直感的な検索体験を提供し、プラットフォーム上での購買活動を促進することが狙いです。

このAIアシスタントは、音声入力専用に設計されています。ユーザーがマイクボタンを押しながら話しかけると、AIが要望を解釈し、関連性の高いピンや商品を推薦。結果は画面に表示されるだけでなく、音声で簡潔に説明されます。これにより、ユーザーはより自然な形でインスピレーションを得られるようになります。なお、従来のテキストベースの検索機能は引き続き利用可能です。

CEOのビル・レディ氏は、ユーザーの検索クエリが長文化・複雑化している傾向を指摘します。「テイラー・スウィフトが好きで編み物も趣味」といった曖昧な要望でも、会話形式なら表現しやすいと説明。このニーズに応えるため、Pinterestは社内で独自のマルチモーダルAIモデルを開発しました。音声画像、テキスト情報を統合的に処理し、視覚的な提案を生成する「ビジュアルファースト」な設計が特徴です。

新機能はまず米国の成人ユーザーを対象にベータ版として公開され、今後数週間から数ヶ月かけて順次拡大される予定です。PinterestはこれまでもAIを活用してきましたが、過去には低品質なAI生成コンテンツの氾濫が問題視されたこともありました。同社はAI生成画像へのラベル表示などの対策を進めており、AI技術の責任ある活用とユーザー体験の向上を両立させる姿勢が問われます。

NVIDIA支援のAI、インドで乳がん早期発見に貢献

AIによる医療格差の是正

インド地方部へ移動式検診車を派遣
低コストで高品質な乳がん検診を実現
医療アクセス困難な女性を支援
AIによる迅速なトリアージを実施

移動式クリニックの実績

過去1年で3,500人以上を検診
受診者の90%が初のマンモグラフィ
約300件の異常所見を発見
24人の陽性患者を早期治療へ

NVIDIAが支援する米国スタートアップMedCognetics社が、AI技術を活用した移動式クリニックでインド地方部の医療アクセス改善に貢献しています。NPO法人と連携し、低コストで高品質な乳がん検診を提供。これまで検診機会のなかった多くの女性に、早期発見と治療の道を開いています。

この移動式クリニックは過去1年で、インドのプネー周辺の農村部で3,500人以上の女性を検診しました。驚くべきことに、その90%が初めてマンモグラフィを受ける人々でした。AIによる解析で約300件の異常所見が見つかり、うち24人が陽性と診断され、病状が進行する前に治療へと繋げられました。

この取り組みを支えるのが、MedCognetics社が開発したAIシステムです。同社のAIは米国食品医薬品局(FDA)の認可を受けており、NVIDIAの産業用エッジAIプラットフォーム「IGX Orin」などで動作します。クラウドだけでなく、将来的には検診車に搭載したハードウェアでAI分析を完結させることを目指しています。

検診車に放射線科医は同乗しません。AIがまずマンモグラフィ画像を解析し、腫瘍の疑いがあるリスクなケースを即座に特定します。これにより、都市部の専門医は優先順位の高い患者から遠隔で詳細な読影を行え、診断プロセスが大幅に効率化されます。特に、人の目では見逃しやすい小さな腫瘍の発見に威力を発揮します。

インドの人口の約3分の2が居住する地方部では、高価でアクセスしにくい医療のため、予防検診が敬遠されがちです。その結果、乳がんが進行した段階で発見されるケースが多く、生存率に直結する課題となっています。AIを活用した手頃で身近な検診サービスは、この状況を打破する大きな一歩と言えるでしょう。

Google、インドでAI Pro無料提供 巨大市場で攻勢

巨大市場狙うGoogleの一手

通信大手リライアンス・ジオ提携
AI Proを18カ月無料提供
約400ドル相当のサービスをバンドル
若年層から全国の利用者へ順次拡大

激化するインドAI覇権争い

10億人超の世界第2位インターネット市場
PerplexityOpenAIも無料プランで追随
法人向けGemini Enterpriseも展開
巨大テック企業の次なる主戦場に

Googleは10月30日、インドの複合企業リライアンス・インダストリーズと戦略的提携を結び、傘下の通信大手ジオの5Gユーザー数百万人に、AIアシスタントの有料版「AI Pro」を18カ月間無料で提供すると発表しました。世界第2位のインターネット市場であるインドで、急成長するAI分野の主導権を握る狙いです。競合他社の参入も相次いでおり、市場獲得競争が激化しています。

今回の無料提供は、インドでの月額料金1,950ルピー(約22ドル)の「AI Pro」プランが対象です。これには、最新AIモデル「Gemini 2.5 Pro」へのアクセス、AIによる画像動画生成機能の利用上限緩和、研究・学習支援ツール「Notebook LM」、さらにGoogleフォトやGmailで使える2TBのクラウドストレージが含まれ、総額約400ドルに相当します。

提供はまず18歳から25歳の若年層を対象に開始し、その後、全国のジオ加入者へと順次拡大される予定です。10億人以上のインターネット利用者を抱えるインドは、巨大テック企業にとって、多様なデータを収集し、AIモデルを改良するための最重要市場と見なされています。今回の提携は、その攻略を加速させる明確な一手と言えるでしょう。

インドのAI市場では、すでに競争が始まっています。3カ月前には、AI検索エンジンのPerplexityが、リライアンスの競合である通信大手バーティ・エアテルと組み、同様の無料提供を開始しました。また、OpenAIも11月4日から、インド国内の全ユーザーにエントリープラン「ChatGPT Go」を1年間無料で提供すると発表しています。

今回の提携は個人向けに留まりません。リライアンスはGoogle Cloudと連携し、インド国内でのTPU(テンソル・プロセッシング・ユニット)へのアクセスを拡大します。さらに、リライアンスのAI子会社はGoogle Cloudの戦略的パートナーとなり、法人向けAI「Gemini Enterprise」の国内展開を共同で推進する計画です。

Googleのスンダー・ピチャイCEOは「インドの消費者、企業、開発者コミュニティに最先端のAIツールを届ける」と声明で述べました。無料提供によるユーザー基盤の拡大は、生成AIの普及を後押しする一方、無料期間終了後の収益化が今後の焦点となりそうです。巨大市場インドを舞台にしたAI覇権争いは、新たな局面を迎えています。

AI発想支援Mixboard、180カ国超で提供開始

AIでアイデアをカタチに

実験的なAIコンセプトボード
テキストや画像自由に配置
AIによる画像生成・編集機能

世界展開と機能アップデート

提供国を180カ国以上に拡大
ユーザーの声でボード面積が4倍
企画や設計など多様な用途で活用

Googleは2025年10月30日、AIを活用した実験的なコンセプトボード「Mixboard」の提供を、新たに180カ国以上に拡大したと発表しました。このツールは、AIによる画像やテキストの生成・編集機能を持ち、ユーザーがアイデアを視覚的に探求し、具体化することを支援します。ビジネスの企画から個人の創作活動まで、幅広い活用が期待されます。

Mixboardの核となるのは、Google画像モデル「Gemini」を基盤とする「Nano Banana」です。ユーザーは簡単な指示で画像新規生成したり、既存の画像を編集したりできます。また、テキストブロックの自動生成や、手持ちの画像をボードにインポートすることも可能で、直感的な操作でアイデアを自由に配置、整理できます。

今回の発表では、提供国の拡大に加え、大幅な機能改善も行われました。9月の提供開始以降に寄せられたユーザーからのフィードバックを反映し、ボードの面積を従来の4倍に拡張。これにより、より複雑で大規模なアイデアも、一つのボード上でストレスなく展開できるようになりました。

すでにMixboardは多様なシーンで活用されています。公式ブログでは、パーティの企画、DIYプロジェクトの設計、アイデアのストーリーボード化といった事例が紹介されています。視覚的なブレインストーミングツールとして、チームでの共同作業や個人の創造性を飛躍的に高める可能性を秘めています。

Mixboardは、最新技術を試す「Google Labs」発の実験的なプロジェクトです。今回のグローバル展開と機能強化は、AIが創造的なプロセスを支援するツールとして本格的に普及する一歩と言えるでしょう。今後のさらなる進化に注目が集まります。

Google、AIで大気浄化 ブラジルで3事業を支援

AIで挑む3つの大気浄化策

廃棄物からのメタンガスを回収
AIで排出源特定と効果を監視
機械学習でアマゾンの森林再生
AIで森林の炭素貯留量を測定

新技術と地域連携で炭素除去

岩石風化作用でCO2を固定化
AIが炭素除去プロセスを最適化
地域社会への経済・環境貢献も両立
多様な解決策への継続的な投資

Googleブラジルで、AIと科学技術を駆使した3つの気候変動対策プロジェクトを支援していることが明らかになりました。廃棄物からのメタン回収、機械学習による森林再生、岩石を利用した二酸化炭素(CO2)除去といった多角的なアプローチで、大気の浄化を目指します。これらの取り組みは、地球規模の課題解決と地域社会への貢献を両立させるモデルとして注目されます。

まず、短期的に温暖化への影響が最も大きいメタンガス対策です。Googleは廃棄物管理会社Orizonと連携し、埋立地から発生するメタンを回収、エネルギーに転換する事業を支援。AIは、メタンの主要な排出源を特定し、削減策の効果を監視する上で重要な役割を果たします。これにより、強力な温室効果ガスが大気中に放出されるのを防ぎます。

次に、自然の力を活用した炭素除去です。パートナーのMombak社は、ブラジル最大の再植林企業で、機械学習とデータサイエンスを用いてアマゾンの劣化した土地に在来種の木々を植えています。AIを活用した衛星画像解析などで、森林がどれだけの炭素を吸収・貯蔵しているかを正確に測定・管理し、効果的な森林再生を推進します。

さらに、画期的な新技術も導入します。Terradot社は、岩石が自然にCO2を吸収する「風化」というプロセスを技術的に加速させる手法を開発。ブラジルの広大な農業地帯でこの技術を展開し、土壌の質を改善しつつ、大気中のCO2をギガトン規模で恒久的に除去する可能性を秘めています。AIモデルは、土壌や気象データを分析し、炭素除去効果を最大化します。

Googleはこれらのプロジェクトを通じて、気候変動対策には単一の万能薬はなく、多様な解決策の組み合わせが不可欠であると示しています。最先端のAI技術を環境分野に応用し、地域社会に経済的・環境的な利益をもたらすこれらの事例は、サステナビリティとビジネスを両立させたい企業にとって、大きな示唆を与えるものではないでしょうか。

Figma、AI動画生成Weavy買収 デザイン機能強化へ

買収の概要

デザイン大手Figmaがイスラエル企業を買収
買収額は非公開、従業員20名が合流
ブランド「Figma Weave」として統合予定

Weavyの強み

複数AIモデルで画像動画を生成
プロンプト微調整可能な高度編集機能
ノードベースで生成物を分岐・リミックス

今後の展望

当面はスタンドアロン製品として提供
Figmaのプラットフォームに順次統合

デザインプラットフォーム大手のFigmaは10月30日、AIによる画像動画生成を手がけるイスラエルのスタートアップWeavyを買収したと発表しました。Weavyの従業員20名がFigmaに合流し、同社の技術は新ブランド「Figma Weave」として将来的にはFigmaのプラットフォームに統合されます。この買収により、FigmaはデザインプロセスにおけるAI生成能力を大幅に強化する狙いです。

Weavyは2024年にテルアビブで設立された新興企業です。創業から1年足らずで、シードラウンドにて400万ドルを調達するなど注目を集めていました。同社のツールは、ユーザーが複数のAIモデルを組み合わせて高品質な画像動画を生成し、プロ向けの編集機能で細かく調整できる点が特徴です。

Weavyの技術的な強みは、その柔軟な生成プロセスにあります。ユーザーは無限キャンバス上で、画像生成動画生成プロンプトを組み合わせるなど自由な発想でメディアを作成できます。この「ノードベース」のアプローチにより、生成結果を分岐させたり、リミックスしたりと、創造的な試行錯誤と改良が容易になります。

Figmaによると、Weavyは当面スタンドアロン製品として提供が継続されます。その後、新ブランド「Figma Weave」としてFigmaのプラットフォーム全体に統合される計画です。Figmaのディラン・フィールドCEOは、Weavyの「シンプルさ、親しみやすさ、そしてパワフルさのバランス」を高く評価しており、統合によるシナジーに期待を寄せています。

AIデザインツールの市場は競争が激化しています。AI検索Perplexityデザインツールチームを買収するなど、大手テック企業によるAIクリエイティブ領域への投資が活発化しています。今回の買収は、デザインワークフローのあらゆる段階にAIを組み込もうとするFigmaの強い意志を示すものであり、今後の業界の動向を占う上で重要な一歩と言えるでしょう。

「AIブラウザは時限爆弾」専門家が重大警鐘

AIブラウザの3大リスク

性急な開発と未知の脆弱性
AIの記憶機能による過剰な追跡
悪用されやすいAIエージェント

巧妙化する攻撃手法

指示を注入するプロンプト攻撃
画像やメールに隠された命令
自動化による無限試行攻撃

ユーザーができる自衛策

AI機能は必要な時だけ利用
安全なサイトを手動で指定

OpenAIマイクロソフトなどが開発を急ぐAI搭載ブラウザについて、サイバーセキュリティ専門家が「時限爆弾だ」と重大な警鐘を鳴らしています。AIエージェントの悪用や過剰な個人情報追跡といった新たな脆弱性が指摘され、利便性の裏でユーザーが未知のリスクに晒されているとの懸念が急速に広がっています。

最大の脅威は「プロンプトインジェクション」です。これは、攻撃者がAIエージェント悪意のある指示を注入し、ユーザーに代わって不正操作を行わせる手口。画像やメールに巧妙に隠された命令で個人情報を盗んだり、マルウェアを仕込んだりする危険性があります。

また、AIブラウザは閲覧履歴やメール内容などあらゆる情報を学習する「記憶」機能を持ちます。これにより、かつてないほど詳細な個人プロファイルが生成されます。この情報がひとたび漏洩すれば、クレジットカード情報などと結びつき、甚大な被害につながりかねません。

各社が開発競争を急ぐあまり、製品の十分なテストや検証が不足している点も問題です。未知の脆弱性が残されたまま市場投入され、ハッカーに悪用される「ゼロデイ攻撃」のリスクを高めていると専門家は指摘。技術の急進展が安全性を犠牲にしている構図です。

AIエージェントを標的とした攻撃は、検知が非常に困難な点も厄介です。AIの判断を介するため、従来のセキュリティ対策では防ぎきれないケースが想定されます。攻撃者は自動化ツールで何度も試行できるため、防御側は不利な立場に置かれやすいのが現状です。

では、ユーザーはどう身を守ればよいのでしょうか。専門家は、AI機能をデフォルトでオフにし、必要な時だけ使うことを推奨します。AIに作業させる際は、URLを直接指定するなど、行動を限定的にすることが重要です。漠然とした指示は、意図せず危険なサイトへ誘導する可能性があります。

YouTube、低画質動画をAIでHD化 オプトアウトも可

AIによる自動高画質化

低解像度動画自動でHD画質化
将来的には4Kアップスケールも対応
対象は240p~720p動画

利用者の選択権を尊重

クリエイターオプトアウト可能
視聴者もオリジナル画質を選択可
意図しない視覚的歪みへの配慮

TV視聴体験のその他強化

QRコードによる即時ショッピング
4K対応の高画質サムネイル

YouTubeはテレビ画面での視聴体験を向上させるため、低解像度の動画をAIで自動的に高画質化する新機能を発表しました。この機能はクリエイターと視聴者の双方に無効化(オプトアウト)する選択肢を提供し、コンテンツの管理権を尊重する姿勢を示しています。将来的には4K解像度への対応も視野に入れています。

自動アップスケーリングの対象は、240pから720pでアップロードされた動画です。AI技術を用いてHD解像度まで引き上げ、クリエイターが自身でデジタルリマスターした1080pの動画には適用されません。YouTubeは「近い将来」、4Kへのアップスケーリングもサポートする計画です。

今回の機能で注目すべきは「オプトアウト」の選択肢です。過去には、クリエイターの同意なく動画が加工され、意図しない視覚的歪みが生じるとの不満がありました。この新機能では、クリエイターは元のファイルを維持でき、視聴者も設定からオリジナル解像度を選べるようになります。

視聴体験向上の取り組みは多岐にわたります。テレビ画面に表示されるQRコードをスマートフォンで読み取るだけで商品ページに直接アクセスできるショッピング機能や、4K画像に対応するためサムネイルのファイルサイズ上限を50MBに引き上げるなど、利便性向上が図られます。

YouTubeは「テレビ画面は最も成長している視聴環境」と明言しており、今後もクリエイターコンテンツが輝くような機能開発に注力する姿勢です。今回のアップデートは、巨大プラットフォームがAI技術とユーザーの選択権をいかに両立させるかを示す好例と言えるでしょう。

OpenAI、推論で安全性を動的分類する新モデル公開

新モデルの特長

開発者安全方針を直接定義
推論ポリシーを解釈し分類
判断根拠を思考過程で透明化
商用利用可能なオープンモデル

従来手法との違い

ポリシー変更時の再学習が不要
大量のラベル付きデータが不要
新たな脅威へ迅速な対応が可能

性能と実用上の課題

小型ながら高い分類性能を発揮
処理速度と計算コストが課題

OpenAIは2025年10月29日、開発者が定義した安全方針に基づき、AIが推論を用いてコンテンツを動的に分類する新しいオープンウェイトモデル「gpt-oss-safeguard」を発表しました。このモデルは、従来の大量データに基づく分類器とは異なり、ポリシー自体を直接解釈するため、柔軟かつ迅速な安全対策の導入を可能にします。研究プレビューとして公開され、コミュニティからのフィードバックを募ります。

最大の特徴は、AIの「推論能力」を活用する点です。開発者は自然言語で記述した安全方針を、分類対象のコンテンツと共にモデルへ入力します。モデルは方針を解釈し、コンテンツが方針に違反するかどうかを判断。その結論に至った思考の連鎖(Chain-of-Thought)」も示すため、開発者は判断根拠を明確に把握できます。

このアプローチは、従来の機械学習手法に比べて大きな利点があります。従来、安全方針を変更するには、数千件以上の事例データを再ラベル付けし、分類器を再学習させる必要がありました。しかし新モデルでは、方針テキストを修正するだけで対応可能です。これにより、巧妙化する新たな脅威や、文脈が複雑な問題にも迅速に適応できます。

例えば、ゲームのコミュニティサイトで不正行為に関する投稿を検出したり、ECサイトで偽レビューを特定したりと、各サービスの実情に合わせた独自の基準を容易に設定・運用できます。大規模なデータセットを用意できない開発者でも、質の高い安全分類器を構築できる道が開かれます。

性能評価では、社内ベンチマークにおいて、基盤モデルである「gpt-5-thinking」を上回る精度を示しました。一方で、特定の複雑なリスクに対しては、大量のデータで専用に訓練された従来の分類器に劣る場合があることや、推論プロセスに伴う計算コストと処理遅延が課題であることも認めています。

OpenAIは、社内ツール「Safety Reasoner」で同様のアプローチを既に採用しており、GPT-5画像生成AI「Sora 2」などの安全システムの中核を担っています。今回のオープンモデル公開は、こうした先進的な安全技術を広く共有し、コミュニティと共に発展させることを目指すものです。モデルはHugging Faceからダウンロード可能で、Apache 2.0ライセンスの下で自由に利用、改変、配布ができます。

NVIDIA、物理AI開発を加速する新基盤モデル

物理AI開発の課題

現実世界のデータ収集コスト
開発期間の長期化
多様なシナリオの網羅性不足

新Cosmosモデルの特長

テキスト等から動画世界を生成
気象や照明など環境を自在に変更
従来比3.5倍小型化し高速化

期待されるビジネス効果

開発サイクルの大幅な短縮
AIモデルの精度と安全性の向上

NVIDIAは2025年10月29日、物理AI開発を加速させるワールド基盤モデルNVIDIA Cosmos」のアップデートを発表しました。ロボットや自動運転車の訓練に必要な多様なシナリオのデータを、高速かつ大規模に合成生成する新モデルを公開。これにより、開発者は現実世界でのデータ収集に伴うコストや危険性を回避し、シミュレーションの精度を飛躍的に高めることが可能になります。

ロボットなどの物理AIは、現実世界の多様で予測不能な状況に対応する必要があります。しかし、そのための訓練データを実世界で収集するのは、莫大な時間とコスト、そして危険を伴います。特に、まれにしか起こらない危険なシナリオを網羅することは極めて困難です。この「データ収集の壁」を打ち破る鍵として、物理法則に基づいた合成データ生成が注目されています。

今回のアップデートでは、2つの主要モデルが刷新されました。「Cosmos Predict 2.5」は、テキストや画像動画から一貫性のある仮想世界を動画として生成します。一方「Cosmos Transfer 2.5」は、既存のシミュレーション環境に天候や照明、地形といった新たな条件を自在に追加し、データの多様性を飛躍的に高めます。モデルサイズも従来比3.5倍小型化され、処理速度が向上しました。

これらの新モデルは、NVIDIAの3D開発プラットフォーム「Omniverse」やロボットシミュレーション「Isaac Sim」とシームレスに連携します。開発者は、スマートフォンで撮影した現実空間からデジタルツインを生成し、そこに物理的に正確な3Dモデルを配置。その後、Cosmosを用いて無限に近いバリエーションの訓練データを生成する、という効率的なパイプラインを構築できます。

すでに多くの企業がこの技術の活用を進めています。汎用ロボット開発のSkild AI社は、ロボットの訓練期間を大幅に短縮。また、配送ロボットを手がけるServe Robotics社は、Isaac Simで生成した合成データを活用し、10万件以上の無人配送を成功させています。シミュレーションと現実のギャップを埋めることで、開発と実用化のサイクルが加速しています。

NVIDIAの今回の発表は、物理AI開発が新たな段階に入ったことを示唆します。合成データ生成の質と量が飛躍的に向上することで、これまで困難だった複雑なタスクをこなすロボットや、より安全な自動運転システムの開発が現実味を帯びてきました。経営者やリーダーは、この技術革新が自社の競争優位性にどう繋がるか、見極める必要があります。

NVIDIA、史上初5兆ドル企業に AIブームが加速

驚異的な成長スピード

4兆ドルから僅か3ヶ月で達成
2022年末から株価は約12倍
AppleMicrosoftを上回る

株価を押し上げた好材料

5000億ドルのAIチップ受注見込み
アメリカ政府向けスパコン7基構築
Nokiaと次世代通信網提携
対中輸出協議への期待感

半導体大手NVIDIAが29日、株式市場で時価総額5兆ドル(約750兆円)を史上初めて突破しました。生成AIブームを背景に同社のGPU画像処理半導体)への需要が爆発的に増加。CEOによる強気な受注見通しの発表や、米中間の取引協議への期待感が株価を押し上げ、4兆ドル達成からわずか3ヶ月で新たな大台に乗せました。

株価上昇の直接的な引き金は、ジェンスン・フアンCEOが発表した複数の好材料です。同氏は、最新AIチップ「Blackwell」と次世代「Rubin」について、2026年末までに累計5000億ドルの受注を見込むと表明。さらにアメリカ政府向けに7つのスーパーコンピュータを構築する計画も明らかにしました。

トランプ大統領の発言も市場の追い風となりました。同大統領は、中国の習近平国家主席とNVIDIAの高性能チップ「Blackwell」について協議する意向を示唆。これにより、現在輸出規制の対象となっている中国市場への販売再開に対する期待感が高まり、投資家の買いを誘いました。

NVIDIAの成長スピードは驚異的です。2022年末にChatGPTが登場して以降、同社の株価は約12倍に急騰しました。時価総額4兆ドルを突破したのが今年7月。そこからわずか3ヶ月で5兆ドルに到達し、AppleMicrosoftといった巨大テック企業を突き放す形となっています。

同社は事業領域の拡大にも余念がありません。フィンランドの通信機器大手Nokiaに10億ドルを投資し、AIをネイティブに活用する次世代通信規格「5G-Advanced」や「6G」ネットワークの共同開発で提携半導体事業に留まらない成長戦略を描いています。

一方で、市場ではAI関連株の急激な上昇を「バブルではないか」と懸念する声も根強くあります。しかし、フアンCEOは「我々が利用するAIモデルやサービスに対価を払っている。バブルだとは思わない」と述べ、実需に裏打ちされた成長であることを強調しました。

Meta、SNSにAI生成コンテンツ大量投入へ

AIが拓くSNSの新時代

友人・家族中心の第一期
クリエイター中心の第二期
AI生成コンテンツ第三の波

レコメンド技術が鍵

AI投稿を深く理解するシステム
ユーザーに最適なコンテンツを提示
AI動画アプリ「Vibes」で実験

好調な業績が後押し

第3四半期売上は26%増の好業績
「Vibes」で200億超画像生成

Metaのマーク・ザッカーバーグCEOは2025年10月29日の第3四半期決算発表で、FacebookInstagramなどのソーシャルフィードにAI生成コンテンツを大量に統合する計画を明らかにしました。AIによってコンテンツ作成が容易になることを背景に、これをソーシャルメディアの「第三の時代」を切り拓く重要な戦略と位置づけています。

ザッカーバーグ氏は、ソーシャルメディアの進化を二つの時代に分けて説明しました。第一の時代は友人や家族の投稿が中心、第二の時代はクリエイターコンテンツの台頭です。そして今、AIがもたらすコンテンツの爆発的な増加が、第三の大きな波になるとの見方を示しました。これは、私たちの情報消費のあり方を根本から変える可能性があります。

この変革の鍵を握るのが、レコメンデーションシステムです。AIが生成した膨大な投稿をシステムが「深く理解」し、個々のユーザーにとって最も価値のあるコンテンツを的確に表示する能力が、これまで以上に重要になるとザッカーバーグ氏は強調します。コンテンツの質と量のバランスをどう取るかが、今後の大きな課題となるでしょう。

Metaは既にこの未来に向けた布石を打っています。AI動画フィードアプリ「Vibes」では、ユーザーによって200億以上画像が生成されるなど、具体的な成果も出始めています。これはAIが可能にする全く新しいコンテンツ体験のほんの一例に過ぎません。

この大胆なAI戦略を支えているのが、同社の好調な業績です。第3四半期の売上は前年同期比26%増の512.4億ドルに達しました。潤沢な資金を背景に、MetaはAI分野への積極的な投資を続け、ソーシャルメディアの未来を再定義しようとしています。

Google、AIで米国の歴史遺産を映像化

AIで歴史を映像化

動画生成AI「VEO」を活用
過去の風景を没入型映像で再現
Geminiによる学習機能も提供

ルート66デジタルアーカイブ

2026年の100周年を記念
4000点以上の画像や資料を収録
23の文化団体との大規模連携
Google Arts & Cultureで公開

Googleは2025年10月29日、「Google Arts & Culture」上で米国の歴史的国道「ルート66」のデジタルアーカイブを公開しました。2026年に迎える100周年を記念するもので、歴史保存団体など23組織と連携。AI技術を駆使し、この象徴的な道路の歴史と文化を新たな形で伝えます。

プロジェクトの中核となるのが、Google動画生成AI「VEO」を活用した「Route 66 Rewind」です。この実験的機能は、過去の象徴的な場所がどのような姿だったかを映像で再現。現代のストリートビュー画像と比較しながら、没入感のある歴史体験を提供します。

このデジタルアーカイブ「A Cultural Trip Down Route 66」は、130以上の物語と4000点を超える画像・資料を収録。象徴的なランドマークだけでなく、沿道の多様なコミュニティやスモールビジネスにも光を当て、その文化的価値を浮き彫りにしています。

「マザー・ロード」の愛称で知られるルート66は、シカゴからサンタモニカまで約3,940kmを結ぶ米国の伝説的な道です。自動車文化や西部への移住を象徴し、歌や映画の題材にもなってきました。本プロジェクトは、この生きた歴史のシンボルを後世に伝える試みです。

AIとデジタルアーカイブを組み合わせることで、文化遺産の保存と活用に新たな可能性が示されました。テクノロジーがどのように歴史に命を吹き込み、新たな価値を創造できるかを示す好例と言えるでしょう。ビジネスリーダーや開発者にとっても示唆に富む取り組みです。

Extropic、省エネAIチップでデータセンター覆す

新方式「熱力学チップ」

GPUとは根本的に異なる仕組み
熱のゆらぎを利用して計算
確率的ビット(p-bit)で動作
数千倍のエネルギー効率目標

初の試作機と将来性

初の実動ハードウェアを開発
AIラボや気象予測企業で試験
次世代機で拡散モデルを革新へ
データセンター電力問題に挑戦

スタートアップのExtropic社が、データセンターの常識を覆す可能性を秘めた新型コンピュータチップの最初の実動ハードウェアを開発しました。この「熱力学的サンプリングユニット(TSU)」は、従来のチップより数千倍のエネルギー効率を目指しており、AIの爆発的な普及に伴う莫大な電力消費問題への画期的な解決策として注目されています。

TSUは、GPUなどが用いる0か1のビットとは根本的に異なります。熱力学的な電子のゆらぎを利用して確率そのものを扱う「確率的ビット(p-bit)」で動作します。これにより、AIモデルや気象予測など、複雑なシステムの確率計算を極めて効率的に行えるようになります。この革新的なアプローチが、省エネ性能の鍵です。

同社は今回、初の試作機「XTR-0」を開発し、一部のパートナー企業への提供を開始しました。提供先には、最先端のAI研究を行うラボや気象モデリングを手がけるスタートアップ、さらには複数の政府関係者が含まれており、実環境での有用性の検証が始まっています。

パートナーの一社である気象予測AI企業Atmo社のCEOは、この新技術に大きな期待を寄せています。Extropicのチップを使えば、様々な気象条件が発生する確率を従来よりはるかに効率的に計算できる可能性があると述べており、より高解像度な予測モデルの実現につながるかもしれません。

Extropic社は、将来の展望も具体的に示しています。同社が発表した論文では、数千個のp-bitを搭載した次世代チップで、画像生成AIなどに用いられる「拡散モデル」を効率化できると説明。来年には25万p-bitを搭載したチップ「Z-1」の提供を目指しています。

この独自のアプローチは、業界専門家からも高く評価されています。ある専門家は「従来のトランジスタのスケーリングが物理的な限界に達する中、Extropic社の物理情報処理へのアプローチは、今後10年で変革をもたらす可能性がある」と指摘しています。

AIデータセンターへの巨額投資が続く一方で、そのエネルギー需要は深刻な課題です。Extropic社の挑戦は、ハードウェアの根本的な革新によってこの問題を解決しようとするものです。たとえ成功確率がわずかでも、試す価値のある重要な取り組みだと言えるでしょう。

鬼才監督、AI批判のため「醜悪な」画像をあえて使用

意図的なAIの「悪用」

新作映画でAI画像を多用
AIを「グロテスクで気味悪い」と評価
技術自体を批評する目的で活用
制作予算の削減という現実的な側面も

AI表現の新たな可能性

AI生成画像のエラーを意図的に採用
「手が3本ある人物」などの不気味さ
新たな芸術性「デジタルの詩」の発見
AIを拒絶せず新しいツールと認識

ルーマニアの映画監督ラドゥ・ジュデ氏が、新作映画『Dracula』でAI生成画像を意図的に使用し、物議を醸しています。ジュデ監督はAIを「グロテスクで気味悪い」と評しながらも、その技術が持つ問題を批評するためにあえて活用。この挑発的な試みは、創造性とテクノロジーの関係に新たな問いを投げかけています。

なぜ、批判的な監督がAIを使ったのでしょうか。ジュデ監督は、AIが生成する画像には「キッチュで悪趣味な要素」が常につきまとうと指摘。その醜悪さこそがAIの本質を突くと考え、批評の道具として利用しました。また、限られた予算の中で映画を製作するための現実的な解決策でもあったと明かしています。

監督が注目したのは、AIが生み出す「エラー」です。フォトリアルな完成度ではなく、手が3本ある人物など、AIが犯す「間違い」を意図的に採用。そこに不気味さだけでなく、「デジタルの詩」とでも言うべき新たな芸術性を見出したのです。AIの不完全さを逆手に取った表現手法と言えるでしょう。

この試みは、特にAIに敏感なアメリカの映画業界で大きな反発を招きました。しかし監督は、ルーマニアの映画産業は規模が小さく「失うものがない」ため、こうした実験が可能だったと語ります。業界の反発を覚悟の上で、新しいツールとしてのAIの可能性と危険性を探ることを選びました。

監督は、AIがアーティストの創造的な労働力を吸い上げて成り立つ様子を、マルクスの資本論になぞらえ「吸血鬼的」だと表現します。まさに映画の題材である『Dracula』とAIの搾取的な側面を重ね合わせ、テクノロジーが内包する問題を鋭くえぐり出しているのです。

ジュデ監督は今後も、必要に応じてAIを使用することに躊躇はないと述べています。彼の挑戦は、AIを一方的に拒絶するのではなく、その本質を理解し、批評的に関わることの重要性を示唆します。テクノロジーとどう向き合うべきか、経営者エンジニアにとっても示唆に富む事例です。

Google、AIでSNS投稿自動生成ツール公開

Pomelliの3ステップ

URL入力でブランドDNAを自動抽出
DNAに基づきキャンペーン案を自動生成
プロンプト独自アイデアも反映可能
SNSや広告向け素材一式を即時作成

提供状況と特徴

ツール内でテキストや画像を直接編集
中小企業マーケティングを支援
米・加・豪・NZで英語ベータ版提供開始

Googleは10月28日、中小企業SMB)向けの新しいAIマーケティングツール「Pomelli」のパブリックベータ版を公開しました。Google LabsとDeepMindが共同開発したこのツールは、専門知識や予算が限られる中小企業でも、ブランドイメージに合ったSNSキャンペーンを簡単に作成し、ビジネス成長を加速させることを目的としています。

Pomelliの最大の特徴は、わずか3ステップでキャンペーンを作成できる手軽さです。まず、企業のウェブサイトURLを入力すると、AIがサイトを分析。ブランドのトーン&マナー、フォント、配色、画像などを自動で抽出し、企業独自の「ビジネスDNA」を構築します。これが以降のコンテンツ生成の基盤となります。

次に、構築された「ビジネスDNA」に基づいて、AIがターゲットに響くキャンペーンのアイデアを複数提案します。利用者はその中から最適なものを選ぶだけで、戦略的なコンテンツ作成に着手できます。また、独自のアイデアがある場合は、プロンプトとして入力することで、より細かく意図を反映したコンテンツを生成することも可能です。

最後に、選んだアイデアに基づき、SNS投稿、ウェブサイト、広告などで使える高品質なマーケティング素材一式が自動で生成されます。生成されたテキストや画像はツール内で直接編集でき、企業の細かなニーズに合わせて調整が可能。完成した素材はすぐにダウンロードし、各チャネルで活用できます。

Pomelliは現在、米国、カナダ、オーストラリア、ニュージーランドで英語のパブリックベータ版として提供されています。Googleはこれを初期の実験と位置づけており、利用者からのフィードバックを積極的に求めています。中小企業のマーケティング活動を根本から変える可能性を秘めたツールとして、今後の展開が注目されます。

Googleの教育AI、米1000大学で1000万人利用

教育現場でAI活用が加速

米国1000以上の高等教育機関が導入
利用学生数は1000万人を突破
MITやブラウン大学など名門校も採用
教育機関向けにデータ保護されたAIを提供

学習から就活まで支援

小テストや学習ガイドの個別生成
論文執筆のための情報要約・分析
証明写真や部屋の画像生成機能

Googleは2025年10月28日、同社の生成AI「Gemini for Education」が、米国の1000以上の高等教育機関で導入され、1000万人以上の学生に利用されていると発表しました。学習支援から就職活動まで幅広く活用されており、教育現場におけるAIの浸透が急速に進んでいます。

導入機関にはマサチューセッツ工科大学(MIT)やブラウン大学といった名門校も含まれます。Googleは、教育機関向けにデータ保護を強化したAIツールを無償で提供しており、これが急速な普及を後押ししていると考えられます。

学生教員は、Geminiを用いて試験対策用の小テストを作成したり、研究プロジェクトで必要な情報を要約・分析したりしています。また、寮の部屋のデザイン案や就職活動用の証明写真を生成するなど、学業以外でのクリエイティブな活用も広がっています。

今後は、簡単な指示(プロンプト)だけでプレゼンテーション資料を自動で作成し、Googleスライドにエクスポートする機能などが追加される予定です。これにより、学生教員生産性はさらに向上すると期待されます。

Gemini for Education」と研究ノートツール「NotebookLM」は、教育機関が利用する生産性向上スイートの種類を問わず、無償で導入可能です。GoogleはAI人材育成も視野に入れ、教育分野でのエコシステム構築を急いでいます。

Adobe、画像・音声生成AIを全方位で強化

Fireflyが大幅進化

新モデルFirefly Image 5登場
プロンプトレイヤー編集が可能に
独自スタイルでカスタムモデル作成

AIアシスタント登場

PhotoshopとExpressに搭載
自然言語で複雑な編集を自動化
複数アプリを統括するMoonlight

音声・動画生成も強化

動画に合わせたBGMを自動生成
テキストから高品質なナレーション生成

アドビは2025年10月28日、年次カンファレンス「Adobe Max 2025」で、生成AI機能群の大幅なアップデートを発表しました。中核となる画像生成AI「Firefly」の新モデルや、Photoshopなどに搭載されるAIアシスタント、BGMやナレーションを自動生成する音声ツールを公開。クリエイティブ制作の生産性と表現力を飛躍的に高めることを目指します。

画像生成AIの最新版「Firefly Image 5」は、性能が大きく向上しました。ネイティブで最大4メガピクセルの高解像度画像に対応するほか、オブジェクトを個別に認識しプロンプトで編集できるレイヤー機能を搭載。クリエイター自身の作品を学習させ、独自の画風を持つカスタムモデルを作成することも可能になります。

「Photoshop」と「Express」には、新たにAIアシスタントが導入されます。これにより、ユーザーは「背景を削除して」といった自然言語の指示で、複雑な編集作業を自動化できます。専門的なツール操作を覚える必要がなくなり、あらゆるスキルレベルのユーザーが、より直感的にアイデアを形にできるようになるでしょう。

動画制作者にとって画期的な音声生成機能も追加されました。「Generate Soundtrack」はアップロードされた動画の内容を解析し、最適なBGMを自動生成します。「Generate Speech」はテキストから自然なナレーションを作成。これらは商用利用も可能で、コンテンツ制作の効率を劇的に改善します。

将来構想として、複数アプリを統括するAIエージェント「Project Moonlight」も発表。このAIはCreative CloudやSNSアカウントと連携し、ユーザーの作風やブランド戦略を学習。一貫性のあるコンテンツの企画から制作、投稿戦略の立案までを支援する、まさに「クリエイティブディレクター」のような役割を担います。

アドビは自社モデルだけでなく、GoogleGeminiなどサードパーティ製AIモデルの採用も進めています。今回の発表は、クリエイティブの全工程にAIを深く統合し、制作プロセスそのものを変革しようとする同社の強い意志を示すものです。クリエイター生産性向上と、新たな表現の可能性が大きく広がりそうです。

Pinterest、AIでファッション提案を個人最適化

AIが創る2つの新体験

保存画像からコーデを自動生成
AIが作るパーソナライズドボード
タップで着回しアイデアを提案

目指すはAIアシスタント

ショッピング体験をAIで進化
単なる整理ツールからの脱却
ユーザーの好みを深く学習

米国・カナダから先行導入

まず北米2カ国でテスト開始
今後数ヶ月以内に展開予定

画像共有サービス大手のPinterestは10月27日、AIを活用した新たなパーソナライズ機能を発表しました。ユーザーが保存したファッションアイテムの画像からAIがコーディネートを自動生成する「Styled for you」などが含まれます。この機能により、同社は単なる整理ツールから脱却し、「AIショッピングアシスタント」としての地位確立を目指します。

新機能の目玉の一つが「Styled for you」です。これは、ユーザーが保存した洋服やアクセサリーのピン(画像)をAIが解析し、コラージュ形式で新しいコーディネートを提案するものです。ユーザーはコラージュ内のアイテムをタップするだけで、AIが推奨する他のアイテムとの着回しアイデアを次々と試すことができます。

もう一つの新機能「Boards made for you」は、AIがユーザーのために作成するパーソナライズされたボード(作品集)です。専門家による編集部の知見とAIの推薦を組み合わせ、トレンドのスタイルや週ごとのコーディネート、購入可能な商品情報などを提供。ユーザーのホームフィードや受信箱に直接届けられます。

これらの新機能は、Pinterestを「AI対応のショッピングアシスタント」へと進化させるという、同社の長期的な戦略に基づいています。CEOが収支報告会で述べたように、AIを用いてアイデアの発見から購買までをシームレスに繋ぎ、ユーザー体験を根本から変えることを目指しているのです。

新機能はまず米国とカナダで試験的に導入され、今後数ヶ月以内に本格展開される予定です。また、これとは別に、保存したピンをカテゴリーごとに整理する新しいタブ機能も、今後数ヶ月で全世界に展開される計画です。

興味深いのは、PinterestがAI活用を推進する一方で、AIが生成した低品質なコンテンツへの対策も同時に進めている点です。AI生成画像へのラベリングや、ユーザーがフィードに表示されるAIコンテンツの量を制御できる機能を導入しており、プラットフォームの質を維持する姿勢を示しています。

AI兵器開発が加速、チャットボットが戦場へ

AI兵器開発の最前線

音声命令でドローン群を操作
指揮命令系統を効率化するAI
ウクライナ戦争が価値を証明
10-20年で戦争は高度に自動化

大手テックの参入と課題

国防AI関連契約は1年間で1200%増
OpenAIなど大手も軍事契約
強みは諜報・サイバー攻撃
課題は信頼性とエラーの多さ

米国の防衛関連企業Andurilが、大規模言語モデル(LLM)を活用した自律型ドローンの実験を公開しました。音声コマンドで模擬敵機を撃墜するなど、AIを指揮命令系統に組み込む試みが進んでいます。米国防総省は、ウクライナ戦争で価値が証明された自律型兵器の開発を急いでおり、大手テック企業も次々と参入。AIが戦場の様相を一変させる未来が現実味を帯びています。

開発が加速する背景には、ウクライナ戦争があります。低コストで戦況を有利にする自律型ドローンの有効性が世界に示されたのです。さらに、AI技術の覇権を巡る米中間の競争も激化しています。最先端技術を制する者が世界を制するという戦略思想のもと、米国はAI兵器への投資を急速に拡大しているのです。

投資額の伸びは驚異的です。ブルッキングス研究所の報告によると、米連邦政府のAI関連契約額は2022年8月から1年間で1200%増加し、その大半を国防総省が占めています。2026年度の国防予算には、AIと自律性専門で134億ドルが初めて計上されるなど、国家としての推進姿勢は鮮明です。

この潮流は、かつて軍事協力をためらった大手テック企業の姿勢をも変えました。2018年にはGoogleがAI画像解析プロジェクトから撤退しましたが、現在ではOpenAIGoogleAnthropicなどが、それぞれ最大2億ドル規模の軍事関連契約を獲得。AIの軍事転用が巨大ビジネスになりつつあります。

LLMはなぜ軍事利用に適しているのでしょうか。専門家は、大量の情報を解析・要約する能力が諜報活動に、コード生成・分析能力がサイバー攻撃に非常に有効だと指摘します。一方で、現在のモデルは誤情報を生成するなど信頼性に課題を抱え、戦場での直接的な意思決定を任せるには時期尚早との見方もあります。

とはいえ、技術の進化は止まりません。AndurilはMeta社と共同で、兵士向けのARヘルメットを開発中です。専門家は、10〜20年後には自律性の高いロボットが戦場で活動するのが当たり前になると予測します。AIが自らの判断と行動を「自分の言葉で」説明する、そんな未来の戦争が迫っています。

画像生成AIの悪用、偽造領収書で経費不正が急増

生成AIによる不正の現状

画像生成AIで領収書を偽造
不正書類の14%がAI製との報告
90日で100万ドル超の不正請求も
財務担当者の3割が不正増を実感

偽造の手口と対策

テキスト指示だけで数秒で作成可能
専門家も「目で見て信用するな
経費精算システムのAI検知が重要

画像生成AIの進化が、企業の経費精算に新たな脅威をもたらしています。欧米企業で、従業員がOpenAIGPT-4oなどのAIを使い、偽の領収書を作成して経費を不正請求する事例が急増。経費管理ソフト各社は、AIによる不正検知機能の強化を急いでいます。これは、テクノロジーの進化がもたらす負の側面と言えるでしょう。

不正の規模は深刻です。ソフトウェアプロバイダーのAppZenによると、今年9月に提出された不正書類のうち、AIによる偽造領収書は全体の約14%を占めました。昨年は一件も確認されていなかったことからも、その増加ペースの速さがうかがえます。フィンテック企業Rampでは、新システムがわずか90日間で100万ドル以上の不正請求書を検出しました。

現場の危機感も高まっています。経費管理プラットフォームMediusの調査では、米国英国の財務専門家約3割が、OpenAIの高性能モデル「GPT-4o」が昨年リリースされて以降、偽造領収書の増加を実感していると回答。新たなAI技術の登場が、不正行為の明確な転換点となったことが示唆されています。

生成される領収書は極めて精巧で、人間の目での判別はほぼ不可能です。世界的な経費精算プラットフォームであるSAP Concurの幹部は「もはや目で見て信用してはいけない」と顧客に警告を発しています。同社では、AIを用いて月に8000万件以上コンプライアンスチェックを行い、不正の検出にあたっています。

なぜ、これほどまでに不正が広がったのでしょうか。従来、領収書の偽造には写真編集ソフトを扱う専門スキルや、オンライン業者への依頼が必要でした。しかし現在では、誰でも無料で使える画像生成AIに簡単なテキストで指示するだけで、わずか数秒で本物そっくりの領収書を作成できてしまうのです。

AI開発企業も対策を進めています。OpenAIは、規約違反には対処し、生成画像にはAIが作成したことを示すメタデータを付与していると説明します。しかし、悪意ある利用を完全に防ぐことは困難です。企業はもはや性善説に頼るのではなく、AIを活用した検知システムの導入が喫緊の課題となっています。

AIが作る偽の豪華休暇、新たな現実逃避市場が台頭

AIで偽の自分を生成

自分の顔写真から簡単生成
豪華な休暇を疑似体験
SNSでの見栄とは違う目的

現実逃避と自己実現

低所得者層が主な利用者
「引き寄せの法則」をAIで実践
叶わぬ願望を仮想体験

新たな課金モデル

少量画像生成課金誘導
C向けAIアプリの新潮流

AI技術を活用し、自分が豪華な休暇を楽しんでいるかのような偽の画像を生成するスマートフォンアプリが新たな注目を集めています。これらのアプリは、経済的な理由で旅行に行けない人々などに、一種の「デジタルな現実逃避」を提供。SNSでの見栄を張るためだけでなく、より良い人生を願う「引き寄せ」の一環として利用する動きが、特にアジアの若者などの間で広がっています。

この動きは、高級ブランドの模倣品を購入したり、プライベートジェット風のセットで写真を撮ったりする、従来の「富を偽る」行為の延長線上にあります。しかし、その目的は他者への誇示から、個人的な精神的満足へとシフトしている点が特徴です。AIが可能にした、よりパーソナルで没入感の高い体験が、新たな需要を生み出していると言えるでしょう。

具体的な事例として、インドネシアの状況が挙げられます。OpenAIコンサルタントによると、月収400ドル以下の低・中所得者層が集まるFacebookグループでは、ランボルギーニと写る自分など、AIが生成した豪華な体験写真が数多く共有されています。これは「決して生きられないであろう人生」を仮想的に体験する、現代的な現実逃避の形と言えます。

Metaデザイナーが開発した「Endless Summer」というアプリも、この潮流を象徴しています。このアプリは「燃え尽き症候群に陥った時に、偽の休暇写真で理想の生活を引き寄せる」というコンセプトを掲げています。数枚の自撮り写真を提供するだけで、世界中の観光地にいるかのような自分の画像を生成できる手軽さが特徴です。

ビジネスモデルとしては、数枚の画像を無料で生成させた後、より多くの画像を求めて有料プランへ誘導する手法が一般的です。例えば「Endless Summer」では30枚の画像生成に3.99ドルが必要となります。しかし、生成される画像の質はアプリによってばらつきがあり、本人とは似ても似つかない場合も少なくありません。

この「AIによる現実逃避」サービスは、消費者向けAIアプリの新たな市場可能性を示唆しています。一方で、デジタルな偽りの自己像への没入が、現実世界との乖離を助長するリスクもはらんでいます。経営者開発者は、人間の心理的な欲求を捉えたサービス開発と、その倫理的な課題の両面に目を向ける必要がありそうです。

不動産広告、AIが生成した「理想の家」に要注意

AI利用の急速な普及

不動産業者の8割以上AI活用
AIによる内見動画の自動生成
ChatGPTで物件説明文を作成

虚偽・誇張表示のリスク

存在しない家具や階段の生成
法的・倫理な問題に発展
消費者の不信感が深刻化

背景と今後の課題

大幅なコスト削減と時間短縮
安易な利用による品質低下

米国不動産業界で、生成AIを活用した物件広告が急速に広がっています。多くの不動産業者が、コスト削減や生産性向上を目的にAIツールを導入。しかし、実際には存在しない豪華な家具を画像に書き加えたり、物件の特徴を不正確に描写したりする「虚偽・誇張表示」が横行し、消費者の間で混乱と不信感が高まっています。

全米不動産業者協会によると、会員の8〜9割が既に何らかの形でAIを利用していると回答しています。特に注目されるのが、物件の写真から宣伝用の動画を自動生成するアプリです。空っぽの部屋にAIが家具を配置し、ナレーションまで加えることで、数分で魅力的な内見動画が完成します。これにより、従来は高額だった映像制作費を大幅に削減できるのです。

しかし、その利便性の裏で問題が深刻化しています。AIが生成した画像には、現実には存在しない階段や、不自然に改変された窓などが含まれる事例が報告されています。ミシガン州のある住宅所有者は、AIによって加工された自宅の広告画像が、本来の姿とは全く異なることに気づき、SNSで警鐘を鳴らしました。これは単なる誇張を超え、物件の価値を誤認させる虚偽表示と言えるでしょう。

業界内ではAI活用を肯定する声も根強くあります。「なぜ数日と数百ドルをかけて専門業者に頼む必要があるのか。ChatGPTなら無料で数秒だ」と語る不動産関係者もいます。実際に、バーチャルステージング(CGで室内に家具を配置する技術)の市場は、生成AIの登場で大きく変容しつつあります。

一方で、規制当局や業界団体は危機感を強めています。全米不動産業者協会は、AIが生成した画像に関する法整備はまだ「不透明」であるとしつつ、誤解を招く画像の使用を禁じる倫理規定を会員に遵守するよう求めています。 deceptiveな(欺瞞的な)広告は、罰金や訴訟につながる可能性があります。

問題は画像だけではありません。ChatGPTが生成する物件説明文には「nestled(〜に位置する)」という単語が頻出するなど、思考停止でAIの出力をコピー&ペーストするだけの安易な利用法も目立ちます。専門家は、このような姿勢ではエージェントとしての付加価値は生まれず、業界全体の信頼を損なうと指摘します。

住宅は多くの人にとって「人生最大の買い物」です。買い手は、購入を検討する初期段階で騙されることを望んでいません。生産性向上を追求するあまり、ビジネスの根幹である消費者との信頼関係を損なっては本末転倒です。AIをビジネスに活用する全ての経営者やリーダーにとって、この問題は対岸の火事ではないでしょう。

米ICE、AIでSNS監視強化 8.5億円で契約

AI監視システムの概要

Zignal Labs社と8.5億円契約
AIで1日80億件の投稿を分析
100以上の言語に対応
位置情報や画像から個人特定

監視強化への懸念

言論の自由への「攻撃」との批判
移民や活動家も標的に
プライバシー侵害と萎縮効果
政府による大規模な意見監視

米国の移民・税関執行局(ICE)が、AIを活用したソーシャルメディア監視システムを開発するZignal Labs社と、570万ドル(約8.5億円)の契約を締結したことが明らかになりました。この動きは、ウェブ上の数百万人のユーザーを追跡し、法執行任務を強化する目的がありますが、専門家からは「民主主義と言論の自由への攻撃だ」と強い懸念の声が上がっています。

Zignal Labs社のシステムは、1日に80億件以上のSNS投稿を100以上の言語で分析できる「リアルタイム情報プラットフォーム」です。機械学習画像認識技術を駆使し、投稿された写真や動画の位置情報、写り込んだ紋章などから個人の特定や所在地の割り出しが可能だとされています。

ICEはこの技術を用いて、国家安全保障上の脅威となる人物や国外追放対象者を特定する「選別された検知フィード」を作成する可能性があります。実際に、ICEはSNS上のコンテンツを24時間体制で監視し、対象者の家族や友人、同僚のデータまで調査する計画も報じられています。

この大規模な監視に対し、監視技術監督プロジェクト(STOP)や電子フロンティア財団(EFF)などの団体は強く反発しています。彼らは「AIによる自動監視は、政府が気に入らない意見を弾圧するために使われかねず、社会に深刻な萎縮効果をもたらす」と警鐘を鳴らしています。

ICEの監視手法はSNSに留まりません。すでに全米のナンバープレートスキャン網や、数億台の携帯電話の位置情報を追跡するツールにもアクセスしていると報じられています。政府による監視は拡大の一途をたどっており、その透明性が問われています。

強力なAI監視ツールが法執行機関の手に渡ることで、個人のプライバシーと言論の自由は新たな脅威にさらされています。納税者の資金で賄われるこの監視システムが、移民だけでなく政府に批判的な活動家を標的にする可能性も指摘されており、その運用には厳しい目が向けられるべきでしょう。

ChatGPT、社内データ横断検索で業務を革新

社内情報の検索エンジン化

SlackやDriveと直接連携
複数アプリを横断した情報検索
アプリ切替不要で作業効率化

高精度な回答と信頼性

GPT-5搭載で高精度な回答
回答には出典を明記し信頼性確保
曖昧な質問にも多角的に回答

利用上の注意点

機能利用には手動選択が必要
ウェブ検索画像生成同時利用不可

OpenAIは2025年10月24日、法人および教育機関向けChatGPTに新機能「company knowledge」を導入したと発表しました。この機能は、SlackGoogle Driveといった社内ツールと連携し、組織内の情報を横断的に検索できるものです。アプリを切り替える手間を省き、情報探索の効率を飛躍的に高めることを目的としています。

新機能の最大の特徴は、ChatGPT社内情報のハブとして機能する点です。ユーザーは使い慣れたチャット画面から、Slackの会話、SharePointの文書、Google Driveの資料などを直接検索できます。これにより、散在する情報の中から必要なものを迅速に見つけ出すことが可能になります。

この機能は、最新のGPT-5モデルを基盤としています。複数の情報源を同時に検索・分析し、より包括的で精度の高い回答を生成するよう特別に訓練されています。これにより、単純なキーワード検索では得られなかった洞察や要約を提供します。競合のAnthropic社も同様の機能を発表しており、AIの業務活用競争が激化しています。

回答の信頼性も重視されています。すべての回答には明確な出典が引用として表示されるため、ユーザーは情報の出所を簡単に確認できます。例えば、顧客との打ち合わせ前に、関連メールや過去の議事録を基にしたブリーフィング資料を自動で作成するといった活用が可能です。

「来年の会社目標はどうなったか?」といった曖昧な質問にも対応します。ChatGPTは複数の情報源から関連情報を探し出し、矛盾する内容を整理しながら、総合的な回答を提示します。日付フィルター機能も備え、時系列に沿った情報検索も得意とします。

ただし、利用にはいくつかの注意点があります。現時点では、この機能を使うには会話を開始する際に手動で選択する必要があります。また、有効化している間はウェブ検索やグラフ・画像の生成といった他の機能は利用できません。OpenAIは今後数ヶ月で機能拡張を予定しています。

Mistral、企業向けAI開発・運用基盤を発表

AI開発の本番運用を支援

試作から本番運用への移行を促進
EU拠点のインフラデータ主権を確保
専門家以外も使える開発ツール

統合プラットフォームの3本柱

システムの振る舞いを可視化する可観測性
RAGも支える実行ランタイム
AI資産を一元管理するAIレジストリ

豊富なモデルと柔軟な展開

オープンソースから商用まで多数のモデル
クラウドやオンプレミスなど柔軟な展開

2025年10月24日、フランスのAIスタートアップMistral AIは、企業がAIアプリケーションを大規模に開発・運用するための新プラットフォーム「Mistral AI Studio」を発表しました。多くのAI開発が試作段階で止まってしまう課題を解決し、信頼性の高い本番システムへの移行を支援することが目的です。Googleなど米国勢に対抗する欧州発の選択肢としても注目されます。

同社はAI Studioを、AI開発における「プロダクションファビリック(生産基盤)」と位置付けています。AIモデルのバージョン管理や性能低下の追跡、コンプライアンス確保など、多くのチームが直面するインフラ面の課題解決を目指します。これにより、アイデアの検証から信頼できるシステム運用までのギャップを埋めます。

プラットフォームは3つの柱で構成されます。AIシステムの振る舞いを可視化する「可観測性」、検索拡張生成(RAG)なども支える実行基盤「エージェントランタイム」、そしてAI資産を一元管理する「AIレジストリ」です。これらが連携し、開発から監視、統制まで一貫した運用ループを実現します。

AI Studioの強みは、オープンソースから高性能な商用モデル、さらには画像生成音声認識モデルまでを網羅した広範なモデルカタログです。これにより企業は、タスクの複雑さやコスト目標に応じて最適なモデルを試し、柔軟に構成を組むことが可能になります。選択肢の多さは開発の自由度を高めます。

Pythonコードを実行する「コードインタプリタ」やWeb検索など、多彩な統合ツールも特徴です。これにより、単なるテキスト生成にとどまらず、データ分析やリアルタイムの情報検索、さらには画像生成までを一つのワークフロー内で完結させる、より高度なAIエージェントの構築が可能になります。

導入形態も柔軟です。クラウド経由での利用に加え、自社インフラに展開するオンプレミスやセルフホストにも対応。企業のデータガバナンス要件に応じて最適な環境を選べます。また、不適切なコンテンツをフィルタリングするガードレール機能も備え、安全なAI運用を支援します。

Mistral AI Studioの登場は、企業におけるAI活用の成熟度が新たな段階に入ったことを示唆します。モデルの性能競争から、いかにAIを安全かつ安定的に事業へ組み込むかという運用フェーズへ。同プラットフォームは、その移行を力強く後押しする存在となるでしょう。

グーグル、AIでハロウィン演出術。最新モデル活用法公開

画像・動画生成の最新AI

Nano Bananaで幽霊風の画像作成
90年代ホラー映画風ポスターを生成
ペットのコスチューム画像を自動生成
Veo 3.1で高品質なショート動画作成

アイデア創出からツール開発まで

Google Photosで写真をハロウィン風に加工
Mixboardでコスチューム案を視覚化
Canvasでカボチャ彫刻用アプリ開発

Googleは2025年10月24日、ハロウィンシーズンに向けて、同社の最新AIツール群を活用した画像動画の作成術を公式ブログで公開しました。画像生成モデル「Nano Banana」や動画生成モデル「Veo」などを使い、パーティーの招待状からSNSコンテンツまで手軽に作成する具体的なプロンプトを紹介しており、企業の季節イベント向けマーケティングのヒントとなりそうです。

中核となるのは画像生成モデルNano Bananaです。ユーザーは自身の写真と特定のプロンプトを組み合わせるだけで、ビクトリア朝時代の幽霊風ポートレートや90年代ホラー映画風のポスターなど、ユニークな画像を生成できます。精緻なプロンプトの記述方法も公開されており、プロンプトエンジニアリングの実践的な好例と言えるでしょう。

動画生成では、最新モデルVeo 3.1」が活躍します。プロンプトへの追従性が向上し、より物語性の高い動画作成が可能になりました。静止画を不気味なアニメーションに変換したり、テキストから秋の風景を描写したグリーティング動画を生成したりと、SNSマーケティングでの高い応用可能性を秘めています。

既存サービスへのAI統合も進んでいます。Google Photos」にはワンタップで写真をハロウィン風に加工する新機能が追加されました。また、アイデア出しツール「Mixboard」はコスチュームのブレインストーミングに、開発ツール「Canvas」は画像からカボチャの彫刻用テンプレートアプリを作成するといった実用的な活用法も示されています。

今回の発表は、AIが専門家だけでなく一般ユーザーにも浸透し、創造性を手軽に引き出すツールとなっている現状を示しています。企業はこれらのAIツールを季節イベントのプロモーションや顧客エンゲージメント向上にどう活用できるか、具体的な検討を始める好機と言えるでしょう。

Google Gemini、動画・スライド・TVへ機能拡張

動画とプレゼン作成を自動化

リアルな動画を生成するVeo 3.1
効果音付きの対話動画も作成可能
トピック入力でプレゼン資料を自動生成

日常業務と家庭での活用

複雑な手順を段階的に解説
数式のコピーや編集が容易に
テレビ番組検索音声対話で支援
質問にYouTube動画で回答

Googleは2025年10月24日、AIアシスタントGemini」の月次アップデートを発表しました。今回の「October Gemini Drop」では、動画生成AI「Veo 3.1」や、プレゼンテーション資料を自動生成する「Canvas」機能が追加されました。さらにGoogle TVとの連携も実現し、クリエイティブ制作から家庭での利用まで、活用の幅を大きく広げます。生産性向上を目指すビジネスパーソンにとって注目の内容です。

中でも注目されるのが、動画生成AIの最新版Veo 3.1」です。実写に近いリアルな質感の映像を生成できるほか、カメラワークの制御もより簡単になりました。さらに、効果音付きの対話を含む動画の作成も可能となり、マーケティングやコンテンツ制作の現場で、時間とコストを大幅に削減する可能性を秘めています。

プレゼン資料作成の常識を覆すのが新機能「Canvas」です。トピックや参考資料をアップロードするだけで、AIがテーマや関連画像を含むスライド一式を自動で生成します。完成した資料はGoogleスライドで微調整でき、企画書作成を劇的に効率化します。この機能はまずProユーザー向けに提供が開始されます。

Geminiの活用シーンは家庭にも広がります。Gemini for Google TV」により、視聴したい番組を対話形式で探せるようになります。さらに、一般的な質問に対して、関連するYouTube動画を提示しながら回答する機能も搭載。単なる検索アシスタントにとどまらない、新しいテレビ視聴体験を提供します。

このほか、複雑なトピックを段階的に解説する能力が向上したGemini 2.5 Flashのアップデートや、Web版での数式(LaTeX)の扱いやすさ向上など、専門的な作業を支援する改善も含まれています。今回のアップデートは、Geminiが多機能で実用的なAIアシスタントへと進化したことを示しています。

急増AIデータセンター、電力消費と持続可能性に警鐘

巨大な電力消費と環境負荷

冷却等で膨大な電力を消費
ニューヨーク市の半分の電力を使う施設も
アイルランドでは電力の20%超を消費
環境負荷のデータは多くが企業秘密

過熱する投資とバブル懸念

テック大手による数千億ドル規模投資
供給に対し消費者需要が未成熟
会計操作による利益水増しの疑い
小型モデルなど技術革新のリスク

OpenAIマイクロソフトなど巨大テック企業が、AIの計算基盤であるデータセンターへ数千億ドル規模の投資を加速させています。しかしその裏では、膨大な電力消費による環境負荷や地域社会との軋轢、供給過剰によるAIバブルの懸念といった問題が深刻化。AIの急成長を支えるインフラの持続可能性が今、問われています。

データセンターは、AIモデルを動かすためのサーバーが詰まった巨大な倉庫です。ユーザーからの指示(クエリ)は「トークン」と呼ばれる小さなデータに分解され、GPU画像処理半導体)が並列処理で高速に応答を生成します。この一連のプロセスと、サーバーを冷却し続けるために膨大な電力が必要となります。

そのエネルギー消費量は桁外れです。例えば、Meta社が計画する新施設は、ニューヨーク市のピーク時電力の約半分に相当する電力を消費する見込みです。アイルランドでは、データセンターがすでに国の総電力の20%以上を消費。しかし、多くの企業は環境負荷に関する詳細なデータを公開しておらず、実態の把握は困難を極めます。

市場ではOpenAIの「Stargate」プロジェクトのように、数千億ドル規模の投資計画が次々と発表されています。一方で、AIサービスへの消費者支出はまだ限定的であり、供給が需要を大幅に上回るリスクが指摘されています。一部では、インフラ費用を過小に報告し、利益を水増ししているとの見方さえあります。

データセンター建設は、政治的な対立も生んでいます。政府が国策としてAI産業を後押しする一方、地域レベルでは住民の反対運動が激化。電力料金の高騰、水資源の枯渇、騒音などが主な理由です。テネシー州メンフィスでは、イーロン・マスク氏のxAIが無許可でガスタービンを設置し、地域社会から厳しい批判を浴びました。

現在の巨大投資は、「大規模モデルがAIの主流であり続ける」という前提に基づいています。しかし、より少ない計算資源で動く効率的な小型モデルや、新たなチップ設計、量子コンピューティングといった技術革新が、現在のインフラを陳腐化させる可能性も否定できません。AI業界の急激なスケール競争は、大きな不確実性をはらんでいるのです。

ChatGPT、社内情報横断検索で業務の文脈を理解

新機能「Company Knowledge」

法人向けプランで提供開始
社内ツールと連携し横断検索
GPT-5ベースで高精度な回答
回答には明確な出典を引用

具体的な活用シーン

顧客フィードバックの戦略化
最新情報でのレポート自動作成
プロジェクトのリリース計画立案

エンタープライズ級の安全性

既存のアクセス権限を尊重
データはモデル学習に利用不可

OpenAIは2025年10月23日、法人向けChatGPTに新機能「Company Knowledge」を導入しました。この機能は、SlackGoogle Driveといった社内の各種ツールと連携し、組織固有の情報を横断的に検索。利用者の業務文脈に合わせた、より正確で具体的な回答を生成します。社内に散在する情報を集約し、意思決定の迅速化業務効率の向上を支援することが目的です。

新機能の核となるのは、GPT-5を基盤とする高度な検索能力です。複数の情報源を同時に参照し、包括的で精度の高い回答を導き出します。生成された回答にはすべて明確な出典が引用されるため、ユーザーは情報の出所をたどり、内容の信頼性を容易に確認できます。これにより、安心して業務に活用できるのが大きな特徴です。

例えば、顧客との打ち合わせ前には、Slackの最新のやり取り、メールでの詳細、Google Docsの議事録などを基に、ChatGPT自動でブリーフィングを作成します。また、キャンペーン終了後には、関連するデータを各ツールから抽出し、成果レポートを生成することも可能です。このように、手作業による情報収集の手間を大幅に削減します。

Company Knowledgeは、単なる情報検索にとどまりません。社内で意見が分かれているような曖昧な問いに対しても、各ツールの議論を要約し、異なる視点を提示する能力を持ちます。例えば「来年の会社目標は?」と尋ねれば、議論の経緯や論点を整理してくれます。これにより、チームの次のアクションを促すことができます。

企業導入で最も重要視されるセキュリティも万全です。この機能は、各ユーザーが元々持つアクセス権限を厳格に尊重します。OpenAIが企業のデータをモデル学習に利用することはなく、SSOやIP許可リストなど、エンタープライズ水準のセキュリティ機能も完備。管理者はアクセス制御を柔軟に設定できます。

現在、この機能は手動で有効にする必要があり、Web検索画像生成とは併用できませんが、将来的にはこれらの機能統合が予定されています。また、AsanaやGitLabなど連携ツールも順次拡大しており、今後さらに多くの業務シーンでの活用が期待されます。

ChatGPT、成人向けエロティカ生成を12月解禁へ

OpenAIの方針大転換

12月よりエロティカ生成を解禁
認証済み成人ユーザーが対象
CEOは「成人の自由」を主張

新たなAIとの関係性

親密な対話が常態化する可能性
ユーザー定着率の向上が狙いか
人間関係を補完する新たな選択肢

浮上するリスクと課題

個人情報のプライバシー漏洩懸念
感情の商品化によるユーザー操作

OpenAIは2025年12月に実施するアップデートで、AIチャットボットChatGPT」の利用規約を改定し、年齢認証済みの成人ユーザーに限り「エロティカ」を含む成熟したテーマのコンテンツ生成を許可する方針です。同社のサム・アルトマンCEOがSNSで公表しました。この方針転換は、AIと人間のより親密な関係性を促し、ユーザーエンゲージメントを高める可能性がある一方、プライバシー倫理的な課題も提起しています。

アルトマンCEOはSNSへの投稿で、今回の変更は「成人の自由」を尊重する同社の大きな姿勢の一部だと説明。「我々は世界の倫理警察ではない」と述べ、これまでの方針を大きく転換する考えを示しました。かつて同社は、自社モデルを成人向けコンテンツに利用した開発者に対し、停止命令を送付したこともありました。

この動きは、ユーザーとAIの関係を根本的に変える可能性があります。専門家は、人々が自身の性的嗜好といった極めてプライベートな情報をAIと共有することが常態化すると指摘。これにより、ユーザーのプラットフォームへの滞在時間が伸び、エンゲージメントが向上する効果が期待されます。

一方で、この変化を肯定的に捉える声もあります。専門家は、人々が機械と性的な対話を試みるのは自然な欲求だとし、AIコンパニオンが人間関係を代替するのではなく、現実世界では満たせないニーズを補完する一つの選択肢になり得ると分析しています。

最大の懸念はプライバシーです。チャット履歴が万が一漏洩すれば、性的指向などの機微な個人情報が流出しかねません。また、ユーザーの性的欲求がAI企業の新たな収益源となる「感情の商品化」につながり、ユーザーが感情的に操作されるリスク専門家は指摘しています。

今後、テキストだけでなく画像音声の生成も許可されるのか、詳細はまだ不明です。もし画像生成が解禁されれば、悪意あるディープフェイクの拡散も懸念されます。OpenAIがどのような年齢認証や監視体制を導入するのか、その具体的な実装方法が今後の大きな焦点となるでしょう。

MS Copilot大型更新、AIキャラと共同作業で新次元へ

より人間らしく対話

表情豊かな新AIキャラMico
挑戦的な対話モードReal Talk
ユーザー情報を記憶し対話に活用

チームと個人の生産性向上

最大32人のグループチャット機能
EdgeがAIブラウザに進化
複数タブの情報を横断し要約・比較
Google Drive等との連携強化

マイクロソフトは2025年10月23日、AIアシスタントCopilot」の秋季大型アップデートを発表しました。新AIキャラクター「Mico」の導入や、最大32人で共同作業できる「Groups」機能、より挑戦的な対話が可能な「Real Talk」モードなどを通じ、AIをよりパーソナルで実用的な存在へと進化させます。生産性の向上と、より人間らしいAIとの対話体験の提供を目指します。

今回のアップデートで最も目を引くのが、新AIキャラクター「Mico」の導入です。かつての「クリッピー」を彷彿とさせるこのキャラクターは、音声モードでユーザーとの対話に表情豊かに反応し、より人間的なインタラクションを実現します。AIに親しみやすいアイデンティティを与えることで、ユーザーとの関係性を深める狙いがあります。

チームの生産性を革新する機能も強化されました。最大32人が参加できる「Groups」は、AIを交えたブレインストーミングや共同計画を可能にします。また、ユーザーの意見に同意するだけでなく、挑戦的な視点も提示する「Real Talk」モードを追加。Copilotが単なるアシスタントから「思考のパートナー」へと進化する可能性を秘めています。

ウェブブラウザ「Edge」も「AIブラウザ」へと大きく進化します。Copilotモードを強化し、複数のタブ情報を横断して要約・比較したり、ホテルの予約フォームを自動入力したりといった高度なタスクを実行できるようになります。これは競合であるOpenAIが発表したAIブラウザ「Atlas」への対抗策とも言え、ブラウザ市場でのAI活用競争が激化しています。

これらの進化を支えるのが、マイクロソフト独自のAIモデル群「MAI」シリーズです。同社はこれまでパートナーであるOpenAIのモデルを中心に据えてきましたが、今回の発表では自社開発モデルの活用を強調。テキスト、音声画像を統合的に処理する独自の技術基盤で、シームレスなAI体験の提供を目指す姿勢を鮮明にしました。

今回のアップデートは、Copilotが単なるチャットボットから、仕事や生活に深く統合された「実用的なAIインフラ」へと進化する転換点と言えるでしょう。経営者エンジニアにとって、これらの新機能をいかに活用し、自社の生産性や競争力向上に繋げるかが今後の重要な課題となりそうです。

インスタ、AI編集をストーリーズに直接統合

新機能の概要

インスタのストーリーズにAI編集を統合
テキスト指示で写真・動画を自在に変更
要素の追加・削除・背景変更などが可能
従来よりAI機能へのアクセスが容易に

利用法と注意点

新メニュー「Restyle」からアクセス
サングラス追加などプリセットも豊富
利用規約で顔データ分析に同意が必要
AI分野での競争力維持が狙い

Metaは10月23日、傘下のInstagramで、AIを活用した編集ツールを「ストーリーズ」機能に直接統合したと発表しました。ユーザーは「髪の色を赤に変えて」といったテキスト指示(プロンプト)を入力するだけで、写真や動画を簡単かつ直感的に編集できます。これにより、クリエイティブな表現の幅が大きく広がります。

新機能は、ストーリーズ編集画面上部の「Restyle」メニューから利用可能です。編集したい写真や動画に対し、「追加」「削除」「変更」といった操作を選び、プロンプトバーに具体的な指示を入力します。例えば、人物写真に王冠を追加したり、背景を夕焼けに変えたりといった高度な編集が瞬時に行えます。

プロンプト入力だけでなく、あらかじめ用意されたプリセットエフェクトも豊富です。ワンタップでサングラスやジャケットを着用させたり、画像全体を水彩画風に加工したりできます。動画に対しても、雪や炎が舞うようなダイナミックな効果を加えることが可能で、初心者でも手軽に利用できるのが特徴です。

この機能を利用する際、ユーザーはMetaのAI利用規約に同意する必要があります。規約によると、アップロードされた写真や動画、そこに含まれる顔の特徴などがAIによって分析される可能性があるため、プライバシーに関する注意が必要です。企業は利用前に規約を十分に確認すべきでしょう。

Metaは、生成AI分野での競争力を維持するため、継続的に新機能を投入しています。これまでAI機能は専用チャットボット経由が主でしたが、ストーリーズへの直接統合で利便性を大幅に向上させました。AI生成動画フィード「Vibes」の提供など、ユーザー体験へのAI組み込みを加速させています。

Google EarthがAI進化、Geminiで複雑な問いに応答

AI連携で高度な分析

複数のAIモデルを自動連携
Geminiによる地理空間推論
複雑な問いに数分で回答
災害時の脆弱性特定も可能

新機能とアクセス拡大

自然言語で衛星画像検索
Google Cloudとの連携
企業や研究者への提供拡大
専門家向けプランで先行提供

グーグルは、同社のデジタル地球儀「Google Earth」に搭載されたAI機能を大幅に強化しました。最新AIモデル「Gemini」を統合し、複数の地理空間モデルを連携させて複雑な問いに答える新フレームワーク「Geospatial Reasoning」を発表。これにより、企業や非営利団体は、これまで数年を要した分析を数分で完了させ、災害対応や環境モニタリングなどでの意思決定を加速できます。

新機能の核となるのが「Geospatial Reasoning(地理空間推論)」です。これは、気象予報、人口密度マップ、衛星画像といった異なるAIモデルをGeminiが自動で結びつけ、複合的な分析を可能にするフレームワーク。例えば、嵐の進路予測だけでなく、どの地域が最も脆弱で、どの重要インフラが危険に晒されているかまでを一度に特定します。

Google Earth内での操作性も向上しました。Geminiとの統合により、利用者は「川で藻が大量発生している場所は?」といった自然言語での質問だけで、広大な衛星画像から必要な情報を瞬時に探し出せます。水道事業者が飲料水の安全性を監視したり、干ばつ時に砂塵嵐のリスクを予測したりといった活用が期待されています。

ビジネス利用の門戸も大きく開かれます。Earth AIの画像、人口、環境モデルがGoogle Cloudプラットフォーム経由で提供開始。これにより、企業は自社の専有データとGoogleの高度な地理空間モデルを組み合わせ、サプライチェーンの最適化やインフラ管理など、各社の固有の課題解決に向けたカスタム分析が可能になります。

すでに多くの組織で活用が進んでいます。世界保健機関(WHO)はコレラの発生リスク予測に、衛星データ企業のPlanet社は森林破壊のマッピングにEarth AIを利用。また、Alphabet傘下のBellwether社はハリケーン予測に活用し、保険金の支払いを迅速化するなど、社会課題解決や事業効率化に貢献しています。

今回の機能強化は、地理空間データ分析を専門家以外にも解放し、データに基づいた迅速な行動を促す大きな一歩です。グーグルは今後、物理世界をLLMがデジタル世界を扱うように流暢に推論できるAIモデルの開発を目指しており、その応用範囲はさらに広がっていくでしょう。

EA、Stability AIと提携しゲーム開発を革新

提携の目的と背景

ゲーム大手EAとStability AIが提携
ゲーム制作のワークフローを革新
AIを「信頼できる味方」と位置付け

共同開発の具体例

リアルな質感表現(PBR)を加速
指示で3D環境を自動プレビュー

クリエイターへの影響

反復作業を高速化し生産性向上
クリエイター創造的業務に注力
迅速なプロトタイプ制作が可能に

ゲーム開発大手Electronic Arts (EA)は2025年10月23日、画像生成AI「Stable Diffusion」で知られるStability AIとの戦略的提携を発表しました。両社は生成AIモデルやツールを共同開発し、ゲーム制作のワークフローを革新します。この提携は、開発プロセスの高速化と、アーティストやデザイナーの創造性を最大限に引き出すことを目的としています。

EAはこの提携を通じて、AIを「信頼できる味方」と位置付けています。反復的な作業をAIに任せることで、開発者がより創造的な業務に集中できる環境を整えます。ただし、同社は「ストーリーテリングの中心は人間であり続ける」と強調しており、AIはあくまでクリエイターを支援する存在であるとの姿勢を明確にしています。

共同開発の第一弾として、リアルな質感を表現する「フィジカリーベースドレンダリング(PBR)」マテリアルの作成を加速させるツールに着手します。また、簡単な指示(プロンプト)から3D環境全体を瞬時にプレビューするAIシステムの開発も進め、コンセプト制作の速度と精度を飛躍的に高める計画です。

ゲーム業界におけるAI活用はEAに限りません。例えば、人気ゲーム「PUBG」の開発元であるKraftonも「AI First」戦略を掲げ、AI分野への大規模投資を発表しています。大手企業によるAI導入の動きは今後も加速し、業界全体の競争環境を大きく変える可能性があります。

EAのアンドリュー・ウィルソンCEOは以前からAIを事業の「まさに核」と述べており、今回の提携はその方針を具現化するものです。投資家の間では、AIによるコスト削減が収益性を大幅に向上させるとの期待も高まっています。このパートナーシップは、ゲーム開発の未来を占う重要な一歩と言えるでしょう。

Snapchat、画像生成AIレンズを米国で無料開放

プロンプトで画像生成

自由な指示で画像を生成・編集
自撮り写真をエイリアンなどに加工
ハロウィーンの仮装案にも活用
友人やストーリーで共有可能

競合追撃とユーザー拡大

MetaOpenAIなど競合の台頭
有料プラン限定から全ユーザーへ提供
まずは米国でサービス開始
カナダ、英国、豪州へも展開予定

Snapは10月22日、同社の人気アプリSnapchatにおいて、初の自由入力プロンプト型AI画像生成機能「Imagine Lens」を米国で無料公開しました。これまでは有料プラン限定でしたが、全ユーザーが利用可能になります。MetaOpenAIなど競合が高度なAIツールを投入する中、若者ユーザーの維持・獲得を狙う戦略的な一手とみられます。

この新機能を使えば、ユーザーは自撮り写真に「私をエイリアンにして」といったプロンプトを入力するだけで、ユニークな画像に加工できます。また、「不機嫌な猫」のように、全く新しい画像を生成することも可能です。作成した画像は友人とのチャットやストーリーで共有でき、ハロウィーンの仮装を試すといった実用的な使い方も提案されています。

今回の無料開放の背景には、SNS市場におけるAI開発競争の激化があります。Metaの「Meta AI」やOpenAI動画生成AI「Sora」など、競合他社がより高度なAI機能を次々と発表。若年層ユーザーの関心を引きつけるため、Snapも主力機能の一つであるAIレンズを無料化し、競争力を維持する投資に踏み切った形です。

これまで「Imagine Lens」は、有料プラン「Lens+」および「Snapchat Platinum」の加入者のみが利用できる限定機能でした。今回の拡大により、無料ユーザーも一定回数画像生成が可能になります。サービスはまず米国で開始され、今後カナダ、英国オーストラリアなど他の主要市場へも順次展開される計画です。

3Dで思考するロボットAI、欧州からオープンソースで登場

3Dデータで物理世界を理解

3Dデータを取り入れた独自学習
物理空間における物体の動きを把握
2D画像ベースモデルとの明確な差別化

商用版に匹敵する性能

オープンソースで誰でも利用可能
研究開発の加速と民主化に貢献
ベンチマーク商用モデル並みのスコア
スタートアップ実験・改良を促進

ブルガリアの研究所INSAITを中心とする欧州の研究者チームが22日、産業用ロボットの頭脳として機能する新たなAI基盤モデル「SPEAR-1」をオープンソースで公開しました。このモデルは3次元(3D)データで訓練されており、物体をより器用に掴み、操作する能力を飛躍的に向上させます。研究開発の加速が期待されます。

SPEAR-1の最大の特徴は、3Dデータを学習に取り入れた点です。従来のモデルは2D画像から物理世界を学んでいましたが、これではロボットが活動する3D空間との間に認識のズレが生じていました。このミスマッチを解消し、より現実に即した物体の動きを理解します。

このモデルがオープンソースで公開された意義は大きいでしょう。言語モデルの世界でLlamaなどが革新を民主化したように、SPEAR-1はロボット工学の研究者やスタートアップ迅速に実験を重ねる土台となります。身体性を持つAI分野の発展を加速させる起爆剤となりそうです。

性能も注目に値します。ロボットのタスク遂行能力を測るベンチマーク「RoboArena」では、商用の基盤モデルに匹敵する高いスコアを記録しました。特に、有力スタートアップPhysical Intelligence社の最先端モデルにも迫る性能を示しており、その実用性の高さが伺えます。

ロボット知能の開発競争は激化し、数十億ドル規模の資金が動いています。SPEAR-1の登場は、クローズドな商用モデルとオープンソースモデル共存しながら技術を進化させる可能性を示唆します。専門家は「1年前には不可能だった」と述べ、この分野の急速な進歩に驚きを見せています。

AIで思考力は低下するか?最新研究が示す光と影

AI利用の認知的影響

生成AIへの思考の外部委託
認知努力の自己申告による減少
批判的思考力への懸念
新技術登場時の歴史的な懸念

研究が示す具体的なリスク

知識労働者の自信への影響
医師の診断能力低下の事例
科学的知見はまだ初期段階
継続的な影響の調査が必要

生成AIの急速な普及に伴い、その利用が人間の認知能力、特に批判的思考に与える影響について懸念が高まっています。米マサチューセッツ工科大学(MIT)やマイクロソフトの最新研究では、知識労働者がAIに頼ることで認知的な努力を減らす傾向が報告されました。これは生産性向上の一方で、思考力低下という新たなリスクを示唆しており、ビジネスリーダーや技術者にとって見過ごせない課題となっています。

新技術の登場は、常に人間の能力を衰えさせるという不安を伴ってきました。かつて新聞やテレビが思考力を奪うと危惧されたように、AIに対しても同様の「モラルパニック」ではないかという見方もあります。しかし、今回のAIがもたらす変化は、単なる情報伝達手段の変革とは質が異なる可能性も指摘されており、慎重な検証が求められます。

マイクロソフトなどの研究が示すのは、AIを頻繁に利用する人々が、自ら深く考えることを意識的に避けるようになる可能性です。タスクをAIに「丸投げ」することで、短期的な効率は上がるかもしれません。しかしその代償として、問題の本質を見抜く力や、多角的な視点から判断する批判的思考力が鈍るリスクが懸念されています。

この現象は、特定の専門分野でも報告されています。例えば、AIによる画像診断支援システムに過度に依存した結果、一部の医師のがん検出能力がかえって低下したという事例もあります。これは、AIの回答を鵜呑みにし、自らの専門知識や直感を働かせなくなる「自動化バイアス」の一例と言えるでしょう。

もちろん、AIが人間の知性を拡張する強力なツールであることも事実です。重要なのは、AIを思考の「代替」ではなく、思考を深めるための「パートナー」として位置づけることです。経営者やリーダーは、AI導入による生産性向上と、従業員の思考力維持・向上のバランスをどう取るかという、新たな経営課題に直面しています。

この分野の研究はまだ始まったばかりであり、長期的な影響については未知数です。AIとの共存が常識となる社会で、私たちはどのように自らの思考力を鍛え、維持していくべきか。技術の進化と並行して、人間側のリテラシー教育や利用ガイドラインの策定が急務となるでしょう。

MITとIBM、小型・効率AIで産業応用を加速

産学連携が生む圧倒的成果

特許54件、引用12万件超
産業ユースケース50件以上を創出
医療や化学など多分野へ応用

「巨大」から「小型・効率」へ

巨大モデルからタスク特化型へ転換
性能を維持しモデルを小型化
エッジデバイスでの高速処理実現

少ないデータで賢く学習

自己修正で推論精度を高める新手法
PoCで終わらせない実用化を推進

マサチューセッツ工科大学(MIT)とIBMが共同で運営する「MIT-IBM Watson AI Lab」は、AI開発の新たな方向性を示しています。設立8周年を迎えた同ラボは、巨大な基盤モデルから、より小さく効率的でタスクに特化したモデルの開発に注力。研究と実用化のギャップを埋め、産業界でのAI活用を加速させることを目指します。これは、AIプロジェクトの多くが概念実証(PoC)で頓挫する現状への明確な回答と言えるでしょう。

この産学連携は目覚ましい成果を上げています。これまでに特許54件を出願し、論文の引用数は12万8000件を超えました。さらに、ヘルスケアや金融、化学など多岐にわたる分野で50件以上の産業ユースケースを創出。AI画像技術によるステント留置の改善や、計算コストの大幅な削減など、具体的なイノベーションを生み出し続けています。

なぜ今、「小型・効率化」が重要なのでしょうか。調査会社ガートナーによると、生成AIプロジェクトの少なくとも30%が2025年末までに概念実証(PoC)の段階で中止されると予測されています。多くの企業がAIへの期待を抱きつつも、価値ある成果に繋げられていないのです。同ラボは、この研究と実用の間の「死の谷」を埋める役割を担っています。

小型化の鍵を握るのが、`once-for-all`や`AWQ`といった革新的な技術です。これらの手法は、モデルのアーキテクチャを最適化し、性能を維持したままサイズを圧縮します。これにより、スマートフォンなどのエッジデバイス上でもAIを高速に実行できるようになります。遅延を減らし、リアルタイムでの応用範囲を大きく広げる可能性を秘めています。

さらに、少ないデータで賢く学習する技術も進化しています。例えば`COAT`(Chain-of-Action-Thought)と呼ばれる手法は、AIが自らの推論プロセスを反復的に自己修正することで、より正確な答えを導き出します。これは、限られた計算資源とデータで、現実世界の複雑な課題を解決するための重要なアプローチです。

これらの研究成果は、IBMのプラットフォーム`watsonx`などを通じて実用化されています。一例が、コンパクトながら高精度な文書理解能力を持つ`Granite Vision`モデルです。企業が保有する膨大な文書から、信頼性の高い情報を抽出し、要約するニーズに応えます。

MIT-IBM Watson AI Labが目指すのは「有用で効率的な知能」の創出です。巨大モデルの開発競争から一歩進み、目的に合わせて最適化されたAIこそが、真の経済的・社会的価値を生み出すと彼らは考えています。この産学連携の取り組みは、AIの実用化を目指す全ての企業にとって、重要な指針となるでしょう。

AI Sheetsが画像対応、ノーコードでAI活用へ

画像から情報を自動抽出

領収書から項目を自動抽出
手書きメモを瞬時にテキスト化
画像内容をAIが分類・タグ付け

テキストで画像を生成・編集

指示文から画像を自動生成
既存画像スタイル変更も自在
SNS投稿用の素材を一括作成

AIプラットフォームのHugging Faceが、オープンソースのデータ活用ツール「AI Sheets」のメジャーアップデートを発表しました。今回の更新で新たに追加されたのは画像処理機能です。これにより、ユーザーはプログラミングの知識なしに、スプレッドシート上で直接、画像の分析、情報抽出、生成、編集が可能になります。データ活用のハードルを劇的に下げる一歩と言えるでしょう。

これまでのAI Sheetsは、主にテキストデータの構造化や拡充に強みがありました。今回のアップデートで「ビジョン(視覚)サポート」が加わったことで、製品カタログの写真、領収書、図表といった画像に含まれる膨大な情報を、誰でも簡単に扱えるようになります。ワークフローを分断することなく、テキストと画像を同一の環境で処理できるのが最大の特長です。

具体的な活用例として、領収書からのデータ抽出が挙げられます。複数の領収書の画像をアップロードし、「店名、日付、合計金額を抽出」といった簡単な指示を与えるだけで、自動的にデータが整理されます。手書きのレシピをデジタル化し、検索可能なデータベースにすることも可能です。人の手によるデータ入力作業を大幅に削減します。

コンテンツ制作の現場でも強力なツールとなります。例えば、SNS投稿の企画案が並ぶスプレッドシートで、「ヘルシーなレシピの美味しそうな写真」といった指示文から画像を直接生成できます。さらに「背景を木目調にして」といった指示で、生成した画像を編集することもでき、コンテンツ制作の全工程を一元管理できます。

これらの高度な機能は、Hugging Faceエコシステム上の数千に及ぶオープンなAIモデルによって支えられています。ユーザーは用途に応じて、処理速度と精度に優れた最新のモデルを簡単に切り替えて試すことが可能です。フィードバックを与えることで、モデルの出力精度をさらに高めることもできます。

この新しいAI Sheetsは、GitHubリポジトリから導入できるほか、インストール不要のウェブ版で誰でもすぐに試せます。画像という身近なデータをビジネス資産に変える強力な一手となり、データドリブンな意思決定コンテンツ制作の生産性向上に大きく貢献するでしょう。

Google、誰でも数分でAIアプリ開発

「感覚」でアプリ開発

専門知識が不要なUI
プロンプトから自動生成
多様なAIモデルを統合
リアルタイムでの編集

創造性を刺激する機能

アイデアを自動で提案
65秒でプロトタイプ完成
GitHub連携やデプロイ
無料で試せる手軽さ

Googleは2025年10月21日、同社のAI開発プラットフォーム「Google AI Studio」に、プログラミング初心者でも数分でAIアプリケーションを開発・公開できる新機能「vibe coding」を追加したと発表しました。このアップデートにより、アイデアを持つ誰もが、専門知識なしで自身のアプリを具現化し、市場投入までの時間を劇的に短縮することが可能になります。

新機能の核心は、刷新された「Build」タブにあります。利用者はGemini 2.5 Proをはじめ、動画理解AIの「Veo」や画像生成AI「Imagine」など、Googleの多様なAIモデルを自由に組み合わせられます。「作りたいアプリ」を文章で説明するだけで、システムが必要なコンポーネントを自動で組み立て、アプリの雛形を生成します。

生成されたアプリは、インタラクティブなエディタですぐに編集できます。画面左側ではAIとの対話を通じてコードの修正や提案を受けられ、右側のエディタではソースコードを直接編集可能です。このハイブリッドな開発環境は、初心者から熟練の開発者まで、あらゆるスキルレベルのユーザーに対応します。

アイデアが浮かばないユーザーを支援する「I'm Feeling Lucky」ボタンもユニークな機能です。ボタンを押すたびに、AIがランダムなアプリのコンセプトと必要な設定を提案。これにより、偶発的な着想から新たなサービスが生まれる可能性を秘めています。

その実力は確かです。海外メディアVentureBeatの記者が「サイコロを振るアプリ」と指示したところ、わずか65秒でアニメーション付きの多機能なウェブアプリが完成しました。完成したアプリはGitHubへの保存や、Googleインフラを使ったデプロイも数クリックで完了します。

この新機能は無料で利用を開始でき、高度な機能を利用する場合のみ有料APIキーが必要となります。Googleは、AI開発のハードルを劇的に下げることで、開発者コミュニティの裾野を広げ、AIエコシステムのさらなる活性化を狙っていると考えられます。今回の発表は、今後予定されている一連のアップデートの第一弾とされています。

DeepSeek、テキストを画像化し10倍圧縮する新AI

テキスト処理の常識を覆す

テキストを画像として表現
従来のトークンより最大10倍効率化
LLMの常識を覆すパラダイム転換

巨大コンテキストと高効率

1000万トークン級の文脈へ
単一GPU日産20万ページ処理
トークナイザー問題を根本的に解決

オープンソースで開発加速

モデルやコードを完全公開
圧縮データ上の推論能力が今後の課題

中国のAI研究企業DeepSeekは、テキスト情報を画像として処理することで最大10倍に圧縮する新しいオープンソースAIモデル「DeepSeek-OCR」を発表しました。この技術は、大規模言語モデル(LLM)が一度に扱える情報量(コンテキストウィンドウ)を劇的に拡大する可能性を秘めており、従来のテキスト処理の常識を覆す画期的なアプローチとして注目されています。

このモデルの核心は、テキストを文字の集まり(トークン)としてではなく、一枚の「絵」として捉え、視覚情報として圧縮する点にあります。従来、テキスト情報の方が視覚情報より効率的に扱えると考えられてきましたが、DeepSeek-OCRはこの常識を覆しました。OpenAIの共同創業者であるAndrej Karpathy氏も「LLMへの入力は全て画像であるべきかもしれない」と述べ、この発想の転換を高く評価しています。

その性能は驚異的です。実験では、700〜800のテキストトークンを含む文書をわずか100の視覚トークンで表現し、97%以上の精度で元のテキストを復元できました。これは7.5倍の圧縮率に相当します。実用面では、単一のNVIDIA A100 GPUで1日に20万ページ以上を処理できる計算となり、AIの学習データ構築などを大幅に加速させることが可能です。

この技術革新がもたらす最大のインパクトは、LLMのコンテキストウィンドウの飛躍的な拡大です。現在の最先端モデルが数十万トークンであるのに対し、このアプローチは1000万トークン級の超巨大な文脈の実現に道を開きます。企業の全社内文書を一度に読み込ませて対話するなど、これまで不可能だった応用が現実のものとなるかもしれません。

テキストの画像化は、長年AI開発者を悩ませてきた「トークナイザー」の問題を根本的に解決する可能性も秘めています。文字コードの複雑さや、見た目が同じでも内部的に異なる文字として扱われるといった問題を回避できます。さらに、太字や色、レイアウトといった書式情報も自然にモデルへ入力できるため、よりリッチな文脈理解が期待されます。

DeepSeekはモデルの重みやコードを全てオープンソースとして公開しており、世界中の研究者がこの新技術を検証・発展させることが可能です。一方で、圧縮された視覚情報の上で、LLMがどの程度高度な「推論」を行えるかは未知数であり、今後の重要な研究課題となります。この挑戦的なアプローチが、次世代AIの標準となるか、業界全体の注目が集まります。

アリババQwen、AIレポートを数秒でWeb・音声化

調査を多様な形式に変換

AIが調査レポートを自動生成
1-2クリックでWebページに即時変換
複数話者のポッドキャストも作成可能
コード、画像音声の生成を統合

競合とのアプローチの違い

ゼロからの新規コンテンツ生成に特化
Google NotebookLM既存資料の整理が中心
アイデアから公開までのプロセスを短縮
クリエイターや教育者にも有用

中国のEコマース大手アリババは10月21日、自社のAIチャット「Qwen Chat」に搭載された調査ツール「Deep Research」を大幅にアップデートしたと発表しました。この更新により、AIが生成した調査レポートを、わずか数クリックでインタラクティブなWebページや複数話者によるポッドキャストに変換できます。調査からコンテンツ公開までのプロセスを劇的に効率化し、ユーザーの生産性を高める狙いです。

新機能の核心は、単一の調査依頼から多様なメディア形式のアウトプットを生成できる点にあります。ユーザーがテーマを入力すると、QwenはWeb上の情報源からデータを収集・分析し、矛盾点を指摘しながら詳細なレポートを作成。その後、ボタン一つでプロ品質のWebページや、2人のホストが対話する形式のポッドキャストを自動で生成します。

この強力な機能は、Qwenチームが開発したオープンソースモデル群に支えられています。Webページの構造化にはQwen3-Coder、ビジュアル作成にはQwen-Image音声合成にはQwen3-TTSがそれぞれ活用されています。アリババはこれらを統合し、ユーザーがインフラを意識することなく利用できるマネージドサービスとして提供します。

この動きは、GoogleのAI調査アシスタントNotebookLM」と比較されています。NotebookLMが既存資料の整理や要約に強みを持つ一方、Qwen Deep Researchゼロから新しいコンテンツを生成し、多形式で出力する点で明確な差別化を図っています。どちらが優れているかは、ユーザーの目的によって評価が分かれるでしょう。

アリババの今回のアップデートは、AIによるリサーチが単なる情報収集に留まらず、コンテンツ制作までをシームレスに繋ぐ未来を示唆しています。専門家クリエイターが、少ないリソースで高品質なWebコンテンツやポッドキャストを発信する上で、強力なツールとなる可能性を秘めています。

AI基盤Fal.ai、企業価値40億ドル超で大型調達

企業価値が爆発的に増大

企業価値は40億ドルを突破
わずか3ヶ月で評価額2.7倍
調達額は約2億5000万ドル
著名VCが大型出資を主導

マルチモーダルAI特化

600以上のメディア生成モデルを提供
開発者数は200万人を突破
AdobeやCanvaなどが顧客
動画AIなど高まる需要が追い風

マルチモーダルAIのインフラを提供するスタートアップのFal.aiが、企業価値40億ドル(約6000億円)超で新たな資金調達ラウンドを完了しました。関係者によると、調達額は約2億5000万ドルに上ります。今回のラウンドはKleiner PerkinsSequoia Capitalという著名ベンチャーキャピタルが主導しており、AIインフラ市場の過熱ぶりを象徴しています。

驚くべきはその成長速度です。同社はわずか3ヶ月前に評価額15億ドルでシリーズCを終えたばかりでした。当時、売上高は9500万ドルを超え、プラットフォームを利用する開発者は200万人を突破。1年前の年間経常収益(ARR)1000万ドル、開発者数50万人から爆発的な成長を遂げています。

この急成長の背景には、マルチモーダルAIへの旺盛な需要があります。特に、OpenAIの「Sora」に代表される動画生成AIが消費者の間で絶大な人気を博していることが、Fal.aiのようなインフラ提供企業への追い風となっています。アプリケーションの需要が、それを支える基盤技術の価値を直接押し上げているのです。

Fal.aiは開発者向けに、画像動画音声、3Dなど600種類以上のAIモデルを提供しています。数千基のNVIDIA製H100およびH200 GPUを保有し、高速な推論処理に最適化されたクラウド基盤が強みです。API経由のアクセスやサーバーレスでの提供など、柔軟な利用形態も支持されています。

MicrosoftGoogleなど巨大IT企業もAIホスティングサービスを提供していますが、Fal.aiはメディアとマルチモーダルに特化している点が競争優位性です。顧客にはAdobe、Canva、Perplexity、Shopifyといった大手企業が名を連ね、広告、Eコマース、ゲームなどのコンテンツ制作で広く活用されています。

同社は2021年、Coinbaseで機械学習を率いたBurkay Gur氏と、Amazon出身のGorkem Yurtseven氏によって共同設立されました。多くの技術者が大規模言語モデル(LLM)開発に走る中、彼らはマルチメディア生成の高速化と大規模化にいち早く着目し、今日の成功を収めました。

アドビ、企業専用Firefly構築の新サービス開始

Fireflyの高度なカスタマイズ

企業IPでFireflyを再トレーニング
ブランド専用のAIモデルを構築
微調整ではないディープチューニング
画像動画、3Dなどマルチモーダル対応

コンサルティング型サービス

アドビ専門チームが直接連携
データ選定から運用まで支援
企業のIPは安全に分離・保護
ディズニーなどが先行導入

アドビは2025年10月20日、企業向けの新サービス「Adobe AI Foundry」を発表しました。このサービスは、企業のブランド資産や知的財産(IP)を用いて、同社の生成AIモデル「Firefly」を根本から再構築し、企業専用のカスタムAIモデルを提供するものです。企業のより高度で複雑なカスタマイズ需要に応えることを目的としています。

最大の特徴は「ディープチューニング」と呼ばれる手法です。これは、既存のAIモデルの表面を微調整する「ファインチューニング」とは一線を画します。Fireflyのベースモデルを外科的に再手術するかのように、企業のIPを深く組み込んで再トレーニングすることで、ブランドのトーンやスタイルを完全に理解したモデルを構築します。

AI Foundryは、アドビの専門チームが顧客と直接連携するコンサルティング型のサービスです。データ選定から安全な取り込み、モデルの再トレーニングまでを一貫して支援します。顧客企業のIPは厳格に分離・保護され、他のモデルの学習に利用されることはありません。完成したモデルはAPI経由で提供されます。

このサービスにより、企業は自社ブランドの世界観に完全に合致した画像動画、3Dコンテンツなどを大規模に生成できます。例えば、一度制作した広告キャンペーンを、季節や言語、フォーマットに合わせて瞬時に横展開することが可能になり、マーケティングのパーソナライズ化を加速させます。

既に米小売大手The Home Depotやウォルト・ディズニー・イマジニアリングが先行顧客として導入しています。アドビは、このサービスが人間の創造性を代替するのではなくクリエイターの表現力を高めるための次世代ツールであると位置づけており、今後の展開が注目されます。

AIで偽の休暇写真、燃え尽き世代の新需要

新アプリの概要

AIで偽の休暇写真を自動生成
開発者Meta社プロダクトデザイナー
GoogleGeminiモデルを活用

ターゲットと収益モデル

多忙な燃え尽き症候群の層
最初の6枚は無料で試用可能
追加画像生成従量課金制
レトロな雰囲気の写真が特徴

Meta社のプロダクトデザイナーが、AIで偽の休暇写真を生成するiPhoneアプリ「Endless Summer」を公開しました。燃え尽き症候群に悩む多忙なビジネスパーソンを主なターゲットとし、実際に旅行せずとも世界中を旅しているかのような写真を手軽に作成できる点が特徴です。

このアプリは、Google画像生成モデル「Gemini Nano-Banana」を活用しています。ユーザーは自身の顔写真を基に、ボタンをタップするだけで、ビーチやヨーロッパの街並みなど、様々なシチュエーションの休暇写真をAIが自動で生成するシンプルな操作性を実現しています。

ビジネスモデルは、最初の6枚の画像生成を無料とし、それ以降は有料となる従量課金制を採用。30枚で3.99ドルといった価格設定で、手軽にAI体験を試せるように設計されています。毎朝自動で写真が届くオプション機能も提供しています。

開発の背景には、テック業界の過酷な労働文化「ハッスルカルチャー」があります。実際に休暇を取れない人々が、SNS上で「充実した生活」を演出したいというニーズを捉えたものと言えるでしょう。この現象は、AIが現実の代替体験を提供する新たな潮流を示唆しています。

生成される写真は、意図的にヴィンテージフィルムのような質感に仕上げられています。これは、完璧すぎない、より自然なライフスタイル感を演出する最近のトレンドを反映したものです。AI技術が、かつてのアナログな懐かしさを再現している点は非常に興味深いと言えます。

Meta、未投稿写真でAI学習 任意機能でデータ収集

新機能の概要

AIがカメラロールを自動スキャン
未投稿写真から「逸品」を提案
編集やコラージュを自動で生成
米国とカナダでオプトインで提供

データ利用と懸念

写真はMetaクラウドに保存
編集・共有時にAI学習データ化
プライバシー保護の透明性に課題
広告目的でのデータ利用は否定

Meta米国とカナダで、新たなAI機能をオプトイン(任意参加)形式で導入しました。ユーザーのカメラロールにある未投稿写真をAIがスキャンし、編集やコラージュを提案するものです。利便性の裏で、プライバシーやAIの学習データ利用に関する懸念も指摘されています。

ユーザーが機能を有効にすると、カメラロール内の写真が継続的にMetaクラウドにアップロードされます。AIは雑多な画像の中から共有価値のある「隠れた逸品」を探し出し、ユーザーに提案。これにより、写真の編集や整理にかかる手間を削減することを目指しています。

最も注目されるのは、これらの写真がAIの学習にどう使われるかです。Metaの説明によれば、アップロードされただけでは学習データにはなりません。ユーザーが提案された写真をAIツールで編集、またはFacebook上で共有した場合に限り、そのデータがAIモデルの改善に利用されるとしています。

しかし、この仕組みには透明性への課題が残ります。Metaは過去に、FacebookInstagramの公開投稿をAI学習に利用していたことを認めています。今回も、ユーザーへの通知画面でデータ利用のリスク十分に説明されるかは不明確であり、将来的なポリシー変更の可能性も否定できません。

この新機能は、ユーザーエンゲージメントを高める強力なツールとなり得ます。一方で、企業がユーザーのプライベートなデータにどこまでアクセスし、活用するべきかというデータ倫理の議論を加速させるでしょう。経営者開発者は、技術革新とプライバシー保護のバランスを常に意識する必要があります。

Google AI Studio、統合UIと新機能で開発を加速

開発ワークフローを統合

複数AIモデルを単一画面で操作
コンテキスト切替が不要に
プロンプトから動画音声まで連続作成
一貫性のあるチャットUIデザイン

利便性を高める新機能

デザインのウェルカムページ
使用量・制限をリアルタイム可視化
Googleマップとの連携機能
実世界の地理データを活用可能

Googleは2025年10月18日、開発者向けプラットフォーム「Google AI Studio」のメジャーアップデートを発表しました。今回の更新は、開発者のフィードバックに基づき、AIモデルを利用した開発体験をよりシームレスかつ効率的にすることを目的としています。複数のAIモデルを統合した操作画面や、Googleマップとの連携機能などが追加されました。

アップデートの核となるのが、新しくなった「Playground」です。これまで別々のタブで操作する必要があった、対話AI「Gemini」や動画生成AI「GenMedia」などのモデルを、単一の統合された画面で利用可能になりました。これにより、開発者はタブを切り替える手間なく、アイデアから画像動画音声ナレーションまでを一つの流れで作成できます。

利便性を高める改善も加えられました。新しいウェルカムホームページは、プラットフォームの全機能へのアクセスを容易にし、最新情報や進行中のプロジェクトを一覧表示します。また、新たに追加されたレート制限ページでは、APIの使用状況と上限をリアルタイムで確認でき、予期せぬ利用中断を防ぎながらアプリケーションの規模を管理できます。

特に注目されるのが、Googleマップとの連携機能「マップグラウンディング」です。この機能により、開発者現実世界の地理データや文脈をAIモデルに直接組み込むことが可能になります。これにより、位置情報に基づいた、より正確で創造的なアプリケーション開発が期待できるでしょう。

Googleは今回のアップデートを「より良い基盤を築くためのもの」と位置付けています。開発ワークフローの摩擦をなくし、開発者が本来の創造的な作業に集中できる環境を整えました。同社は来週、この基盤の上に構築される新たなAI活用アプリ開発手法を発表する予定であり、さらなる進化が期待されます。

AI偽ヌード生成アプリ、被害者が運営停止求め提訴

提訴されたアプリの概要

写真から偽ヌード画像を生成
わずか3クリックの簡単操作
児童性的虐待コンテンツも作成

拡散を助長する仕組み

Telegramボットで自動宣伝・拡散
API提供で技術の悪用を拡大
多数の模倣アプリ・サイトが出現

驚異的な被害の規模

1日平均20万枚画像を生成
累計訪問者数は2700万人

AIで衣服を透視したかのような偽ヌード画像を生成するアプリ「ClothOff」が、17歳の被害者少女に提訴されました。訴状は、同アプリが児童性的虐待コンテンツ(CSAM)などを容易に生成・拡散できると指摘。原告は「絶え間ない恐怖」を訴え、アプリの運営停止などを求めています。

訴状によれば、ClothOffはInstagramなどの写真からわずか3クリックで、本物と見分けがつきにくい偽ヌード画像を生成できるとされます。これは非合意の性的画像だけでなく、未成年者を対象とした児童性的虐待コンテンツの生成にもつながる悪質な仕組みだと原告側は非難しています。

問題はアプリ単体にとどまりません。ClothOffは、自社の画像生成技術を外部サービスが組み込めるAPIを提供。これにより模倣サービスが乱立し、被害が拡大しています。さらにSNS「Telegram」上のボットがアプリを宣伝し、数十万人の登録者を集めるなど、拡散に拍車をかけていると指摘されています。

被害の規模は甚大です。訴状によると、ClothOffと関連サービスは1日平均で20万枚もの画像を生成し、累計訪問者数は2700万人を超えます。プレミアム機能として課金メニューも用意されており、運営側が偽ヌード画像の生成から直接利益を得ているビジネスモデルも問題視されています。

今回の訴訟は、生成AI技術の悪用がもたらす深刻な人権侵害と、それを助長するプラットフォームの責任を問うものです。技術者は自らの技術が社会に与える影響を、経営者はサービスが悪用されるリスクを直視する必要があるでしょう。AI時代の新たな法的・倫理的課題を突きつける事例です。

Facebook、未投稿写真もAIが編集提案

AIによる編集提案の仕組み

カメラロール写真にAIが編集提案
コラージュなどを自動生成し投稿促進
ユーザーの許諾(オプトイン)が必須
アメリカ・カナダで本格展開

データ利用とプライバシー

クラウド継続的に写真をアップロード
広告目的での写真利用は否定
共有後はAI学習にデータ活用も
機能はいつでも無効化可能

Metaは10月17日、Facebookアプリの新機能をアメリカとカナダで本格展開したと発表しました。この機能は、ユーザーのスマートフォンのカメラロールにある未投稿の写真に対し、AIが編集を提案するものです。ユーザーは許諾すれば、AIによるコラージュやスタイル変更などの提案を受け、簡単にFacebookフィードやストーリーに投稿できます。

新機能を利用するには、ユーザーが「クラウド処理」を許可する必要があります。許諾すると、アプリはデバイスの画像継続的にクラウドへアップロード。これを基にAIがコラージュ作成、要約動画、スタイル変更といった創造的なアイデアを提案します。

Metaはデータ利用について、アップロードされたメディアを広告ターゲティングには使用しないと説明しています。また、ユーザーがAIの提案を受け入れて編集・共有しない限り、そのデータがAIシステムの改善に使われることはないとしており、プライバシーへの配慮を強調しています。

一方で、AI利用規約への同意は、写真内容や顔の特徴が分析されることを意味します。Metaはユーザーの交友関係や生活に関する詳細な情報を取得し、AI開発競争で優位に立つ可能性があります。未共有データへのアクセスは、大きな強みとなり得るでしょう。

この機能はユーザー自身で制御可能です。Facebookアプリの「設定」からいつでも機能を無効にできます。クラウドへのデータアップロードを停止するオプションも用意されており、ユーザーは自身のプライバシー設定をいつでも見直すことができます。

Google Pixel 10、AIで一歩先の体験を

AIが写真・動画を強化

AIが全員のベストショットを合成
撮影者をAIが自動で写真に追加
AIコーチが最適な構図を提案
Gemini画像動画を自在に生成

日常を便利にする新機能

AIが録音に最適なBGMを自動生成
日の出を再現する目覚まし機能
思い出の写真でウォッチを彩る

Googleは2025年10月17日、「Pixel 10」シリーズ向けにAIを活用した新機能を発表しました。写真撮影や音声編集、日常生活の利便性を向上させる6つの機能が、ハロウィンの活用例と共に紹介されています。ユーザーの創造性を刺激し、体験を豊かにすることを目指します。

特に注目されるのが生成AIによる写真・動画編集機能です。Geminiで既存写真を動画に変換したり、AIが表情を合成して全員が笑顔の集合写真を作る「Auto Best Take」など、専門スキルなしで高品質なコンテンツ制作が可能になります。

撮影プロセスそのものもAIが支援します。「Camera Coach」機能は、被写体や目的に応じて最適な構図や設定を提案。また、撮影者自身を集合写真に自然に追加する「Add Me」機能など、誰もが簡単にプロ並みの写真を撮れるようサポートする機能が充実しています。

AIの活用は音声分野にも及びます。標準搭載の「レコーダー」アプリでは、録音した音声AIがムードに合わせたBGMを自動生成して追加できるようになりました。これにより、音声メモや簡単なポッドキャスト制作のハードルが大きく下がることが期待されます。

日常生活に溶け込む機能も強化されています。「Pixel Watch」では、Googleフォトからお気に入りの写真を最大30枚選び、文字盤として表示可能に。また、日の出のように画面が徐々に明るくなる「Sunrise Alarm」は、体内リズムを整えるのに役立ちます。

今回発表された新機能群は、GoogleがAI技術をデバイスに深く統合し、ユーザーの日常的なタスクや創造的活動をシームレスに支援する方向性を明確に示しています。単なる機能追加に留まらず、AIがいかに生活を豊かにできるかを示す好例と言えるでしょう。

Uber、運転手向けAI訓練タスクを試験導入

ギグワーカーの新たな収益源

米国内での試験的プログラム
運転手が追加収入を得る機会
アプリ経由のマイクロタスク提供

AI訓練のクラウドソース化

音声録音や画像収集など
AIモデルのデータ収集・注釈

大手AI企業への挑戦

Scale AIなどへの対抗策
「柔軟な働き方」のプラットフォーム強化

米配車大手のUberは米国で、運転手がAIモデル訓練に参加し収入を得る試験プログラムを開始しました。アプリで音声録音などのタスクを請け負い、新たな収益源とAIデータ市場での競争力確保を狙います。

具体的なタスクは多岐にわたります。「車の画像をアップロードする」「自身の言語で話した音声を録音する」といった指示がアプリに表示されます。スペイン語のメニューを撮影すると1ドル程度の報酬が得られる例もあるようです。

この動きは、Uberが持つ膨大な労働力をAI訓練に活用し、Scale AIなど既存の有力企業に対抗する狙いです。同社は最近データラベリング企業を買収し、AI事業を強化しています。

一方で、運転手からは既に報酬の低さに対する不満も出ています。こうしたマイクロタスクが、彼らにとって魅力的な収入源となるかは未知数です。ギグワーカーの待遇が、この新事業の成否を左右するかもしれません。

今回の施策は「柔軟な働き方のプラットフォーム」構築の一環です。需要が高いエリアを示す新機能や、不当なアカウント停止措置の是正など、運転手体験の向上策も同時に発表されました。

Pinterest、AIコンテンツの表示制御ツールを導入

新機能「チューナー」の概要

ユーザーの不満を受けAI表示を制限
「チューナー」でAI表示量を調整
特定カテゴリでAI画像表示を削減

利用方法と今後の展開

設定画面からいつでも変更可能
WebとAndroidで先行導入
対象カテゴリは今後拡大予定
AI生成ラベルもより明確化

AIコンテンツとの向き合い方

AI画像完全な非表示は不可

画像共有サービス大手のPinterestは16日、利用者のフィードに表示されるAI生成コンテンツの量を制限できる新機能「チューナー」を導入しました。これは、低品質なAIコンテンツ、いわゆる「AIスロップ」の氾濫に対するユーザーの不満に応えるものです。利用者は設定画面から、美容やファッションといった特定のカテゴリでAI画像の表示を減らすことができ、より個人の好みに合わせたフィードの最適化が可能になります。

新機能はアプリの設定画面にある「おすすめを調整」から利用できます。利用者は美容、アート、ファッション、ホームデコレーションなど、AI画像が特に多いカテゴリを選択し、AIコンテンツの表示を減らす設定が可能です。Pinterestは今後、ユーザーからのフィードバックに基づき、対象カテゴリをさらに拡大する方針です。設定はいつでも自由に変更できます。

この機能導入の背景には、ユーザー体験の悪化への強い懸念があります。近年、PinterestのフィードはAIが生成した不自然な画像で溢れかえり、ユーザーからは「インスピレーションの源泉」としての価値が損なわれているとの批判が噴出していました。この問題が放置されれば、ブランドの評判や最終的な収益に悪影響を及ぼす可能性がありました。

一方で、このツールはAIコンテンツを完全に非表示にするものではありません。ある学術論文によると、オンライン上の全素材の57%が既にAIによって生成されていると指摘されており、完全な排除は現実的ではないのが実情です。同社は既存の「AIにより変更」というラベルもより目立たせるとしており、人間の創造性とAI技術革新のバランスを取るという難しい課題に直面しています。

この新しい制御ツールは、まずウェブサイト版とAndroidアプリで提供が開始されました。iOSアプリのユーザーには、今後数週間以内に展開される予定です。Pinterestは、今回の機能提供を通じて、利用者が自身の体験をより細かく管理できるようにし、プラットフォームの価値を維持・向上させる狙いです。

AIが特定のモノを識別、MITが新学習法を開発

生成AIの課題

一般的な物体の認識は得意
特定の「うちの子」の識別は困難

MITの新手法

動画データで文脈から学習
オブジェクトに偽名を与え推論を強制
既存モデルの汎用能力は維持

成果と将来性

物体特定精度が最大21%向上
ロボット工学や支援技術に応用
大規模モデルほど高い効果

マサチューセッツ工科大学(MIT)の研究チームが、生成AIが特定の「個人化された物体」を正確に識別する新しい学習手法を開発しました。ビデオ映像の連続フレームから文脈を学習させ、物体の特定精度を最大21%向上させることに成功。既存AIの汎用能力を損なうことなく、特定のペットや持ち物の追跡、さらには視覚障害者向け支援技術など、幅広い分野への応用が期待されます。

GPT-5のような最新の視覚言語モデル(VLM)は、「犬」のような一般的な物体は高精度で認識できます。しかし、多くの犬の中から特定の飼い犬「ポチ」だけを見つけ出すような、個体を識別するタスクは苦手としていました。これは、AIが一般的な知識に頼りがちで、提示された文脈から個別の特徴を捉える能力が不足していたためです。

この課題を克服するため、研究チームは新しいデータセットを構築しました。同じ物体が様々な状況で映っているビデオ追跡データを活用。これにより、AIは単一の画像ではなく、連続した文脈の中から対象物を一貫して特定する能力を学びます。これは、人間が状況から物事を判断するプロセスに似たアプローチです。

さらに研究チームは、AIが既存知識に頼って「ずる」をするのを防ぐための工夫を凝らしました。例えば、トラの映像を学習させる際に「トラ」というラベルを使わず、「チャーリー」といった偽名を割り当てました。これにより、AIは名前から推測できなくなり、純粋に映像の文脈情報だけに集中して個体を識別せざるを得なくなります。

この手法で再学習させたモデルは、個人化された物体の位置特定タスクにおいて、最先端システムを上回る性能を示しました。精度は平均で約12%、偽名を用いたデータセットでは最大21%も向上。特に、モデルの規模が大きくなるほど性能向上の幅も広がる傾向が確認されており、今後のAI開発に大きな影響を与えそうです。

この技術は、実社会の様々な場面で役立つ可能性があります。例えば、子どもがなくしやすい持ち物を追跡するシステムや、生態系調査で特定の動物を監視するツール、あるいは視覚障害者が室内で特定の物を見つけるのを助ける支援技術などです。AIがより人間のように文脈を理解する、重要な一歩と言えるでしょう。

多機能とSNS連携で覇権、ByteDanceのAI『Doubao』

中国で最も人気なAIアプリ

月間利用者1.57億人中国首位
世界でも4番目に人気の生成AI
親しみやすいアバターとUI/UX

成功を支える『全部入り』戦略

チャットから動画生成まで多機能
AIに不慣れな層も取り込む設計
TikTok(Douyin)とのシームレスな連携

バイラル設計とエコシステム

SNSでの共有を促すバイラル設計
競合からユーザーの4割が流入
自動車など他デバイスへの展開

TikTokを運営する中国ByteDance社が開発したAIアシスタント「Doubao(豆包)」が、中国市場を席巻しています。2025年8月には月間アクティブユーザー数が1億5700万人に達し、競合のDeepSeekを抜いて国内首位となりました。その成功の裏には、チャットから画像動画生成までを網羅する多機能性と、ショート動画アプリ「Douyin(抖音)」と連携した巧みなバイラル戦略があります。

Doubaoの躍進は、データにも裏付けられています。中国のデータインテリジェンス企業QuestMobileによると、月間アクティブユーザー数は1億5700万人。競合のDeepSeekは1億4300万人で2位に後退しました。また、ベンチャーキャピタルa16zの調査では、ChatGPTGeminiに次ぐ世界で4番目に人気の生成AIアプリにランクインしています。

Doubaoの最大の特徴は「全部入り」とも言える包括的な機能です。テキスト対話だけでなく、画像生成、短い動画作成、データ分析、AIエージェントのカスタマイズまで、一つのアプリで完結します。これはまるで、ChatGPT、Midjourney、Sora、Character.aiといった複数の最先端ツールを一つに集約したような体験をユーザーに提供するものです。

なぜ、この「全部入り」戦略が受け入れられたのでしょうか。それは、DoubaoがAIに詳しくない一般ユーザーを明確にターゲットにしているからです。親しみやすいアバターやカラフルなUIに加え、テキスト入力より音声動画での対話を好む層を取り込み、AI利用のハードルを劇的に下げることに成功しました。

成功のもう一つの柱が、ByteDanceの得意とするSNS連携とバイラル設計です。ユーザーはDoubaoで生成したコンテンツを、Douyin(中国TikTok)ですぐに共有できます。逆にDouyinの動画要約をDoubaoにさせることも可能です。この利便性と楽しさが爆発的な拡散を生み、ユーザーエンゲージメントを高めています。

競合のDeepSeekがモデルの性能や論理的タスクに注力する一方、Doubaoは消費者向けアプリとしての完成度で差をつけました。QuestMobileのデータでは、DeepSeekを離れたユーザーの約4割がDoubaoに移行したとされています。これは、ByteDanceが長年培ってきた「アプリ工場」としての開発力が発揮された結果と言えるでしょう。

ByteDanceはスマートフォンの枠を超え、Doubaoをエコシステムの中核に据えようとしています。すでにスマートグラスや自動車メーカーとの提携を進めており、車載アシスタントやAIコンパニオンとしての搭載が始まっています。Doubaoは、私たちの生活のあらゆる場面に浸透するプラットフォームを目指しているのです。

日本政府、OpenAIに著作権侵害停止を公式要請

政府が公式に「待った」

OpenAIへの正式な申し入れ
動画生成AI「Sora」が対象
漫画・アニメの無断利用を懸念

保護されるべき日本の文化

「かけがえのない宝」と表現
知的財産戦略担当大臣が言及
クールジャパン戦略にも影響

OpenAIが抱える課題

著作権問題への対応に苦慮
CEOは日本の創造性を評価

日本政府が、米OpenAI社に対し、動画生成AI「Sora」の学習データに日本の漫画やアニメを無断で使用しないよう正式に要請しました。知的財産戦略を担当する木内稔大臣が明らかにしたもので、日本の文化資産である著作物の保護を強く求める姿勢を示しています。生成AIの急速な進化に伴い、著作権侵害のリスクが改めて浮き彫りになった形です。

木内大臣は、漫画やアニメを「日本の誇るかけがえのない宝」と表現し、その創造性が不当に利用されることへの強い懸念を表明しました。この要請は内閣府から正式に行われたもので、「クールジャパン戦略」を推進する政府としても、クリエイターの権利保護は看過できない重要課題であるとの認識が背景にあります。

OpenAIは、Soraのリリース以降、著作権を巡る問題に直面しています。ユーザーによってマリオやピカチュウといった著名キャラクターが無断で生成される事例が相次ぎ、対応に苦慮しているのが現状です。今回の日本政府からの公式な申し入れは、同社が世界中で直面する著作権問題の新たな一石となる可能性があります。

一方で、OpenAIサム・アルトマンCEOは、かねてより「日本の卓越した創造性」への敬意を公言しています。同社の画像生成AIでも過去にスタジオジブリ風の画像が大量に生成されるなど、日本コンテンツがAIモデルに大きな影響を与えていることは明らかです。今回の要請を受け、同社が学習データの透明性確保や著作権者への配慮にどう踏み込むかが焦点となります。

AIが細胞変化を画像で予測、創薬の実験を代替

AI創薬の新モデル登場

新AIモデルMorphDiff
遺伝子情報から細胞画像を生成
実験前に薬の効果を可視化

コストと時間を大幅削減

高価な画像化実験を代替
作用機序の特定を高速化
画像に迫る予測精度を達成

ビジネスへの応用

新薬候補の優先順位付け
既存薬の再利用(リパーパシング)

アラブ首長国連邦のAI専門大学院大学MBZUAIの研究者らが、創薬プロセスを革新する可能性を秘めた新しいAIモデル「MorphDiff」を開発しました。このモデルは、薬物投与などによって変化する遺伝子の活動パターンをもとに、細胞がどのように変化するかを画像で高精度に予測します。これにより、時間とコストのかかる実験の一部をコンピュータ上のシミュレーションで代替することを目指します。

MorphDiffの核心は、画像生成AIで広く使われる「拡散モデル」技術の応用です。薬などの刺激によってどの遺伝子が活性化・不活性化したかという情報(トランスクリプトーム)を入力するだけで、摂動後の細胞のリアルな顕微鏡画像を生成できます。これにより、実験室で実際に細胞を培養し観察する前に、その結果をプレビューすることが可能になります。

この技術がもたらす最大の利点は、創薬研究における試行錯誤を大幅に削減できる点です。従来、何百万もの候補化合物の効果を一つ一つ画像化して評価するのは不可能でした。しかしMorphDiffを使えば、コンピュータ上で多数の化合物の効果をシミュレートし、有望な候補を効率的に絞り込めます。

生成される画像は単なる想像図ではありません。細胞の質感や内部構造といった数百もの生物学的特徴を正確に捉えており、その統計的分布は実際の実験データと区別がつかないレベルに達しています。この高い忠実性により、薬がどのように作用するかのメカニズム(MOA)を正確に推定するのに役立ちます。

具体的な応用例として、新薬候補のスクリーニングが挙げられます。未知の化合物が生み出す細胞変化の画像を予測し、既知の薬の作用パターンと比較することで、その化合物の潜在的な効果や副作用を迅速に評価できます。これは開発パイプライン全体の効率化に直結するでしょう。

現状では推論速度などの課題も残されていますが、今後の研究開発により、コンピュータ内での実験が現実の実験を強力に補完する未来が近づいています。この技術は、創薬研究のあり方を変え、より早く、より安価に新薬を届けるための重要な一歩となる可能性があります。

写真1枚で場所特定、高速・省メモリAIが登場

高速・省メモリの秘密

地上の写真と航空写真を照合
画像ハッシュ値という数値列に変換
ピクセル比較せず特徴で照合
従来比で速度2倍以上、メモリ1/3以下

期待される応用分野

GPS代替のナビゲーションシステム
メタデータがない画像の場所特定
防衛・諜報分野での活用
災害時の緊急対応など

中国石油大学の研究チームが、地上の写真1枚から撮影場所を高速かつ正確に特定する新しいAIモデルを開発しました。ディープ・クロスビュー・ハッシングと呼ばれる技術を用い、従来モデル比で速度を2倍以上、メモリ使用量を3分の1以下に削減。高精度を維持しつつ、ナビゲーションや防衛分野での活用が期待されます。

この技術の鍵は、画像をピクセル単位で比較しない点にあります。AIは地上写真と航空写真の両方から、建物の形や配置といった本質的な特徴(ランドマーク)を抽出。それらを「ハッシュ」と呼ばれる固有の短い数値列に変換します。この「画像の指紋」とも言える数値を照合することで、膨大なデータからでも瞬時に候補を絞り込めるのです。

性能面でも目覚ましい成果を上げています。最適な条件下では候補地の絞り込みに最大97%の確率で成功し、最終的な位置特定の正答率も82%に達します。これは既存の高性能モデルに匹敵する精度です。処理速度は競合モデルの約4倍、メモリ使用量も35MBと極めて効率的です。

この高速・省メモリという特性は、多様な応用を可能にします。例えば、自動運転車でGPSが途絶えた際のバックアップ航法システムや、メタデータのない写真を分析する防衛・諜報活動、災害時の迅速な状況把握といった緊急対応など、その可能性は多岐にわたります。

一方で、実用化には課題も残ります。季節の変化による景観の違いや、雲などによる画像の遮蔽といった実環境のノイズにどこまで対応できるかは、今後の大規模な実証実験で検証される必要があります。研究チームは、より多様な地域の画像データを用いることで、これらの課題を克服できるとしています。

ウォルマート、ChatGPTで直接購入可能に

AIショッピングの新体験

ChatGPTで直接商品購入
ウォルマートアカウントと連携
決済までシームレスに完結
サードパーティ商品も対象

パーソナライズの進化

顧客ニーズをAIが予測
検索中心から対話型へ
能動的な買い物提案を実現

ウォルマートのAI戦略

独自AI「Sparky」も開発
社内業務にもOpenAI活用

米小売大手ウォルマートは10月14日、OpenAIとの提携を発表しました。これにより消費者は、対話AI「ChatGPT」を通じて食料品や日用品を直接購入し、決済まで完了できるようになります。ユーザーはウォルマートのアカウントをChatGPTに連携させるだけで、この新しいAIショッピング体験を利用できます。eコマースのあり方を大きく変える可能性を秘めた動きです。

この機能は、従来の検索バーにキーワードを打ち込む形式のオンラインショッピングからの脱却を目指すものです。AIとの対話を通じて、ユーザーは食事の計画を立てたり、必需品を補充したり、さらには新しい商品を発見したりすることが可能になります。ウォルマートは、この提携によって顧客のニーズをより深く理解し、予測することで、パーソナライズされた能動的な買い物体験を提供できるとしています。

今回の提携は、eコマース市場への参入を狙うOpenAIの戦略の一環でもあります。同社は最近、商品の発見から推薦、決済までを担う「エージェント的ショッピングシステム」構想を発表しており、EtsyやShopifyの事業者とも連携を進めています。大手小売業者であるウォルマートとの提携は、この構想を加速させる重要な一歩と言えるでしょう。

一方、ウォルマートもAI活用に積極的です。同社はOpenAIとの提携だけでなく、独自の生成AIショッピングアシスタントSparky」も開発しています。将来的にはテキストだけでなく、画像音声など多様な入力に対応し、商品の再注文やサービスの予約まで可能にする計画です。外部との連携と自社開発の両輪で、AI時代の小売業をリードする狙いです。

ウォルマートとOpenAIの関係は今回が初めてではありません。すでに社内チーム向けにChatGPT Enterpriseを導入するなど、業務効率化にもAIを活用しています。AIを用いてファッション製品の生産期間を最大18週間短縮したり、顧客対応時間を最大40%改善したりと、具体的な成果も報告されています。今回の提携は、これまでの協力関係を消費者向けサービスへと拡大させたものです。

NVIDIA、卓上AIスパコン発表 初号機はマスク氏へ

驚異の小型AIスパコン

1ペタフロップスの演算性能
128GBのユニファイドメモリ
Grace Blackwellチップ搭載
価格は4,000ドルから提供

AI開発を個人の手に

最大2000億パラメータのモデル実行
クラウド不要で高速開発
開発者や研究者が対象
初号機はイーロン・マスク氏へ

半導体大手NVIDIAは2025年10月14日、デスクトップに置けるAIスーパーコンピュータ「DGX Spark」を発表しました。ジェンスン・フアンCEO自ら、テキサス州にあるSpaceXの宇宙船開発拠点「スターベース」を訪れ、初号機をイーロン・マスクCEOに手渡しました。AI開発の常識を覆すこの新製品は、15日から4,000ドルで受注が開始されます。

DGX Sparkの最大の特徴は、その小型な筐体に詰め込まれた圧倒的な性能です。1秒間に1000兆回の計算が可能な1ペタフロップスの演算能力と、128GBの大容量ユニファイドメモリを搭載。これにより、従来は大規模なデータセンターでしか扱えなかった最大2000億パラメータのAIモデルを、個人のデスク上で直接実行できます。

NVIDIAの狙いは、AI開発者が直面する課題の解決にあります。多くの開発者は、高性能なPCでもメモリ不足に陥り、高価なクラウドサービスデータセンターに頼らざるを得ませんでした。DGX Sparkは、この「ローカル環境の限界」を取り払い、手元で迅速に試行錯誤できる環境を提供することで、新たなAIワークステーション市場の創出を目指します。

この卓上スパコンは、多様なAI開発を加速させます。例えば、高品質な画像生成モデルのカスタマイズや、画像の内容を理解し要約する視覚言語エージェントの構築、さらには独自のチャットボット開発などが、すべてローカル環境で完結します。アイデアを即座に形にできるため、イノベーションのスピードが格段に向上するでしょう。

DGX Sparkは10月15日からNVIDIAの公式サイトやパートナー企業を通じて全世界で注文可能となります。初号機がマスク氏に渡されたのを皮切りに、今後は大学の研究室やクリエイティブスタジオなど、世界中のイノベーターの元へ届けられる予定です。AI開発の民主化が、ここから始まろうとしています。

Googleフォト、AIとの対話で写真編集を刷新

AIとの対話で簡単編集

米国Androidユーザー向けに提供
テキストや音声で編集を指示
「Help me edit」から起動
複雑な編集も一括で実行可能

多彩な編集プロンプト例

不要な反射や映り込みを除去
ペットに衣装を合成
古い写真を鮮明に復元
背景を拡張し構図を改善

Googleが、写真編集アプリ「Googleフォト」に、AIとの対話を通じて画像を編集できる新機能を導入しました。2025年10月14日、まずは米国Androidユーザーを対象に提供を開始。ユーザーは「Help me edit」機能から、テキスト入力や音声で「窓の反射を消して」などと指示するだけで、AIが自動で高度な編集を実行します。専門的なスキルがなくとも、誰もが直感的に写真を加工できる時代の到来です。

この新機能の利用方法は極めてシンプルです。Googleフォトで編集したい写真を開き、「Help me edit」ボタンをタップ。後は、実現したいことを自然な言葉で話したり、入力したりするだけでAIが意図を汲み取り、編集作業を代行します。これにより、これまで複数のツールや複雑な操作を要した作業が、ワンステップで完了するようになります。

具体的な活用例は多岐にわたります。例えば、商品写真の窓ガラスに映り込んだ不要な反射の除去や、背景の整理といった実用的な修正が瞬時に可能です。さらに、古い記録写真を鮮明に復元したり、複数の修正指示を一度にまとめて実行したりすることもできます。これにより、マーケティング資料や報告書の質を、手間をかけずに向上させることが期待できるでしょう。

加えて、この機能は創造性の発揮も支援します。ペットの写真にハロウィンの衣装を合成したり、殺風景な丘をヒマワリ畑に変えたりといった、遊び心のある編集も可能です。「犬が月面でスキーをしている写真」のような非現実的な画像生成も、簡単な指示で実現できます。ビジネスにおけるクリエイティブ制作の新たな可能性が広がります。

今回のアップデートは、AIが専門家のスキルを民主化する象徴的な事例と言えるでしょう。画像編集の専門知識がないビジネスパーソンでも、高品質なビジュアルコンテンツを迅速に作成できるようになります。生産性の向上はもちろん、新たなアイデア創出のツールとして、経営者エンジニアにとっても注目すべき機能ではないでしょうか。

AIと衛星で養殖支援、タイの新興企業が水質監視

Aquawiseの革新技術

AIと衛星画像で水質を監視
ハードウェア不要で低コスト
水温・酸素レベルを継続追跡
将来の水質変化を予測

東南アジア市場の課題

既存の監視機器は高価
年間約300億ドルの経済損失
手作業の検査に依存する現状

今後の展望

TechCrunch Disruptで発表
来年には資金調達を計画

タイのスタートアップ「Aquawise」が、AIと衛星画像を活用した養殖場の水質監視技術を開発しました。同社は10月27日からサンフランシスコで開催される技術カンファレンス「TechCrunch Disrupt 2025」でこの技術を発表します。東南アジアの養殖業者が抱える高コストな水質監視の課題を、ハードウェア不要のソリューションで解決し、水産業の生産性向上を目指します。

Aquawiseの技術は、魚やエビの養殖場を撮影した衛星画像を、物理ベースのAIモデルで解析する仕組みです。これにより、水温、クロロフィル、酸素レベルといった重要な指標を継続的に監視できます。従来の日次や週次の手動検査とは異なり、常時追跡と将来の変化予測が可能になる点が大きな強みです。

なぜ今、この技術が求められているのでしょうか。東南アジアでは、多くの養殖業者が既存のセンサーや水質検査キットを高価で導入できずにいます。水質の悪化は養殖魚の病気を誘発し、業界全体で年間約300億ドルもの経済的損失を引き起こしていると推定されており、安価で効果的な解決策が急務でした。

同社のアイデアは、当初ソナー(音波探知機)を用いるものでしたが、コストの壁に直面。より多くの業者が利用できるよう、衛星データ活用へと舵を切りました。19歳のCEO、Patipond Tiyapunjanit氏が率いるチームは「地域の生活向上に貢献したい」という強いビジョンを掲げています。

Aquawiseは現在、複数の養殖場と協力してデータを収集し、AIモデルの精度向上に注力しています。市場投入に向けた準備を進めるとともに、2026年には投資家からの資金調達も計画しています。養殖業は国連が「100億人の食を支える」と期待する急成長分野であり、同社の技術への関心は高まりそうです。

Acer、50TOPSのAI搭載Chromebookを投入

強力なオンデバイスAI

MediaTek製CPUを搭載
50TOPSのAI処理能力
高速・安全なオフラインAI
AIによる自動整理や画像編集

ビジネス仕様の高性能

360度回転する2-in-1設計
最大17時間の長時間バッテリー
最新規格Wi-Fi 7に対応
Gemini 2.5 Proが1年間無料

Googleは、Acer製の新型ノートPC「Acer Chromebook Plus Spin 514」を発表しました。最大の特徴は、MediaTek Kompanio Ultraプロセッサが実現する強力なオンデバイスAI機能です。オフラインでも高速に動作するAIが、ビジネスパーソンの生産性を飛躍的に高める可能性を秘めています。

新モデルは、50TOPSという驚異的なAI処理能力を備えています。これにより、タブやアプリを自動で整理する「スマートグルーピング」や、AIによる高度な画像編集デバイス上で直接、高速かつ安全に実行できます。機密情報をクラウドに送る必要がないため、セキュリティ面でも安心です。

ハードウェアもビジネス利用を強く意識しています。360度回転するヒンジでノートPCとタブレットの1台2役をこなし、14インチの2.8K高解像度タッチスクリーン、最大17時間持続するバッテリー、最新のWi-Fi 7規格への対応など、外出先でも快適に作業できる仕様です。

購入者特典として、Googleの最先端AIモデル「Gemini 2.5 Pro」や2TBのクラウドストレージを含む「Google AI Proプラン」が12ヶ月間無料で提供されます。これにより、文書作成やデータ分析といった日常業務がさらに効率化されるでしょう。

今回、デスクトップ型の「Acer Chromebox CXI6」と超小型の「Acer Chromebox Mini CXM2」も同時に発表されました。オフィスでの固定利用から省スペース環境まで、多様なビジネスシーンに対応する製品群で、AI活用を推進する姿勢がうかがえます。

マイクロソフト、自社開発画像生成AIを発表

MAI-Image-1の主な特徴

初の自社開発画像生成AI
フォトリアル画像に強み
高速画像生成を実現
LMArenaでトップ10入り

開発の背景と戦略

OpenAI依存からの脱却模索
クリエイターフィードバックを反映
安全性の確保にコミット
自社AIモデルへの投資を拡大

マイクロソフトAIが13日、初の自社開発によるテキストto画像生成モデル「MAI-Image-1」を発表しました。これは同社のAI戦略における重要な一歩であり、OpenAIへの依存低減にもつながる可能性があります。

MAI-Image-1は、クリエイティブプロフェッショナルの意見を取り入れ、画一的でない出力を目指しました。稲妻や風景などのフォトリアリスティック画像生成に優れ、処理速度も大型モデルより高速です。

このモデルは、AIモデルの性能を人間が評価するベンチマークサイト「LMArena」ですでにトップ10に入る実績を上げており、その技術力の高さが示されています。

今回の発表は、マイクロソフトOpenAIとの関係が複雑化する中、自社開発のAI能力を強化する戦略の一環です。音声生成AI「MAI-Voice-1」など、自社モデルのラインナップ拡充を進めています。

同社は安全で責任ある結果の確保にコミットしていると強調します。しかし、実際の安全性ガードレールについてはまだ評価されておらず、今後の検証が待たれるでしょう。

GoogleのAI画像編集、主要サービスに統合へ

対応サービスの拡大

Google Searchへの統合
Google Photosへ順次展開
NotebookLMにも導入

NotebookLMの機能強化

動画概要のビジュアル向上
6種類の新しいスタイル追加
要点を素早くまとめるBrief形式

検索と写真での活用

会話形式での画像編集
AI Modeで新規画像を生成

Googleは、対話形式で画像を編集するAIモデル「Nano Banana」を、検索や写真、NotebookLMといった主要サービスへ順次展開すると発表しました。これにより、専門知識がなくても、テキストプロンプトだけで高度な画像編集が可能になります。

Google検索では、Lens機能を通じて利用可能になります。ユーザーは撮影した写真を選択し、バナナアイコンの「Create」ボタンをタップ。AIにどのように変更したいかを伝えるだけで、画像瞬時に変換されます。

NotebookLMでは、同機能が「Video Overviews」を強化します。アップロードした資料に基づき、水彩やアニメ風など6種類の新しいスタイルで動画を生成。文書の要点を素早く捉える「Brief」形式も登場しました。

近々には、Google Photosにも同機能が導入される予定です。これにより、日常の写真整理やアルバム作りの際にも、AIによるクリエイティブな編集が手軽に楽しめるようになります。

この動きは、画像編集のハードルを劇的に下げ、クリエイティブな活動をより身近なものにする可能性を秘めています。ビジネスシーンでの資料作成から個人の趣味まで、活用の幅は大きく広がるでしょう。

Google、欧州など大学生にGeminiを1年間無償提供

無償提供の概要

対象は欧州・中東・アフリカの大学生
1年間無料のAI Proプラン
12月9日までの申込が必要
18歳以上の学生が対象

利用可能な主要機能

最先端モデルGemini 2.5 Pro
調査レポート作成Deep Research
思考整理を支援NotebookLM
テキストから動画生成Veo 3

Googleは2025年10月13日、欧州・中東・アフリカ(EMEA)域内の大学生向けに、自社の最先端AIツール群「Google AI Proプラン」を1年間無償提供すると発表しました。18歳以上の学生が対象で、同年12月9日までの申込みが必要です。この取り組みは、次世代のAI人材育成と将来の労働力準備を目的としています。

無償提供されるのは、Gemini 2.5 Proへの拡張アクセスや、大規模な調査レポートを自動生成する「Deep Research」など、高度なAI機能を含むプランです。学生はこれらのツールを活用し、学業や創造的活動における生産性を大きく向上させることが可能になります。

さらに、音声動画の概要作成機能が強化された思考支援ツール「NotebookLM」や、テキスト・画像から高品質な動画を生成する「Veo 3」も利用可能です。これにより、学生は研究からプレゼンテーション準備まで、多岐にわたるタスクをAIサポートで進められます。

Googleは単なる答えの提供ではなく、理解を深め批判的思考を育むことを重視しています。そのため、質問やステップバイステップの支援で学習を導く「Guided Learning」モードも導入。複雑な数学の問題解決や論文構築などをサポートします。

学生は、最新の画像生成・編集モデル「Nano Banana」を使い、寮のデザインやクラブのロゴなど、アイデアを視覚的に具体化することもできます。創造性を刺激し、プロジェクトの初期段階を迅速に進めるツールとして活用が期待されます。

この施策は、教育者向けの「Gemini for Education」の拡充とも連動しています。Googleは世界中の大学と協力し、AIリテラシーの向上と個別化された学習支援の実現を目指していて、未来の担い手への投資を強化しています。

カリフォルニア州、AIディープフェイクの罰金上限を25万ドルに

AIコンパニオン規制

自殺念慮の特定義務
治療者詐称の禁止
児童向け安全対策
危機通知の統計公表

ディープフェイク罰則強化

損害賠償上限25万ドル
わいせつ物の流布を対象
意図的な配布者が対象
児童保護が目的

カリフォルニア州は13日、子どもをAIから守るため、米国初となるAIコンパニオン規制法と、ディープフェイク画像罰則を強化する法律に署名しました。これは、チャットボット関連の自殺事件や、偽のわいせつ画像によるいじめ問題への対策として、2026年1月から施行されます。

新法では、ChatGPTなどを提供する企業に対し、利用者の自殺念慮や自傷行為を特定し対処するプロトコルの作成と公表を義務付けます。また、危機防止センターへの通知回数を保健当局に報告し、ウェブサイトで公開することも求められます。

さらに、チャットボット治療者であると偽ることを禁止。子どもには休憩を促す通知を送ったり、わいせつな画像の閲覧をブロックしたりするなど、追加の安全措置も義務付けられました。

もう一つの法律は、ディープフェイクによるわいせつな画像意図的に配布した第三者に対する罰則を強化します。被害者は1件あたり最大25万ドルの損害賠償を請求できるようになり、以前の上限15万ドルから大幅に引き上げられました。

これらの法整備は、急速に発展するAI技術に対し、いかに社会が安全性を確保していくかという課題に一つの答えを示すもの。他の州や国でも同様の規制の動きが加速する可能性があります。

AI生成「不審者」いたずら、米警察が警鐘

AIいたずらの手口と拡散

AIで不審者の偽画像を生成
親に送りパニック反応を楽しむ
動画TikTokに投稿し拡散
数百万回再生される人気投稿も

警察が警告する社会的影響

緊急通報による警察リソースの浪費
SWAT出動など危険な状況を誘発
ホームレスへの非人間的な扱い
社会問題化し警察が自粛を要請

米国で、若者たちがAIで生成した「不審者」の画像を親に送り、その反応を撮影してTikTokに投稿するいたずらが流行しています。驚いた親が警察に通報するケースが相次ぎ、警察当局は貴重なリソースを浪費し、危険な状況を招きかねないとして、この行為の自粛を強く呼びかける事態となっています。

このいたずらは、SnapchatなどのAIツールを使い、薄汚れた身なりの男性が自宅にいるかのような画像を生成し、「助けを求めてきたから家に上げた」などと親に信じ込ませる手口です。パニックに陥る親の反応を録画した動画TikTokで拡散され、中には数百万回再生されるものもあります。

問題は、いたずらが現実の警察業務を深刻に圧迫している点です。子供が関わる住居侵入の通報は最優先で扱われるため、偽の通報は緊急リソースの無駄遣いに直結します。テキサス州の警察幹部は、場合によってはSWAT(特殊部隊)が出動する可能性さえあると、その危険性を指摘しています。

さらに、この行為はホームレスの人々を非人間的に扱う倫理的な問題もはらんでいます。マサチューセッツ州セーラム市警察は「このいたずらはホームレスを非人間化し、通報を受けた警察官が実際の強盗事件として対応するため、極めて危険だ」との声明を発表。軽い気持ちのいたずらが、予期せぬ深刻な結果を招く可能性があると警鐘を鳴らしています。

AI地震学革命、微小な揺れも高精度で検出

AIによる地震検出の進化

人間の分析からAI自動化
コンピュータ画像技術を応用
専門家も認める革命的な変化

AIがもたらす新たな知見

超微小地震の検出が可能に
都市部のノイズ下でも高精度
地球内部構造の詳細な理解
将来の災害リスク評価に貢献

地震学の分野で、AI(人工知能)が地震検出のタスクを根本から変革しています。従来は専門家が手作業で行っていた分析をAIが自動化し、人間では見逃してしまうような極めて微小な地震も高精度で検出します。この技術革新は、地球の内部構造の解明や将来の災害リスク評価に大きく貢献すると期待されています。

この変化は、専門家から「初めてメガネをかけた時のようだ」と評されるほど劇的です。これまでノイズに埋もれて見えなかった微細なデータが鮮明になり、地震活動の全体像をより詳細に捉えられるようになりました。特に都市部など、ノイズが多い環境での検出能力が飛躍的に向上しています。

技術の核となるのは、コンピュータの画像認識を応用した機械学習ツールです。地震波のパターンを画像として捉え、AIが自動で地震を識別します。これにより、かつては専門家が膨大な時間を費やしていた分析作業が、迅速かつ客観的に行えるようになりました。

なぜ微小な地震の検出が重要なのでしょうか。それは、小さな揺れ一つひとつが、地球の内部構造や断層の活動に関する貴重な情報源となるからです。これらのデータを蓄積・分析することで、より精度の高い災害ハザードマップの作成などにつながる可能性があります。

この革命はまだ始まったばかりです。地震検出は自動化されましたが、データ処理の他のタスクや、究極の目標である地震予知への道のりはまだ遠いのが現状です。AIが次にどの分野でブレークスルーを起こすのか、専門家たちの挑戦が続いています。

OpenAI、アジア16カ国で低価格プラン展開

ChatGPT Goの概要

月額5ドル以下の低価格プラン
メッセージ等の上限引き上げ
無料版の2倍のメモリ容量

アジア市場での急成長

東南アジアでユーザー4倍増
インドでは有料会員が倍増
一部で現地通貨決済に対応

激化するAI競争

Google同様プランを拡大
ユーザー8億人、OS化目指す

OpenAIは2025年10月9日、月額5ドル以下の低価格プラン「ChatGPT Go」をアジアの新たに16カ国で提供開始しました。この動きは、東南アジアで週次アクティブユーザーが最大4倍に急増するなど、同地域での需要の高まりを受けたものです。Googleとの市場獲得競争が激化する中、OpenAIは成長市場での収益化とユーザー基盤の拡大を加速させます。

ChatGPT Go」は、無料版と比べて多くの利点を提供します。メッセージの送受信、画像生成、ファイルや画像のアップロードにおける1日あたりの上限が引き上げられます。さらに、メモリ容量は無料版の2倍となり、ユーザーの意図をより深く理解した、パーソナライズされた応答が可能になる点が特徴です。

今回の拡大対象は、マレーシア、タイ、フィリピン、ベトナムなど16カ国です。これらの国の一部では利便性を高めるため、現地通貨での支払いに対応します。先行して8月にインド、9月にインドネシアで導入されており、特にインドでは導入後に有料会員数が倍増するなど、大きな成功を収めています。

この動きの背景には、ライバルであるGoogleとの熾烈な競争があります。Googleも同様の価格帯の「Google AI Plus」プランを9月にインドネシアで開始し、その後40カ国以上に急拡大しています。両社は、成長著しいアジア市場で手頃な価格のAIサービスを提供し、シェア獲得を競っているのです。

OpenAIは先日開催した開発者会議で、ChatGPTの週次アクティブユーザーが全世界で8億人に達したと発表しました。さらに、ChatGPT内でSpotifyなどの外部アプリを直接利用できる機能を導入。単なるチャットボットから、アプリストアのような「OS」へと進化させる壮大な構想を明らかにしています。

2025年上半期に78億ドルの営業損失を計上するなど、AIインフラへの巨額投資が続くOpenAIにとって、収益化は大きな課題です。今回の低価格プランのアジア展開は、グローバルなユーザー基盤を拡大しつつ、持続的な成長に向けた収益源を確保するための重要な戦略的一手と言えるでしょう。

Pixel 10 Pro Fold、ドラッグ&ドロップで作業効率化

アプリ間の垣根を越える

画面分割モードで利用
テキストや画像を直接移動
マルチタスクを直感操作
複数アプリの同時操作

ビジネスでの活用法

資料作成の時間短縮
素早い情報共有が可能
SNSやブログ執筆も効率化

Googleが、折りたたみ式スマートフォン「Pixel 10 Pro Fold」の新機能を発表しました。画面分割時にアプリ間でテキストや画像を直接移動できるドラッグ&ドロップ機能により、マルチタスクの生産性が飛躍的に向上します。この機能は、特に外出先での作業効率を高めたいビジネスパーソンにとって強力な武器となりそうです。

ドラッグ&ドロップ機能の核となるのは、その直感的な操作性です。画面を二分割して、一方のアプリでテキストや画像を長押しします。すると対象がプレビュー表示され、そのままもう一方のアプリへ指を滑らせて離すだけで、コンテンツの移動が完了。これまでコピー&ペーストを繰り返していた手間が不要になります。

例えば、Google Photosにある画像をメッセージアプリに添付する場合、写真を長押ししてチャット画面にドラッグするだけです。また、ウェブブラウザで調べた文章をメモアプリやプレゼンテーション資料に貼り付ける際も、同様の操作でシームレスに連携できます。ファイルやリンクも同様に扱えるため、活用の幅は広いでしょう。

この機能はビジネスシーンで特に真価を発揮します。出先でプレゼン資料を修正する際、ブラウザから引用したいテキストを直接スライドに配置したり、急ぎの案件で必要なリンクを即座にグループチャットで共有したりといった作業がスマートフォン一台で完結します。

Googleは、このドラッグ&ドロップ機能によって「より多くのことを、より速く」実現できるとしています。スマートフォンの大画面化と高性能化が進む中、PCライクな操作性を実現するこの機能は、モバイルワークの生産性を新たな次元に引き上げる可能性を秘めています。

Figma、Google Gemini搭載でデザイン高速化へ

Gemini搭載の狙い

進化するデザイナーのニーズ対応
画像編集・生成機能の強化
ワークフローの大幅な高速化
画像生成遅延を50%削減

加速するAI業界の覇権争い

大手アプリへのAIモデル統合が加速
消費者への普及で優位性を確保
FigmaはOpenAIとも提携済み
非独占的なパートナーシップ戦略

デザインプラットフォーム大手のFigmaは10月9日、Googleとの提携を発表しました。Googleの最新AIモデル群「Gemini」を自社ツールに統合し、AIによる画像編集や生成機能を大幅に強化します。この提携は、製品デザイナーやチームの進化するニーズに応え、クリエイティブワークフローを劇的に高速化することが狙いです。

具体的には、高速な「Gemini 2.5 Flash」や高性能な「Gemini 2.0」、画像生成モデル「Imagen 4」がFigmaに導入されます。特にGemini 2.5 Flashは画像生成機能に組み込まれ、社内テストでは画像生成時の遅延を50%削減する成果を上げています。ユーザーはプロンプト入力だけで、画像の生成や変更を迅速に行えるようになります。

この提携は、AI業界の覇権争いを象徴する動きと言えるでしょう。OpenAIGoogleなどのAI開発企業は、巨大なユーザー基盤を持つ既存アプリケーションに自社モデルを統合することで、消費者への普及を一気に進めようと競っています。有力プラットフォームとの連携が、市場での優位性を確立する鍵となっているのです。

興味深いのは、今回の提携非独占的である点です。FigmaはすでにOpenAIとも提携しており、ChatGPT内でFigmaの機能を利用できます。これは、特定のAI技術に依存するのではなく、デザイナーにとって最適なツールを柔軟に提供するというFigmaのプラットフォーム戦略を明確に示しています。

一方、Googleにとってもこの提携は重要です。同社は法人向けAIプラットフォーム「Gemini Enterprise」を発表したばかり。Figmaとの連携は、企業の既存ワークフローにAIをシームレスに組み込むというGoogleの戦略を具体化するショーケースとなります。

多くの企業で生成AIの試験導入が難航する中、GoogleはFigmaのような成功事例を通じて、AIが生産性向上に直結する投資であることを証明したい考えです。今回の提携は、専門ツールへのAI統合が今後さらに加速することを示唆しています。

Google、AI試着が「靴」に対応 日本含む3カ国で展開へ

新機能と展開地域

バーチャル試着が靴カテゴリーに対応。
展開地域を日本、カナダ、豪州へ拡大。
米国で提供中の衣料品試着に続く。

AI試着の仕組み

ユーザーの全身写真から試着を実現。
AIが形状と奥行きを正確に認識し合成。
デジタル版の自分に高精度で反映
試着画像保存・共有が可能。

Googleは10月8日、自社のAIを活用したバーチャル試着(VTO)機能を大幅に拡張すると発表しました。これまで米国で衣料品のみに提供されていましたが、新たに靴カテゴリーに対応するとともに、展開地域を日本、カナダ、オーストラリアへ拡大します。これにより、ユーザーは自分の写真を用いて、オンライン上で靴を試着できるようになります。

今回の機能拡張は、ECにおける試着の利便性を大きく向上させます。ユーザーはGoogleのショッピング検索結果から対象の靴を選び、「Try It On」ボタンを押すことで試着が可能です。特に注目すべきは、AIが個々の足の形状や奥行きを正確に認識し、違和感なく高精度で合成できる点です。

この機能の核となるのは、高度な生成AI技術です。以前のVTOは多様なモデルの体型に商品を当てはめるものでしたが、新機能では、ユーザーが自身の全身写真をアップロードし、デジタルバージョンの自分自身に試着ができます。数秒で合成画像が生成され、靴や衣料品が自分に似合うかを確認できます。

日本市場への展開は、ECサイトにおける購買体験を大きく変える可能性があります。試着体験は消費者の「本当に似合うか」という疑問を解消し、返品率の低下やコンバージョン率の向上に寄与することが期待されます。米国では既に、この試着画像が標準的な商品画像よりも多く共有されています。

VTO市場では競争が激化しており、AmazonやWalmartといった巨大EC企業も同様の技術を導入しています。Googleは、AI生成ビデオ機能を持つ実験アプリ「Doppl」なども提供しており、パーソナルスタイリング分野での技術優位性を確立しようとしています。

Google AI、コア製品を劇的進化 9月のChrome/Search/Gemini刷新まとめ

コア製品のAI統合

ChromeGeminiブラウジングアシスタント搭載
Searchにリアルタイム視覚検索(Search Live)導入
複雑な多段階質問に対応するAIモードの拡充
Android Gboardにトーン修正・文法校正AI

Geminiと次世代技術

カスタムAI「Gems」の共有機能でコラボを促進
Nano Bananaによる高度な画像生成・編集機能

Googleは2025年9月、AI技術を中核製品全体に深く統合し、利用者体験の劇的な向上を発表しました。これはChrome、Search、Geminiアプリといった主要サービスに留まらず、教育分野や次世代ロボティクスまで多岐にわたります。特に、生産性向上に直結する機能が多数リリースされており、AIを使いこなしたい経営者エンジニア層にとって見逃せないアップデートです。

ウェブブラウザと検索機能は、AIアシスタント化を加速させています。ChromeではGeminiがブラウジングアシスタントとして機能し、開いているタブ全体を横断して質問に回答可能です。また、SearchのAIモードは、複雑な多段階質問に対応するだけでなく、日本語を含む多言語対応を拡大し、グローバルでの利用を促進しています。

特に画期的なのは、Search Liveの導入です。これは、リアルタイムの音声会話にスマートフォンのカメラフィードを共有する機能を組み合わせ、現実世界の課題解決をリアルタイムで支援します。また、AndroidのGboardにはAIライティングツールが追加され、トーンの修正やスペル・文法の校正が端末内で自動で行えるようになり、モバイル生産性が向上しました。

GeminiアプリはAI活用ハブとしての地位を固めています。特に、特定の目的に合わせてカスタマイズしたAIモデル「Gems」の共有機能が追加され、チーム内での共同作業や情報共有が容易になりました。さらに、DeepMind開発の画像生成・編集モデル「Nano Banana」の活用が広がり、クリエイティブな作業の可能性を広げています。

学習領域では、AIが個々のユーザーに最適化された学習を実現します。NotebookLMは、利用者のメモに基づきフラッシュカードやクイズを自動生成し、パーソナライズされた学習ガイドを提供します。スンダー・ピチャイCEOはAI教育への10億ドルのコミットメントを強調し、「Gemini for Education」を全米の高校に提供すると発表しました。

長期的な視点では、Google DeepMindが「物理エージェント」の時代を宣言し、ロボティクスモデルを強化しました。Gemini Robotics 1.5/ER 1.5は、ロボットが環境を認識し、推論し、複雑なマルチステップタスクを処理する能力を飛躍的に高めます。また、Gemini 2.5が国際プログラミングコンテストで金メダル級の成績を収め、その推論能力を証明しています。

AI画像が犯罪計画の証拠に。ChatGPT生成画像、カリフォルニア放火事件で採用

AI生成物が示す予謀

容疑者がChatGPT「燃える街」のAI画像を生成
火災発生の数ヶ月前に作成
描写は「ディストピア的な絵画
逃げ惑う群衆を含む内容

捜査当局の立証戦略

米司法省が予謀の証拠として提出
容疑者は大規模山火事の放火容疑
犯行後のChatGPTへの責任回避的な質問
監視カメラ・携帯記録と連携

米連邦捜査当局は、カリフォルニア州のパシフィックス・パリセーズ火災(Palisades Fire)の放火容疑者ジョナサン・リンダーネヒト氏を逮捕しました。注目すべきは、主要な証拠として、同氏がChatGPTを用いて作成したAI画像が挙げられている点です。これは、AI生成物が犯罪の予謀を示すデジタル証拠として法廷に提出された極めて異例なケースであり、AI技術の悪用と法執行機関のデジタル証拠戦略に大きな影響を与えています。

米司法省(DOJ)によると、容疑者は火災発生の「数ヶ月前」にChatGPTに対し、燃える森や逃げ惑う群衆を描いた「ディストピア的な絵画」の生成を指示していました。捜査当局は、このAI画像を単なる芸術作品ではなく、大規模な山火事を引き起こす計画的な犯行の明確な予兆であると主張しています。この火災は23,000エーカー以上を焼失させ、カリフォルニア史上3番目に破壊的な規模となりました。

AI画像に加え、捜査当局は容疑者の犯行前後の行動を裏付ける複数のデジタル証拠を連携させています。監視カメラ映像や携帯電話の記録により、リンダーネヒト氏が火災現場近くにいたことが判明しています。さらに、放火直後に911に通報した際、彼はChatGPTに対して「タバコが原因で火災が起きた場合、あなたは責任があるか」と責任逃れを試みる質問をしていたことも明らかになっています。

この事件は、AIツールを含むユーザーのデジタル履歴が、捜査における決定的な証拠となり得る新時代を示唆しています。経営者エンジニアの皆様は、生成AIの利用履歴やプロンプトといったデータが、個人の意図や計画性を示す証拠として扱われる現実を認識する必要があります。AIの普及に伴い、デジタル証拠の収集と分析は、法執行機関にとってますます重要な捜査手法となっています。

Google、AIプレミアム機能の提供国を世界77カ国へ拡大

サービス拡大の概要

提供国が世界77カ国に拡大
新規加入者向けに6カ月間50%割引
最新AIモデルによる生産性向上を支援

主なプレミアム機能

画像動画生成機能の利用制限緩和
Gmail/DocsへのGemini統合
ノート作成AI「NotebookLM」へのアクセス拡大
Google Oneの200GBストレージ付属

Googleは7日、AIサブスクリプションサービス「Google AI Plus」の提供国を大幅に拡大すると発表しました。新たに36カ国を追加し、合計77カ国で利用可能となります。これは、最新のAIモデルと機能を活用し、ユーザーの生産性を高めるための戦略的な一歩です。

Google AI Plusの最大の利点は、GeminiがGmailやDocsといった主要アプリに組み込まれる点です。これにより、メール作成やドキュメント要約などの日常業務をAIで自動化し、ビジネスパーソンの業務効率を飛躍的に向上させます。

さらに、画像生成・編集モデルである「Nano Banana」や、動画生成機能の利用制限が緩和されました。また、高度なノート作成AIである「NotebookLM」へのアクセスも拡大しており、研究や分析を行うユーザーにとって強力なツールとなります。

本プランは、高度なAIモデルをより低価格で利用できるように設計されています。サービス拡大を記念し、新規加入者に対しては最初の6カ月間が50%割引になる期間限定の優待も提供されます。

テイラー・スウィフト氏のプロモ動画、AI利用疑惑で炎上

プロモーションの概要

Googleと連携した新アルバムの謎解きキャンペーン
12本のアンロック動画にAI生成疑惑が浮上
動画不自然な描写に対しファンが不満
公式側は動画の生成方法についてコメント拒否

AI利用の動機と論点

Google動画生成AIモデルVeo 3の宣伝機会か
スウィフト氏は過去にAIによる偽情報拡散を批判
クリエイティブ業界の著作権倫理問題が再燃

著名アーティストであるテイラー・スウィフト氏が、Googleと共同で実施した最新アルバムのプロモーション用動画について、ファンから「AI生成ではないか」との疑惑が浮上し、物議を醸しています。これは、AI技術の商業利用やクリエイター著作権問題が議論される中で、著名人のAI活用に対する敏感さを浮き彫りにしています。

スウィフト氏は新アルバム『The Life of a Showgirl』のリリースに際し、Google検索から始まる大規模なオンライン・スカベンジャーハントを実施しました。ファンが手に入れた12本の謎解き動画について、一部のシーンがコンピューター生成特有の不自然さを示しているとして、「AIを利用している」との指摘が集中しています。

この疑惑は、Google側の思惑と密接に関係していると見られています。GoogleOpenAISora 2に対抗するAI動画生成モデルVeo 3を開発しており、数百万人のファンにリーチできるスウィフト氏とのコラボレーションは、自社技術を宣伝する絶好の機会だと考えられます。ただし、Google動画の制作方法についてコメントを拒否しています。

AI利用が特に問題となるのは、スウィフト氏自身が過去にAI生成画像による偽情報の拡散(大統領選関連の偽支持画像)に対して強い懸念を示していた経緯があるからです。豊富なリソースを持つ彼女が、コスト削減のためにAI生成に頼った場合、クリエイティブ業界における倫理的な批判を増幅させることになります。

AI技術は、クリエイターの作品制作を助ける一方で、無断で学習データに利用され、職を奪う技術に転用されることへの強い懸念があります。世界的スターのAI使用疑惑は、著作権や生計の脅威といった、クリエイティブ業界が抱える敏感なテーマを改めて浮き彫りにしています。

UCLAが光でAI画像を超高速生成、低消費電力とプライバシーを両立

光学AIの3大革新性

生成速度は光速レベルを達成
電子計算より低消費電力で稼働
デジタル情報を保護するプライバシー機能を搭載

技術構造と動作原理

デジタルとアナログのハイブリッド構造
光の位相パターンを利用したアナログ領域での計算
「知識蒸留」プロセスによる学習効率化
画像生成単一の光パスで実行(スナップショットモデル)

米カリフォルニア大学ロサンゼルス校(UCLA)の研究チームは、生成AIのエネルギー問題を解決する画期的な技術として、「光学生成モデル」を発表しました。電子ではなく光子を用いることで、AI画像生成光速レベルで実現し、従来の拡散モデルが抱える高い消費電力とCO2排出量の削減を目指します。この技術は、処理速度の向上に加え、強固なプライバシー保護機能も提供します。

学生成モデルは、デジタルプロセッサとアナログの回折プロセッサを組み合わせたハイブリッド構造です。まず、デジタル領域で教師モデルから学習したシード(光の位相パターン)を作成します。このシードにレーザー光を当て、回折プロセッサが一瞬でデコードすることで、最終的な画像を生成します。生成計算自体は、光を使ったアナログ領域で実行されるのが特徴です。

UCLAのAydogan Ozcan教授によると、このシステムは「単一のスナップショット」でエンドツーエンドの処理を完了します。従来の生成AIが数千ステップの反復を必要とするのに対し、光の物理を利用することで、処理時間が大幅に短縮され、電力効率が劇的に向上します。画質を向上させる反復モデルも開発されており、高い品質を実現しています。

本モデルの大きな利点の一つは、データのプライバシー保護能力です。デジタルエンコーダーから生成される位相情報は、人間には理解できない形式であるため、途中で傍受されても専用のデコーダーなしには解読できません。これにより、生成された情報を特定ユーザーのみが復号できる形で暗号化する仕組みを構築できます。

研究チームは、この技術をデジタルコンピュータエコシステム内の代替品ではなく、「視覚コンピューター」として位置づけています。特に、デバイスが直接人間の目に画像を投影するAR(拡張現実)やVR(仮想現実)システムにおいて、処理システムとして活用することで、クラウドからの情報伝達と最終的な画像生成を光速かつ高効率で実現できると期待されています。

OpenAI、Sora 2活用AI動画SNSを投入。ディープフェイク対策と著作権の課題

新アプリの概要

AI生成動画専用のソーシャルアプリを公開
動画生成モデルSora 2を基盤技術に使用
縦型フィードやスワイプ操作などTikTok型UIを採用

主要な特徴

本人確認でデジタルアバターを自動生成
プロンプト入力で自分をAI動画の主役に設定可能
ユーザー間の交流とコンテンツ生成を重視

倫理・法的側面

ディープフェイク露骨な内容はガードレールで制限
他者の肖像利用は設定許可が必須
著名キャラクターに関する著作権保護の基準が曖昧

OpenAIは、AI生成動画に特化した新しいソーシャルアプリをローンチしました。基盤技術には動画生成モデル「Sora 2」を使用し、TikTokのような縦型フィード形式を採用しています。ユーザーは自身のデジタルアバターを作成し、プロンプトを通じて自分や友人をフィーチャーした動画を簡単に生成できる点が最大の特徴です。この動きは、AIエンターテイメントの未来像を提示しています。

このアプリの設計思想は、ユーザーに単なる視聴ではなく、積極的なコンテンツ生成を促す点にあります。本人確認プロセスとして、画面の指示に従い数字を読み上げる自身の動画を撮影させることで、顔と声のデジタルアバターが作成されます。これにより、ユーザーは自分や友人を人魚にするなど、現実離れしたシナリオの動画を手軽に制作可能です。

OpenAIは、悪用を防ぐための厳格なガードレールを導入しています。特に懸念されるディープフェイクポルノやヌード画像、露骨なロマンスの描写は生成がブロックされます。また、他者の肖像権(likeness)の利用は、本人が設定で許可しない限り不可能となっており、プライバシー保護に配慮しています。

一方で、著作権の扱いは依然としてグレーゾーンです。テイラー・スウィフトやダース・ベイダーといった明らかな著名キャラクターの生成は制限されていますが、ピカチュウなど他の有名キャラクターの動画生成は許可されている事例が確認されています。OpenAIは今後、フィルターを回避しようとするユーザーとの間で、いたちごっこ(Whack-a-Mole)が続くと予想されます。

OpenAIによる今回のアプリ投入は、ソーシャルメディアの未来がAIエンターテイメントにあるという見方を強化します。Metaも以前にAI生成動画アプリを試みましたが失敗しています。AIコンテンツから距離を置くTikTokとは対照的に、OpenAIパーソナライズされた「偽の世界」を提供することで、先行者としての地位を確立しようとしています。

Google Pixel 10、AIで集合写真を変革。著名クリエイターと提携し生産性向上へ

集合写真の課題をAIで解決

全員のベストな表情を自動合成:Auto Best Take
撮影者も写真に追加可能:Add Me機能
構図や照明をリアルタイムで指導:Camera Coach
自然言語で画像編集を指示:会話型編集

著名クリエイターとの提携戦略

Alex Cooper氏のUnwell Networkと長期提携
Pixel、Workspace、Geminiなどを活用した一気通貫の制作
Pixel 10の機能プロモーションを共同で実施

Googleは最新スマートフォンPixel 10において、AIを駆使した革新的な集合写真機能を発表しました。特に、全員のベストショットを合成する「Auto Best Take」や、撮影者自身を写真に追加する「Add Me」など、集合写真の課題を一気に解決します。同時に、著名クリエイターAlex Cooper氏のUnwell Networkと長期提携を結び、このAI技術の活用を加速させます。

Pixel 10の核となるのは、高度なAI処理による写真の品質向上と効率化です。「Auto Best Take」は最大150フレームを分析し、全員の笑顔や視線が揃った理想的な集合写真を自動で生成します。これにより、家族やチームでの記念撮影時に何度も撮り直す手間が不要となります。

また、撮影者自身の参加を可能にする「Add Me」機能は注目に値します。同一シーンで撮影された複数の写真から、AIが撮影者を選び出して構図に違和感なく合成します。これにより、これまで撮影役としてフレームアウトしがちだったリーダーやフォトグラファーも集合写真に参加できるようになります。

さらに、AIは撮影時のコーチングにも進化をもたらしました。「Camera Coach」はGeminiモデルを使い、リアルタイムで構図、照明、カメラモードについて指示を出します。また、撮影後の編集も「会話型編集」により、「木の影を消して」といった自然言語の指示で完了し、編集作業の生産性を飛躍的に高めます。

Googleは、このAI技術をクリエイティブ産業へ展開するため、Unwell Networkとの長期パートナーシップを開始しました。Unwellは、Pixel 10を撮影・編集の主要ツールとし、Google WorkspaceやGeminiを含むGoogleエコシステム全体コンテンツ制作の運用基盤として採用します。

この提携により、クリエイターはPixel WatchやBudsを通じて、Geminiへハンズフリーでアクセス可能になります。移動中に台本アイデアを即座に生成したり、インタビューをその場で書き起こしたりするなど、コンテンツ制作のフロー全体が効率化され、クリエイティブ生産性が大幅に向上すると期待されています。

AIが農業用水の3割削減に成功、Instacrops

AI灌漑最適化の成果

水使用量を最大30%削減
作物収穫量を最大20%向上
労働コストと運用人員を削減

技術とデータ活用

毎時1,500万件のデータを処理
土壌水分やNDVIなど80以上の指標を分析
IoTセンサー網に接続しデータ収集

提供形態と市場

灌漑アドバイスをWhatsAppで提供
ラテンアメリカの高付加価値作物に注力

チリ発のアグリテック企業Instacropsは、AIを活用した水管理ソリューションにより、農地の水使用量を最大30%削減し、収穫量を20%増加させることに成功しました。世界的な渇水問題に対応し、農業分野の生産性を劇的に高めています

農業は世界の淡水の70%を消費する「喉の渇いた産業」であり、特にチリやインドなどの地域では90%以上に上ります。Instacropsは、この深刻な水不足という課題に対し、AIによる緻密な灌漑最適化という形でソリューションを提供しています。

同社の中核技術は、既存または新規のIoTセンサーネットワークからデータを収集し、大規模言語モデル(LLM)で分析することです。土壌水分、気温、湿度に加え、衛星画像由来の植物生産性指標(NDVI)など80以上のパラメーターを毎時1500万件処理します。

Instacropsは、収集したデータに基づき、農家に対してモバイル端末で最適な灌漑タイミングを通知します。農家にとって普及率の高いWhatsAppとの連携を強化しており、高度な設備を持つ農場では灌漑システムをAIが直接制御することも可能です。

Instacropsは元々、霜害警告のためのIoTハードウェア開発で創業しましたが、ハードウェアの汎用化に伴い、ソフトウェアとAIを活用した水管理へと事業を転換しました。このピボットにより、少ない人員でより多くのデータを扱い、コスト削減と市場へのインパクト拡大を両立しています。

現在、同社はリンゴ、アボカド、ブルーベリーなどのラテンアメリカの高付加価値作物に焦点を当てています。農家は農地面積に応じた年間利用料を支払うことで、AIによる高度な灌漑インサイトを得ることができます。

Google Gemini、UI刷新で視覚体験を強化へ

新UIの狙いと特徴

チャット形式からフィード形式
視覚的なプロンプト利用を促進
ユーザーエンゲージメントの向上
競合OpenAIとの差別化戦略

背景と今後の展望

OpenAISora」の成功が影響か
画像モデル「Nano Banana」の人気活用
Androidアプリのコードから発見
公式発表はまだ未定

Googleが、同社のAIアプリ「Gemini」で、UI(ユーザーインターフェース)の大幅な刷新をテストしている可能性が浮上しました。これはチャット形式から、目を引く画像付きのプロンプト案が並ぶスクロール型フィードへの移行を目指すものです。背景には、競合であるOpenAI動画編集アプリ「Sora」の成功があるとみられています。

新しいUIはAndroidアプリのコード解析から発見されたもので、まだ一般公開されていません。画面上部に「画像生成」といったショートカットを配置し、その下には創造性を刺激する具体的なプロンプト画像付きでフィード形式で表示されます。

この刷新の狙いは、ユーザーにAIの機能を自ら探させるのではなく、アプリ側から魅力的な活用法を提案することにあります。「写真を宇宙にテレポートさせる」といった楽しい提案で、ユーザーの利用を促し、エンゲージメントを高めることを目指しているのです。

競合の動向も、この変更を後押ししていると考えられます。App Storeで首位を獲得したOpenAIの「Sora」や、シンプルなUIを持つ「ChatGPT」に対し、Gemini視覚的な魅力と使いやすさで差別化を図る戦略でしょう。ユーザー体験の競争は新たな段階に入っています。

Googleは自社の強みも活かします。9月にGeminiApp Storeのトップに押し上げたAI画像モデルNano Bananaの人気を、この新UIでさらに活用する狙いです。視覚的な機能とUIを連動させ、相乗効果を狙うと考えられます。

Googleの広報担当者は「現時点で発表することはない」とコメントしており、このUIが実際に導入されるかは未定です。しかし、この動きはAIアプリの競争が、機能だけでなくユーザーを惹きつける体験のデザインへと移行していることを明確に示しています。

Perplexity、デザインチーム買収で体験価値向上へ

買収の概要

AI検索Perplexityがチームを買収
対象はAIデザインの新興企業
新設「Agent Experiences」部門へ
買収額など条件は非公開

今後の影響

買収元の製品は90日以内に終了
利用者はデータ移行と返金が可能
PerplexityのUX強化への布石
Sequoia出資の有望チームを獲得

AI検索エンジンを手がける米Perplexityは10月2日、AIデザインツールを開発する米Visual Electricのチームを買収したと発表しました。Visual ElectricのチームはPerplexity内に新設される「Agent Experiences」グループに合流します。この買収は、単なる検索エンジンの枠を超え、より高度なユーザー体験を提供するための戦略的な一手とみられます。

Perplexityのアラビンド・スリニバスCEOがX(旧Twitter)で買収を認めましたが、買収金額などの詳細な条件は明らかにされていません。新設される「Agent Experiences」グループは、同社の今後の成長を担う重要部門と位置づけられており、対話型AIエージェント体験価値向上をミッションとします。

買収されたVisual Electricは2022年設立。創業者にはAppleFacebookMicrosoft出身のエンジニアデザイナーが名を連ねます。その高い技術力とデザイン性は、著名ベンチャーキャピタルSequoia Capitalなどから250万ドルを調達した実績にも裏付けられています。

Visual Electricの主力製品は、デザイナーがAIで画像を生成し、無限のキャンバス上でアイデアを練るためのツールでした。今回の買収に伴い、この製品は90日以内にサービスを終了します。既存ユーザーはデータの書き出しが可能で、有料プラン加入者には日割りの返金対応が行われる予定です。

今回の動きは、Perplexityが単なる「回答エンジン」から、より高度でインタラクティブな「AIエージェント」へと進化する強い意志の表れと言えるでしょう。優秀なデザインチームの獲得は、複雑なタスクをこなすAIのUXを向上させる上で不可欠です。今後のサービス展開が一層注目されます。

Google新画像AI、編集・生成の常識を覆す

驚異の編集・生成能力

文脈を理解し一貫性を維持
本人そっくりの人物画像を生成
自然言語によるピクセル単位の修正
AIが曖昧な指示も的確に解釈

新たな創造性の探求

スケッチからリアルな画像を生成
古い写真の修復・カラー化も可能
最大3枚の画像を融合し新画像を創造
開発者向けツールとのシームレスな連携

Googleは2025年8月下旬、Geminiアプリに搭載された新しい画像生成・編集AIモデル「Nano Banana」を発表しました。このモデルはテキストと画像を同時に処理するネイティブなマルチモーダル能力を持ち、リリースからわずかな期間で50億以上の作品を生み出すなど世界中で注目を集めています。専門的なツールを不要にするその革新的な機能は、ビジネスにおける創造性の常識を大きく変える可能性を秘めています。

Nano Bananaの最大の強みは、シーンやキャラクターの一貫性を維持する能力です。一度生成した人物の服装やポーズ、背景だけを変更するなど、連続した編集が可能です。これにより、従来のAIが生成しがちだった「本人とは少し違う」違和感を解消し、広告素材のバリエーション作成や製品プロモーションなど、より実用的な応用が期待されます。

さらに、自然言語による「ピクセル単位の編集」も注目すべき機能です。「ソファの色を赤に変えて」といった簡単な指示で、画像内の特定要素だけを他の部分に影響を与えることなく修正できます。これにより、インテリアデザインシミュレーションや、WebサイトのUIモックアップ修正といったタスクを、専門家でなくとも直感的に行えるようになります。

このモデルは、曖昧な指示から文脈を読み取って画像を生成したり、古い写真を歴史的背景を理解した上で修復・カラー化したりすることも可能です。また、最大3枚の画像を組み合わせて全く新しい画像を創造する機能もあり、アイデアの着想からプロトタイピングまでの時間を大幅に短縮し、これまでにないクリエイティブな表現を可能にします。

エンジニア開発者にとってもNano Bananaは強力なツールとなります。Geminiアプリ内のCanvasやGoogle AI Studioと統合されており、画像ベースのアプリケーションを容易に構築できます。実際に、1枚の写真から様々な時代のスタイルに合わせた画像を生成する「PictureMe」のようなアプリが、社内のプロジェクトから生まれています。

Nano Bananaは、単なる画像生成ツールにとどまりません。専門的なスキルがなくとも誰もがアイデアを形にできる「創造性の民主化」を加速させます。Googleはすでに次の改良に取り組んでおり、この技術が今後、企業のマーケティングや製品開発にどのような革新をもたらすか、引き続き目が離せないでしょう。

Pixel 10 Pro、AIで100倍ズームを実現

Pro Res Zoomとは

Pixel 10 Pro搭載の新ズーム技術
AIで100倍ズームを実現
Tensor G5チップ高速処理

AIによる画質向上

単なるデジタルズームではない
生成AIが欠落情報を補完
ノイズ除去とシャープ化を両立
デバイス上数秒で完結

Googleが、次期スマートフォン「Pixel 10 Pro」に搭載される新たなAIカメラ技術「Pro Res Zoom」を発表しました。この技術は、生成AIを活用して最大100倍のズーム撮影でも鮮明な画質を実現するものです。遠くの被写体を、これまでにないほど詳細に捉えることが可能になります。

Pro Res Zoomの核心は、単なる画像の切り出しと拡大(デジタルズーム)ではない点にあります。撮影データから色や形といった僅かな手がかりを基に、AIが欠落したディテールを生成・補完します。これにより、従来のズーム機能ではぼやけてしまっていた被写体も、驚くほど鮮明な一枚の写真として仕上がります。

この高度な処理は、最新の「Tensor G5」チップによってデバイス上で直接実行されます。最先端の拡散モデル(diffusion model)を数秒で動作させ、ノイズ除去とシャープ化を同時に行います。クラウドにデータを送ることなく、手元で高速に処理が完結するのが大きな特徴です。

この新技術は、ユーザーにどのような価値をもたらすのでしょうか。例えば、遠くにいる野生動物や、スポーツ観戦中の選手の表情など、これまで諦めていたシーンの撮影が可能になります。Pixel 9 Proの「Super Res Zoom」が最大30倍だったのに対し、100倍という圧倒的なズーム性能は、スマートフォンの写真撮影の常識を覆す可能性を秘めています。

Googleの取り組みは、生成AIがクラウド上のサービスから、スマートフォンという日常的なデバイスへと活躍の場を広げていることを示しています。カメラ機能の進化は、AIがもたらすユーザー体験向上の好例と言えるでしょう。

MS、AI統合新プラン発表 ChatGPTと同額でOfficeも

新プラン「M365 Premium」

OfficeとAIを統合した新プラン
Copilot ProとM365 Familyを統合
月額19.99ドルで提供

ChatGPT Plusに対抗

ChatGPT Plusと同額で提供
Officeアプリと1TBストレージが付属
生産性アプリとのシームレスな連携が強み

職場利用も可能に

個人契約で職場のOfficeもAI対応
企業データは保護され安全性も確保

Microsoftは2025年10月1日、AIアシスタントCopilot Pro」と生産性スイート「Microsoft 365 Family」を統合した新サブスクリプションプラン「Microsoft 365 Premium」を発表しました。月額19.99ドルという価格は、競合するOpenAIの「ChatGPT Plus」と同額に設定。Officeアプリと高度なAI機能をバンドルすることで、個人の生産性向上市場での覇権を狙います。

この新プランは、個人事業主や高い生産性を求めるプロフェッショナルを主なターゲットとしています。WordやExcelなどのOfficeデスクトップアプリの利用権(最大6人)、1人あたり1TBのクラウドストレージに加え、GPT-4oによる画像生成などCopilot Proの全機能が含まれます。Microsoftは「競合と比較して否定できない価値がある」と自信を見せています。

月額19.99ドルという価格設定は、明らかにChatGPT Plusを意識したものです。OpenAIが汎用的なAI機能で先行する一方、Microsoftは「生産性は我々のDNAだ」と述べ、Officeアプリに深く統合されたAI体験を強みとしています。使い慣れたツール内でシームレスにAIを活用できる点が、最大の差別化要因となるでしょう。

特に注目すべきは、個人契約のAI機能を職場で利用できる仕組みです。個人としてM365 Premiumを契約していれば、職場のPCにインストールされたOfficeアプリでもAI機能が有効になります。企業のデータは個人のアカウントと分離され、セキュリティコンプライアンスは維持されるため、IT管理者も安心して導入を検討できます。

この新プランの導入に伴い、単体の「Copilot Pro」は新規販売が停止されます。Microsoftは、AI機能をOfficeスイートと一体化させる戦略を鮮明にしました。既存のPersonalおよびFamilyプラン加入者にも一部のAI機能が解放されるなど、同社のサブスクリプション体系は、AIを核として大きく再編されつつあります。

Meta、AIとの会話データを広告に活用へ

AIデータ活用の新方針

AIとの会話内容を広告に利用
12月16日からポリシー改定
ユーザーによる拒否は不可

対象となるデータとサービス

チャットボットとの会話履歴
FacebookInstagramで反映

プライバシーへの配慮と例外

EU・英国韓国適用除外
センシティブな話題は利用対象外

Metaは、傘下のAIアシスタントとの会話データをターゲティング広告に利用する方針を明らかにしました。2025年12月16日からプライバシーポリシーを改定し、FacebookInstagramのユーザーに対し、よりパーソナライズされた広告コンテンツを提供します。この動きは、巨大IT企業によるAI製品の収益化競争が新たな段階に入ったことを示唆しています。

具体的には、ユーザーがMeta AIと「ハイキング」について話した場合、ハイキング用品の広告が表示されるようになります。このデータ活用はチャットボットとの会話だけでなく、Ray-Ban MetaスマートグラスでAIが分析した音声画像データ、AI画像生成ツール「Imagine」での操作なども対象となり、ユーザーの行動が多角的に分析されます。

ユーザーにとって重要なのは、このデータ利用を拒否(オプトアウト)できない点です。Metaの各種サービスで同一アカウントにログインしている場合、例えばWhatsAppでのAIとの会話がInstagram広告に影響を与える可能性があります。ユーザーに許されているのは、既存の広告設定メニューから表示される広告の好みを調整することのみです。

プライバシーへの配慮として、Metaは宗教的信条や政治的見解、健康状態といったセンシティブな情報に関する会話は広告に利用しないと説明しています。また、欧州連合(EU)、英国韓国では、現地の厳格なプライバシー規制のため、この新方針は当面適用されません。

Metaの狙いは明確です。中核事業である広告ビジネスを、AIから得られる新たなデータで強化することにあります。月間10億人以上が利用するMeta AIは、ユーザーの興味関心を深く知るための新たな情報の宝庫です。これまで無料で提供してきたAI製品を、広告という収益の柱に直結させる戦略です。

AI製品の収益化は業界全体の課題です。OpenAIChatGPT内での商品購入機能を発表し、GoogleがAI検索への広告導入を計画するなど、各社が模索を続けています。Metaの今回の動きは、データ活用による広告モデルという、同社の成功方程式をAI時代にも適用する明確な一手と言えるでしょう。

Google、AIでサウジ世界遺産をバーチャル体験

世界遺産をバーチャル探訪

ストリートビューで路地を散策
10以上の象徴的ランドマーク
15km以上の360度画像で再現
過去と現在の写真を比較鑑賞

AIが歴史を語りかける

AIによる音声ガイドツアー
建築や工芸の歴史を自動解説
貿易や巡礼での役割を紹介
家族で楽しむパズル機能

Googleはサウジアラビアのジェッダ歴史地区プログラムと提携し、ユネスコ世界遺産である同地区をバーチャルで体験できるオンライン展示をGoogle Arts & Cultureで公開しました。AIやストリートビューなどの最新技術を駆使し、世界中の人々が歴史的遺産の魅力に触れる機会を提供します。これは文化遺産の保存とデジタル技術の融合における画期的な事例です。

今回の目玉の一つが、ストリートビューによる没入型体験です。10以上の象徴的な場所と15km以上に及ぶ路地が360度画像でデジタル化されました。利用者は、かつて巡礼者が歩んだ道を辿ったり、17世紀のモスクを訪れたりするなど、まるで現地にいるかのような感覚で歴史地区を自由に散策できます。

特に注目すべきは、AIを活用した音声ガイド「トーキングツアー」です。利用者がバーチャル空間を移動すると、AIが建築様式の意義や、ジェッダが世界貿易や巡礼で果たした役割などを自動で解説します。文化体験に対話型の学習要素を取り入れた、新しい試みと言えるでしょう。

さらに、アーカイブ写真と現在の画像を比較できる「ポケットギャラリー」では、都市の変遷と修復の軌跡を視覚的に追体験できます。また、家族で楽しめる「パズルパーティー」機能も用意されており、ゲーミフィケーションを通じて文化遺産への関心を高める工夫が凝らされています。

このプロジェクトは、テクノロジーが文化遺産の保存と公開にどう貢献できるかを示す好例です。地理的な制約を超えて文化へのアクセスを民主化すると同時に、AIによる新たな付加価値創出の可能性も示唆しています。ビジネスリーダーやエンジニアにとっても、技術応用のヒントとなるでしょう。

AI動画は物理法則を理解したか?Google論文の検証

DeepMindの野心的な主張

Google Veo 3の能力を検証
ゼロショットでのタスク解決を主張
汎用的な視覚基盤モデルへの道筋

見えてきた性能の限界

一部タスクでは高い一貫性
ロボットの動作や画像処理で成功
全体としては一貫性に欠ける結果
「世界モデル」構築はまだ途上

Google DeepMindが、最新のAI動画モデル「Veo 3」が物理世界をどの程度理解できるかを探る研究論文を発表しました。論文では、Veo 3が訓練データにないタスクもこなす「世界モデル」への道を歩んでいると主張しますが、その結果は一貫性に欠け、真の物理世界のシミュレーション能力には依然として大きな課題があることを示唆しています。

研究者らは、Veo 3が明示的に学習していない多様なタスクを解決できる「ゼロショット学習者」であると主張します。これは、AIが未知の状況に対しても柔軟に対応できる能力を持つことを意味し、将来的に汎用的な視覚基盤モデルへと進化する可能性を示唆するものです。

確かに、一部のタスクでは目覚ましい成果を上げています。例えば、ロボットの手が瓶を開けたり、ボールを投げたり捕ったりする動作は、試行を通じて安定して説得力のある動画を生成できました。画像のノイズ除去や物体検出といった領域でも、ほぼ完璧に近い結果を示しています。

しかし、その評価には注意が必要です。外部の専門家は、研究者たちが現在のモデルの能力をやや楽観的に評価していると指摘します。多くのタスクにおいて結果は一貫性を欠いており、現在のAI動画モデルが、現実世界の複雑な物理法則を完全に理解していると結論付けるのは時期尚早と言えるでしょう。

経営者エンジニアにとって重要なのは、この技術の現状と限界を冷静に見極めることです。AI動画生成は強力なツールとなり得ますが、物理的な正確性が求められるシミュレーションロボット工学への応用には、まだ慎重な検証が必要です。

Google、AIで巨匠の作風を学び椅子をデザイン

AIとデザイナーの協業

Googleと著名デザイナーの協業
生成AIでデザインを試作
有機的な作風をAIが学習

独自モデルで創造性を拡張

独自スケッチでAIを訓練
言語化と対話で出力を調整
金属3Dプリンタで実物化
創造性を拡張する協業ツール

Google DeepMindは、世界的に著名なデザイナーであるロス・ラブグローブ氏と協業し、生成AIを用いてユニークな椅子をデザインしました。ラブグローブ氏独自のスケッチ群を学習データとし、画像生成モデルをファインチューニング。AIとの対話を通じて氏の作風を反映した新たなアイデアを生み出し、最終的に金属3Dプリンターで物理的なプロトタイプを制作しました。これはAIが創造的プロセスを支援する強力なツールとなり得ることを示す事例です。

プロジェクトの目的は、生成AIを用いてコンセプト作りから物理的な製品まで一貫してデザインを完遂することでした。題材に選ばれたのは、機能が固定されつつも形状の自由度が高い「椅子」。デザイナー独自のスタイルやニュアンスをAIがどこまで正確に捉え、表現できるかという、古典的かつ本質的なデザインの課題に挑戦しました。

開発チームは、ラブグローブ氏が厳選したスケッチの高品質なデータセットを作成。これをGoogleのテキスト画像生成モデル「Imagen」に学習させ、ファインチューニングを行いました。このプロセスにより、モデルはラブグローブ氏のデザイン言語の核となる特有の曲線や構造的論理、有機的なパターンを組み込み、氏の作風に根差した新しいコンセプトを生成できるようになったのです。

成功の鍵は、デザイナーとAIの「対話」にありました。チームは、氏のデザイン語彙を言語化し、AIへの指示(プロンプト)を工夫することで、出力の精度を高めました。例えば、あえて「椅子」という単語を使わず類義語で指示を出し、より多様な形状や機能の探求を促しました。この試行錯誤が、AIを単なるツールから共同制作者へと昇華させたのです。

AIとの協業プロセスを経て生み出された数々のコンセプトから、ラブグローブ氏のチームは最終的なデザインを選定。金属3Dプリンティング技術を用いて、AIが生成したデジタルデータを実物の椅子として作り上げました。ラブグローブ氏は「AIが、ユニークで並外れた何かをプロセスにもたらしうることを示している」と、この成果を高く評価しています。

この事例は、AIが人間の専門性や創造性を代替するのではなく、むしろ拡張するための強力なパートナーになり得ることを明確に示しています。自社の製品開発やサービス設計において、AIをいかに「協業相手」として活用するか経営者エンジニアにとって、その可能性を探る貴重なヒントとなるでしょう。

Google、賞金100万ドルのAI映画賞を発表

賞金100万ドルの大規模コンペ

優勝賞金は100万ドル(約1.5億円)
ドバイのサミットで2026年1月に授賞
テーマは「未来の再創造」など2種類

GoogleのAIツールが応募条件

Google AIツール(Gemini等)利用が必須
コンテンツ70%がAI生成であること
作品時間は7分から10分の短編映画
応募締切は2025年11月20日

Googleは2025年10月1日、世界最大級のクリエイターイベント「1 Billion Followers Summit」と共同で、優勝賞金100万ドル(約1.5億円)の「Global AI Film Award」を創設したと発表しました。このコンテストは、同社の生成AIモデル「Gemini」などを活用して制作された短編映画を世界中から募集し、AIによる創造性の新たな地平を切り拓くことを目指します。

今回のAI映画賞は、AIがクリエイターの強力なパートナーとなりつつある現状を象徴するものです。Googleは、AI技術がコンテンツ制作のハードルを下げ、誰もが映像作家になれる未来を見据えています。100万ドルという破格の賞金は、同社がAIクリエイティブ分野に寄せる大きな期待の表れと言えるでしょう。

応募作品には、いくつかの重要な条件があります。まず、作品の70%以上GoogleのAIツールで生成する必要があります。上映時間は7分から10分。テーマは「未来の再創造」または「知られざる物語」のいずれかを選択します。言語は不問ですが、英語字幕は必須です。締切は2025年11月20日となっています。

制作には、最新の動画生成モデル「Veo 3」や、より高度な制御が可能な映画制作ツール「Flow」、画像モデル「Nano Banana」など、GeminiファミリーのAIツールが活用できます。これらのツールは、キャラクターやシーン、スタイルを精緻にコントロールし、クリエイターのビジョンを忠実に映像化することを支援します。

このAI映画賞は、AIが単なる効率化ツールではなく、人間の創造性を拡張する新たな表現媒体であることを示す試金石となるでしょう。授賞式は2026年1月にドバイで開催されるサミットで行われます。今後、AIネイティブなクリエイターがどのような作品を生み出すのか、世界中から注目が集まります。

AIの電力危機、MITが示す技術的解決策

急増するAIの環境負荷

日本の総消費電力を上回る規模
需要増の60%を化石燃料に依存

ハード・ソフト両面の対策

GPU出力を抑える省エネ運用
アルゴリズム改善で計算量を削減
再生可能エネルギー利用の最適化

AIで気候変動を解決

AIによる再エネ導入の加速
プロジェクトの気候影響スコア化

マサチューセッツ工科大学(MIT)の研究者らが、急速に拡大する生成AIの環境負荷に対する具体的な解決策を提示しています。国際エネルギー機関(IEA)によると、データセンター電力需要は2030年までに倍増し、日本の総消費電力を上回る見込みです。この課題に対し、研究者らはハードウェアの効率運用、アルゴリズムの改善、AI自身を活用した気候変動対策など、多角的なアプローチを提唱しています。

AIの電力消費は、もはや看過できないレベルに達しつつあります。ゴールドマン・サックスの分析によれば、データセンター電力需要増の約60%が化石燃料で賄われ、世界の炭素排出量を約2.2億トン増加させると予測されています。これは、運用時の電力だけでなく、データセンター建設時に排出される「体現炭素」も考慮に入れる必要がある、と専門家は警鐘を鳴らします。

対策の第一歩は、ハードウェアの運用効率化です。MITの研究では、データセンターGPU画像処理半導体)の出力を通常の3割程度に抑えても、AIモデルの性能への影響は最小限であることが示されました。これにより消費電力を大幅に削減できます。また、モデルの学習精度が一定水準に達した時点で処理を停止するなど、運用の工夫が排出量削減に直結します。

ハードウェア以上に大きな効果が期待されるのが、アルゴリズムの改善です。MITのニール・トンプソン氏は、アルゴリズムの効率改善により、同じタスクをより少ない計算量で実行できる「Negaflop(ネガフロップ)」という概念を提唱。モデル構造の最適化により、計算効率は8~9ヶ月で倍増しており、これが最も重要な環境負荷削減策だと指摘しています。

エネルギー利用の最適化も鍵となります。太陽光や風力など、再生可能エネルギーの供給量が多い時間帯に計算処理を分散させることで、データセンターのカーボンフットプリントを削減できます。また、AIワークロードを柔軟に調整する「スマートデータセンター」構想や、余剰電力を蓄える長時間エネルギー貯蔵ユニットの活用も有効な戦略です。

興味深いことに、AI自身がこの問題の解決策となり得ます。例えば、AIを用いて再生可能エネルギー発電所の送電網への接続プロセスを高速化したり、太陽光・風力発電量を高精度に予測したりすることが可能です。AIは複雑なシステムの最適化を得意としており、クリーンエネルギー技術の開発・導入を加速させる強力なツールとなるでしょう。

生成AIの持続可能な発展のためには、こうした技術的対策に加え、企業、規制当局、研究機関が連携し、包括的に取り組むことが不可欠です。MITの研究者らは、AIプロジェクトの気候への影響を総合的に評価するフレームワークも開発しており、産官学の協力を通じて、技術革新と環境保全の両立を目指す必要があると結論付けています。

Copilotに顔、音声対話がより自然に

新機能「Portraits」

音声対話用のAIアバター
40種類の様式化された顔
自然な表情とリップシンク
一部地域で実験的に提供

背景と技術

ユーザーの要望に応え開発
1枚の画像から映像を生成
先進技術「VASA-1」を活用
安全性に配慮した段階的導入

Microsoftは、AIアシスタントCopilot」にアニメーション化された顔を表示する新機能「Portraits」を実験的に導入しました。米国英国、カナダの一部ユーザーを対象にCopilot Labsで提供されるこの機能は、音声対話中に利用者が選んだアバターが自然な表情で応答します。ユーザーからの「顔があった方が話しやすい」という声に応え、AIとのコミュニケーションをより自然で快適にすることを目指します。

「Portraits」では、40種類の中から好みの様式化されたアバターを選択できます。この機能の核となるのが、Microsoft Researchが開発した先進AI技術「VASA-1」です。この技術により、たった1枚の画像から、複雑な3Dモデリングなしでリアルタイムに自然な表情や頭の動き、口元の同期(リップシンク)を生成することが可能になりました。

この実験の背景には「音声で話すなら、顔があった方が安心する」というユーザーの声があります。テキストとは一線を画し、人間同士の会話に近い体験の提供が狙いです。以前の漫画風キャラクターとは異なり、より人間に近い外見のアバターを採用した点が大きな違いと言えるでしょう。

安全性にも細心の注意を払っています。アバターは意図的に非写実的なデザインとし、利用は18歳以上に限定。時間制限やAIとの対話であることの明示も徹底しています。他社チャットボット有害なやり取りが問題視されたことを踏まえた、慎重な対応と見られます。

X社の「Grok」をはじめ、競合他社もAIアバターの導入を進めており、AIとの対話インターフェースは新たな局面を迎えています。今回の「Portraits」の試みは、AIを単なるツールから、より親しみやすいパートナーへと進化させる一歩と言えるでしょう。この技術がビジネスシーンでどう活用されるか、今後の展開が注目されます。

Google検索AI、"雰囲気"で探す対話型ビジュアル検索

新機能の核心

言葉にできない"雰囲気"の検索
AIとの対話による絞り込み
画像アップロードでの検索開始

ショッピング体験の進化

フィルター不要の会話型商品検索
500億件超の製品情報を活用
小売サイトへのシームレスな連携

支える先進技術

最新AIGemini 2.5」を搭載
新技術'visual search fan-out'

Googleは2025年9月30日、同社の検索サービスに搭載された「AIモード」を大幅にアップデートし、対話型のビジュアル検索とショッピング機能を導入したと発表しました。ユーザーは言葉で表現しにくい曖昧なイメージや「雰囲気」を、AIとの対話を通じて検索できるようになります。この新機能は今週から米国で英語ユーザー向けに提供が開始されます。

今回のアップデートで、検索はより直感的になります。例えば、自室のインテリアについて「マキシマリストなデザイン」といった漠然としたアイデアを投げかけると、AIがその雰囲気に合う豊富な画像を提示。さらに「もっと暗い色調で」といった対話を通じて、理想のイメージへと絞り込んでいくことが可能です。

ショッピング体験も大きく変わります。従来のようにブランドやサイズといったフィルターを一つずつ設定する必要はありません。「あまりだぼっとしていないバレルジーンズ」のように話しかけるだけで、AIが最適な商品を提案します。これは、500億件以上の製品情報を網羅するGoogleのショッピンググラフが基盤となっています。

この革新的な検索体験を支えるのが、最新AIモデルGemini 2.5」の高度なマルチモーダル能力です。さらに、新技術「visual search fan-out」により、画像内の主要な被写体だけでなく、細かな背景や二次的な物体までAIが認識。文脈を深く理解し、より精度の高い検索結果を提供します。

今回のアップデートは、検索エンジンの役割を「情報の検索」から「アイデアの発見と具体化」へと進化させる大きな一歩と言えるでしょう。消費者行動の変化に対応し、ECサイトやデジタルマーケティングの在り方にも影響を与える可能性があります。日本での展開にも大きな注目が集まります。

アドビ、AI搭載「Premiere」をiPhoneで提供開始

AIで動画制作を革新

プロンプトBGMを自動生成
鼻歌からAIが効果音を作成
Fireflyで画像・ステッカー生成
生成AI機能はクレジット制(有料)

プロ級編集をモバイルで

4K HDR編集や自動字幕に対応
デスクトップ版への連携機能も搭載
基本機能は無料で利用可能
Android版は現在開発中

アドビは2025年9月30日、プロ向け動画編集アプリ「Premiere」のiPhone版を公開しました。モバイルでの編集を好む次世代クリエイターをターゲットに、生成AI機能を多数搭載したことが最大の特徴です。基本機能は無料で利用でき、AIを活用した高度な機能はクレジット購入で使用可能となります。Android版も現在開発中です。

新アプリの目玉は、アドビの生成AI「Firefly」を活用した機能群です。簡単な指示(プロンプト)でBGMを生成したり、ユーザーがハミングしたメロディをAIが効果音に変換したりできます。また、動画に使う画像やステッカーの生成、静止画をトランジション用の動画に変換することも可能です。

基本的な編集機能も充実しています。スマートフォンでの撮影に最適化されており、4K HDR編集、マルチトラックのタイムライン、自動キャプション生成、ノイズ除去などを無料で利用できます。アドビが提供するストック素材のライブラリにも無料でアクセスでき、手軽に高品質な動画制作が始められます。

外出先で撮影し、その場で編集を始められる点も魅力です。モバイルアプリで開始したプロジェクトは、Adobe Cloudを介してデスクトップ版のPremiereに転送し、より詳細な編集作業を引き継ぐことができます。ただし、現時点ではデスクトップからモバイルへの逆方向の転送には対応していません。

アドビは今回の投入で、ByteDance社の「CapCut」やMeta社の「Edits」などがひしめくモバイル動画編集市場での競争力を強化します。同社の製品ディレクターは「次世代のクリエイターはモバイルでの編集を好む」と語っており、ユーザーがいる場所でサービスを提供するという戦略を明確に示しています。

OpenAI、AIによる児童虐待コンテンツ対策を公表

技術とポリシーによる多層防御

学習データから有害コンテンツを排除
ハッシュ照合とAIでCSAMを常時監視
児童の性的搾取をポリシーで全面禁止
違反者はアカウントを即時追放

専門機関との連携と法整備

全違反事例を専門機関NCMECに通報
BAN回避を専門チームが監視
安全検証のための法整備を提言
業界横断での知見共有を推進

OpenAIは、AIモデルが児童性的搾取や虐待に悪用されるのを防ぐための包括的な対策を公表しました。安全なAGI開発というミッションに基づき、技術的な防止策、厳格な利用規約、専門機関との連携を三本柱としています。AI生成による児童性的虐待コンテンツ(CSAM)の生成・拡散を根絶するため、多層的な防御システムを構築・運用していると強調しています。

OpenAIの利用規約は、18歳未満の個人を対象としたいかなる搾取・危険行為も明確に禁止しています。これには、AI生成物を含むCSAMの作成、未成年者のグルーミング、不適切なコンテンツへの暴露などが含まれます。開発者に対しても同様のポリシーが適用され、違反者はサービスから永久に追放されます。

技術面では、まず学習データからCSAMを徹底的に排除し、モデルが有害な能力を獲得するのを未然に防ぎます。さらに、運用中のモデルでは、Thornなどの外部機関と連携したハッシュマッチング技術とAI分類器を活用。既知および未知のCSAMをリアルタイムで検出し、生成をブロックする体制を敷いています。

不正利用が検知された場合、OpenAIは迅速かつ厳格な措置を講じます。CSAMの生成やアップロードを試みたユーザーのアカウントは即座に停止され、全事例が米国の専門機関「全米行方不明・搾取児童センター(NCMEC)」に通報されます。これは、AIプラットフォームとしての社会的責任を果たすための重要なプロセスです。

近年、CSAM画像をアップロードしモデルに説明させる、あるいは架空の性的ロールプレイに誘導するといった、より巧妙な悪用手口も確認されています。OpenAIは、こうした文脈を理解する分類器や専門家によるレビューを組み合わせ、これらの新たな脅威にも対応していると説明しています。

一方で、対策の強化には課題も存在します。CSAMの所持・作成は米国法で違法とされているため、AIモデルの脆弱性を検証する「レッドチーミング」にCSAM自体を使えません。これにより、安全対策の十分なテストと検証に大きな困難が伴うのが実情です。

この課題を乗り越えるため、OpenAI法整備の重要性を訴えています。テクノロジー企業、法執行機関、支援団体が密に連携し、責任ある対策や報告を行えるような法的枠組みの構築を提言。ニューヨーク州の関連法案を支持するなど、具体的な行動も起こしています。

ChatGPT、子の安全を守る保護者機能と新システム

保護者による利用制限

ティーンのアカウントと連携
利用時間や機能を個別設定
自傷行為の兆候を親へ通知
保護者向けリソースページ開設

会話の自動安全化

有害な会話を自動検知
高精度モデルへ自動切替
安全な応答を生成する新機能
過保護との批判も、改善期間を設定

OpenAIは2025年9月29日、対話型AI「ChatGPT」に、保護者がティーンエイジャーの利用を管理する「ペアレンタルコントロール」と、有害な会話を検知して安全なモデルに切り替える「セーフティルーティングシステム」を導入しました。これは、過去にChatGPTがティーンエイジャーの自殺に関与したとされる訴訟などを受け、AIの安全性と倫理的責任を高めるための重要な一歩です。企業のリーダーや開発者は、AIのリスク管理における先進事例として注目すべきでしょう。

新たに導入されたペアレンタルコントロールでは、保護者が自身のアカウントとティーンのアカウントを連携させ、利用を細かく管理できます。利用できない時間帯の設定や、ボイスモード、画像生成、メモリ機能の無効化が可能です。また、システムが自傷行為の兆候を検知した場合、保護者に通知する機能も実装されました。

もう一つの柱が「セーフティルーティングシステム」です。ユーザーとの会話が感情的にデリケートな内容になった場合、それを自動検知し、より安全な応答ができる最新モデル「GPT-5-thinking」へ会話の途中で切り替えます。単に応答を拒否するのではなく、安全な形で応答を生成する新技術が活用されています。

今回の機能強化の背景には、AIがユーザーに与える精神的な影響への懸念があります。特に、過去にティーンエイジャーがChatGPTとの長期間の対話の末に自ら命を絶ったとして、遺族がOpenAIを提訴する事件が発生しました。AIプラットフォームを運営する企業として、ユーザー保護と社会的責任を果たすための具体的な対策が求められていたのです。

これらの安全機能は専門家から歓迎される一方、一部ユーザーからは「過保護すぎる」といった批判的な声も上がっています。OpenAIもシステムの完璧性を認めておらず、今後120日間の改善期間を設けフィードバックを反映させる方針です。安全性と利便性のバランスをいかに取るかが今後の課題となります。

生成AI、ハリウッド進出の野望と現実の壁

AI企業の積極的な売り込み

OpenAI長編映画制作を計画
Google等が巨額投資提携模索
著名監督とのコラボレーションも増加

スタジオが直面する課題

制作コスト削減への強い期待
映像品質や制御における技術的限界
学習データ不足でモデル性能に問題

深刻化する著作権と雇用問題

大手スタジオからの著作権侵害訴訟
クリエイター雇用喪失への深刻な懸念

OpenAIGoogleなどシリコンバレーの巨大テック企業が、生成AI技術を武器にハリウッドへの進出を加速させています。大手スタジオとの提携や著名監督との協業を通じて、映画制作の未来を担うとアピールしていますが、その道のりは平坦ではありません。映像品質といった技術的な限界に加え、著作権侵害やクリエイターの雇用喪失といった深刻な課題が山積しており、業界全体を巻き込む大きな議論となっています。

AI推進派は「アートの民主化」と「制作コストの劇的な削減」を掲げ、ハリウッドに積極的に働きかけています。OpenAIは自社で長編アニメ映画の制作を発表し、GoogleMetaはスタジオとの提携に数百万ドル規模の投資を提案。さらに、ジェームズ・キャメロン氏のような著名な映画監督もAI企業の取締役に就任するなど、その動きは業界全体に広がりを見せています。

一方、映画スタジオ側も高騰し続ける制作費の抑制策として、生成AIに大きな期待を寄せています。しかし、現実は期待通りには進んでいません。例えば、映画会社ライオンズゲートとAI企業Runwayの提携では、学習データ不足が原因で、実用レベルの映像を生成できずにいると報じられています。現在の技術では、品質の一貫性や細かな表現の制御が依然として困難なのです。

技術的な壁以上に深刻なのが、著作権侵害をめぐる法的な問題です。多くのAIモデルは、インターネット上の膨大なデータを学習していますが、その中には著作権で保護された映画や画像が無断で含まれていると指摘されています。実際に、ディズニーなどの大手スタジオがAI企業を相手取り訴訟を起こしており、この問題はAIの本格導入における最大の障壁の一つとなっています。

生成AIは、多くのクリエイターにとって自身の仕事を奪いかねない「実存的な脅威」と受け止められています。コンセプトアーティストや脚本家、俳優といった職種がAIに代替されるとの懸念は根強く、2023年の大規模ストライキの大きな要因にもなりました。スタジオ経営者にとってはコスト削減の切り札かもしれませんが、現場のアーティストにとっては深刻な雇用問題であり、両者の溝は埋まっていません。

結論として、生成AIのハリウッド進出は、誇大な宣伝とは裏腹に、技術、法務、雇用の各面で多くの課題を抱えています。これらの根本的な問題が解決されない限り、AIが映画制作の主流となるには、まだ長い時間が必要でしょう。経営者やリーダーは、技術の可能性を追求すると同時に、その限界と潜在的なビジネスリスクを冷静に見極める必要があります。

MSフォト、AIで面倒な画像整理を自動化へ

AIによる自動分類機能

Windows 11 Photosの新機能
Copilot+ PC Insiders向けにテスト
画像の視覚内容でAIが自動判別
英語以外の言語にも対応

生産性を高める整理術

レシートやメモを自動でフォルダ分け
散らばるスクリーンショットを一元管理
身分証明書など重要書類の発見が容易に
将来的なカスタムカテゴリ追加に期待

マイクロソフトが、Windows 11の標準アプリ「フォト」に、AIを活用した画像の自動分類機能をテスト導入しました。この新機能は、Copilot+ PCを利用するWindows Insider向けに提供が開始されており、写真ライブラリ内に散在する大量の画像から特定の種類を自動で検出し、整理することでユーザーの生産性向上を目指します。

新機能の最大の特徴は、AIが画像を自動で分類し、専用フォルダに振り分ける点です。現時点では、ビジネスシーンで頻繁に扱う「スクリーンショット」「レシート」「身分証明書」「手書きメモ」の4種類を認識します。これにより、これまで手作業で行っていた面倒な整理作業が大幅に効率化されることが期待されます。

この分類は、画像内のテキストではなく、視覚的な内容に基づいて行われます。そのため、例えばハンガリー語で書かれたパスポートの写真であっても、AIはそれを「身分証明書」として正しく認識し、該当フォルダに振り分けます。言語の壁を越えて機能する点が、この技術の強みと言えるでしょう。

自動で作成されたフォルダは、「フォト」アプリの左側にあるナビゲーションバーの「カテゴリ」セクションから簡単にアクセスできます。ユーザーは直感的な操作で、必要な画像を素早く見つけ出すことが可能になります。煩雑な画像管理から解放され、本来の業務に集中できる環境が整いつつあります。

現状では4つのカテゴリに限定されていますが、この技術の応用範囲は広いと考えられます。将来的には、ユーザーが「製品写真」や「会議のホワイトボード」など、独自のカテゴリを指定できるようになれば、さらに強力な業務効率化ツールへと進化する可能性があります。マイクロソフトの今後の展開から目が離せません。

Meta、AI動画の新フィード『Vibes』を開始

AI動画の発見と創作

AI生成の短尺動画専用フィード
クリエイター作品からの着想を促進
プロンプト表示で制作過程を可視化

リミックスとSNS連携

音楽画像・アニメーションの変更機能
Instagram等への簡単クロス投稿
MetaのAIエコシステム拡大戦略

Metaは9月26日、AIが生成した短尺動画を発見・共有するための新フィード「Vibes」を、Meta AIアプリ内で公開しました。この機能は、クリエイターやコミュニティが作成したAI動画をユーザーがリミックス(再編集)し、新たな創作活動を促すことを目的としています。

「Vibes」は、以前ユーザーがAIとの対話やプロンプトを共有していた「Discover」フィードに代わるものです。テキスト中心の共有から、動画コンテンツの創作と発見に焦点を移したことは、MetaのAI戦略における重要な転換点と言えるでしょう。

フィード上の動画には、生成に使用されたプロンプトが併記されており、ユーザーは制作の裏側を覗くことができます。さらに、音楽画像、アニメーションを変更する「リミックス機能」を活用し、独自の作品をVibesやInstagramFacebookに手軽にクロス投稿できます。

この動きは、Metaが全社的に進めるAI機能統合の一環です。同社はFacebookInstagramなど主力製品にAI画像生成機能を組み込むほか、先日には画像生成AIの有力企業Midjourneyとの提携も発表しました。MetaはAIによるコンテンツ制作エコシステムの構築を加速させています。

AI、衛星画像で絶滅危惧ハリネズミを救う

AIによる生息地予測

ハリネズミ自体でなく茂みを特定
衛星画像とAIで生息地をマッピング
広範囲の継続的な調査が可能に

保全活動への貢献

激減するハリネズミ個体群の保護
高コストな従来手法の課題を克服
保全計画立案への貢献に大きな期待

活用される技術

シンプルな機械学習モデルを活用
衛星と市民科学データを組み合わせ

英国ケンブリッジ大学の研究チームが、AIと衛星画像を駆使して絶滅危惧種のハリネズミの生息地を特定する画期的な手法を開発しました。このアプローチは、ハリネズミを直接探すのではなく、彼らがシェルターとして好む「キイチゴの茂み」を宇宙から発見するというもの。広域調査の効率を飛躍的に高め、野生動物の保全活動に新たな道を開く可能性があります。

欧州のハリネズミは、過去10年間で個体数が30~50%も減少しており、保全が急務とされています。しかし、夜行性である彼らの生態調査は、多大な労力とコストがかかるのが実情でした。従来の夜間フィールドワークや市民からの目撃情報に頼る手法では、全国規模での正確な生息地把握には限界があったのです。

今回の新手法では、研究者ガブリエル・マーラー氏らが構築したAIモデルが、欧州宇宙機関(ESA)の衛星画像を解析します。ハリネズミが巣作りや捕食者からの避難場所として利用するキイチゴの茂みの特徴を学習させ、潜在的な生息地を地図上にマッピング。これにより、地上調査を大幅に効率化できると期待されています。

このAIモデルは、ChatGPTのような大規模言語モデルではなく、ロジスティック回帰やk-近傍法といった比較的シンプルな機械学習技術に基づいています。衛星画像データに加え、市民科学プラットフォーム「iNaturalist」から得られる地上での観測データを組み合わせることで、モデルの精度を高めている点も特徴です。

この研究は、AIとリモートセンシング技術が生態系保全に大きく貢献できることを示しています。衛星から特定の植生を特定する技術は、他の野生動物の生息地調査にも応用可能です。保全活動家にとって、広大なエリアの環境を継続的に評価するための強力なツールとなり、より効果的な保護計画の策定につながるでしょう。

MIT、対話型AI「MultiverSeg」開発 医療研究を加速

マサチューセッツ工科大学(MIT)の研究者が、医療画像のセグメンテーション(領域分割)作業を劇的に効率化する新しい対話型AIシステム「MultiverSeg」を開発しました。このシステムは、ユーザーが画像上で行うクリックや走り書きなどの簡単な操作から学習します。作業を繰り返すほどAIの精度が向上し、最終的にはユーザーの操作なしで高精度なセグメンテーションが可能になり、臨床研究の加速やコスト削減が期待されます。 MultiverSegの最大の特徴は、ユーザーの操作を学習し続ける点にあります。従来の対話型ツールでは画像ごとに同じ操作を繰り返す必要がありましたが、本システムは過去の作業結果を「コンテキストセット」として記憶・参照します。これにより、新しい画像を処理する際のユーザーの負担が徐々に軽減され、作業効率が飛躍的に向上します。この仕組みは、これまでのアプローチの長所を組み合わせたものです。 性能比較実験では、他の最先端ツールを上回る結果を示しました。例えば、9枚目の画像を処理する頃には、わずか2回のクリックでタスク特化型モデルより高い精度を達成しました。X線画像のような特定のケースでは、1〜2枚の画像を手動で処理するだけで、AIが自律的に高精度な予測を行えるようになります。これは、手作業に比べ圧倒的な時間短縮です。 このツールのもう一つの利点は、機械学習の専門知識や事前のデータセット準備が不要なことです。研究者や医師は、セグメンテーションしたい新しい画像をアップロードし、直感的に操作を始めるだけですぐに利用できます。AIモデルの再トレーニングも不要なため、導入のハードルが低く、幅広い臨床現場や研究での活用が見込まれます。 研究チームは今後、臨床現場での実証実験を通じてフィードバックを収集し、システムの改善を進める計画です。また、現在は2D画像のみに対応していますが、将来的には3D医用画像への応用も目指しています。この技術が普及すれば、新しい治療法の研究が加速し、臨床試験や医療研究全体のコスト削減に大きく貢献する可能性があります。

MIT、新素材発見AIを開発 燃料電池で記録的性能を達成

マサチューセッツ工科大学(MIT)が、新素材発見のプロセスを根本から変える可能性を秘めたAIプラットフォーム「CRESt」を開発しました。このシステムは、科学論文から実験データ、画像まで多様な情報を統合し、ロボットと連携して自律的に実験を進めます。研究開発のあり方を大きく変革する一歩となるでしょうか。 CREStはすでに具体的な成果を上げています。研究チームはCREStを用いて900以上の化学組成を探索し、3500回の電気化学試験を実施。その結果、ギ酸塩燃料電池において記録的な出力密度を達成する触媒材料を発見しました。高価な貴金属の使用量を4分の1に抑えつつ、性能を大幅に向上させることに成功しています。 CREStの最大の特徴は、多様な情報源(マルチモーダル)を扱える点です。従来のAIが特定のデータのみに依存していたのに対し、CREStは論文のテキスト、化学組成、顕微鏡画像などを統合的に学習します。これにより、人間の科学者が持つような幅広い知見に基づいた、より高度な判断を可能にしました。 研究者はコーディング不要で、自然言語(チャット)を使ってCREStに指示を出せます。指示を受けたCREStは、液体処理ロボットや材料合成装置、自動試験装置などを駆使して実験を遂行。実験結果は再びAIにフィードバックされ、次の実験計画が最適化されるというサイクルが自動で構築されます。 材料科学の実験では、再現性の確保が大きな課題でした。CREStはカメラと画像認識モデルを用いて実験プロセスを常時監視します。ピペットの位置ずれやサンプルの形状異常といった問題を検知し、人間に対して修正案を提案することで、実験の品質と一貫性を高めることにも貢献します。 研究チームは、CREStを「人間の研究者に取って代わるものではなく、アシスタントである」と位置づけています。AIが仮説立案や実験の自動化を担う一方で、最終的な判断やデバッグは人間が主導します。人間とAIの協働による、より柔軟で効率的な「自律駆動型ラボ」の実現に向けた大きな一歩と言えるでしょう。

MS、Windows MLを正式公開。AIアプリ開発を加速へ

マイクロソフトは9月25日、開発者がAI機能をWindowsアプリに容易に組み込めるプラットフォーム「Windows ML」を正式公開しました。これにより、応答性が高く、プライバシーに配慮し、コスト効率の良いAI体験の構築を支援します。Windows 11 24H2以降で利用可能で、PCのCPUやGPU、NPUを最適に活用します。AdobeやMcAfeeなどのソフトウェア企業が既に対応を進めています。 Windows MLは、PC搭載のCPU、GPU、NPU(Neural Processing Unit)を最適に使い分ける「ハードウェア抽象化レイヤー」として機能します。AIの処理内容に応じて最適なハードウェアを自動で割り当てるため、開発者はアプリケーションの性能を最大限引き出せます。これにより、複雑なハードウェア管理から解放されるのです。 既にAdobe、McAfee、Topaz Labsといった大手ソフトウェア企業が、開発段階からWindows MLの採用を進めています。各社は今後リリースする製品に、同プラットフォームを活用したAI機能を搭載する計画です。Windowsエコシステム全体でのAI活用の加速が期待されます。 具体的な活用例として、Adobeは動画編集ソフトでNPUを使い高速なシーン検出を実現します。McAfeeはSNS上のディープフェイク動画や詐欺の自動検出に活用。Topaz Labsも画像編集ソフトのAI機能開発に利用しており、応用分野は多岐にわたります。 マイクロソフトWindows MLを通じて、WindowsアプリへのAI実装を効率化し、OS自体の魅力を高める狙いです。ローカルでのAI処理は応答速度やプライバシー保護、コスト削減に繋がります。今後、同様のAI体験を提供するアプリの増加が見込まれます。

Meta、OpenAIから研究者獲得 超知能開発を加速

Metaは2025年9月、AI開発競争の激化を背景に、OpenAIの著名な研究者ヤン・ソン氏を「Meta Superintelligence Labs」の研究責任者として採用しました。この動きは、マーク・ザッカーバーグCEOが今夏から進める人材獲得攻勢の一環です。ソン氏は、OpenAI出身のシェンジア・ジャオ氏の直属となり、超知能開発を加速させる狙いがあります。AI分野におけるトップ人材の獲得競争が、さらに激しさを増していることを示しています。 ソン氏はOpenAIで戦略的探査チームを率いていました。スタンフォード大学の博士課程在学中には、OpenAI画像生成モデル「DALL-E 2」の開発に貢献した画期的な技術を開発した実績を持ちます。彼の専門知識は、大規模で複雑なデータセットを処理するモデルの能力向上に貢献すると期待されています。 今回の採用は、ザッカーバーグCEOが今夏に開始した大規模な人材獲得攻勢の一環です。MetaOpenAIGoogleAnthropicなどから、これまでに少なくとも11人のトップクラスの研究者を引き入れています。CEO自らが主導し、AI開発体制の強化を急いでいることがうかがえるでしょう。 ソン氏が所属する研究所は、同じくOpenAI出身のシェンジア・ジャオ氏が7月から率いています。ジャオ氏はChatGPTGPT-4の開発にも携わった人物で、MetaOpenAIからの人材を中核に据えて開発を進めていることが鮮明になっています。AIの最先端を走る人材の獲得は、企業の競争力を左右する重要な要素です。 一方で、Metaの超知能研究所からは、設立発表後に少数の研究者が離脱する動きも見られます。一部は古巣のOpenAIに戻るなど、トップ人材の流動性は非常に高まっています。企業は優秀な人材を惹きつけ、維持し続けることが大きな課題となっているのです。

Googleフォト、対話型AI編集で誰でもプロ級の写真加工

Googleは、写真編集アプリ「Googleフォト」に新たな対話型AI編集機能「Ask Photos」を導入しました。Pixel 10スマートフォンで先行搭載され、対応するAndroid端末にも展開されます。この機能を使えば、メニューやスライダーを操作することなく、音声やテキストで指示するだけで直感的な写真編集が可能です。 使い方は極めてシンプルです。「背景のゴミを消して」「もっと明るくして」といった自然な言葉で指示するだけで、AIが意図を汲み取って編集を実行します。これまで専門的な編集ソフトで数分かかっていた作業が、わずか数秒で完了します。写真編集のハードルを劇的に下げる機能と言えるでしょう。 Adobe Photoshopのような高機能ソフトは、高価な上に専門知識を必要としました。しかし、この新機能は誰でも手軽に利用できます。カーネギーメロン大学の専門家は、ChatGPTのような一部のAIが目新しさで終わるのに対し、この機能は多くの消費者にとって実用的な価値を持つと指摘しています。 スマートフォンの小さな画面でのスライダー操作は、精密な調整が難しいという課題がありました。対話型インターフェースは、この煩わしさからユーザーを解放します。「もっと良くして」といった曖昧な指示でも、AIが写真の構図や明るさを適切に調整してくれるため、編集作業がより身近になります。 現状では、被写体をフレーム内で移動させたり、特定の部分だけを細かく調整したりすることはできません。例えば、顔のハイライトだけを抑えようとすると、画像全体のハイライトが変更されてしまうことがあります。より精緻な編集機能の実現が今後の課題です。 生成AIによる簡単な画像加工は、偽情報拡散のリスクもはらみます。Googleはこの問題に対処するため、編集された画像にC2PA(コンテンツ来歴と真正性のための連合)の認証情報や、電子透かし技術「SynthID」を付与。これにより、画像がAIによって編集されたことを追跡可能にしています。 専門家は、この機能がコンピューターとの関わり方を変える大きな一歩だと見ています。これまでのコンピューターは人間が操作する「道具」でした。しかし、対話を通じて人間の意図を理解し実行するAIは、コンピューターを「パートナー」へと昇華させる可能性を秘めています。

AWS、生成AIで給付金請求処理を自動化・高速化

アマゾン ウェブ サービス(AWS)は2025年9月25日、生成AIサービス「Amazon Bedrock Data Automation」を活用し、企業の給付金請求処理を自動化・高速化するソリューションを発表しました。この仕組みは、従来の手作業に依存しがちだった処理の遅延や入力エラー、高い管理コストといった課題を解決します。これにより、企業は業務効率を大幅に向上させ、従業員や顧客の満足度を高めることが可能になります。 多くの企業では、給付金請求処理が旧式のシステムや手作業に依存しており、これが業務のボトルネックとなっています。申請書類の不備や診断コードの欠落は、差し戻しや再作業を頻発させ、従業員と医療機関の双方に不満を生じさせていました。また、不正請求の検知や、複雑な規制への対応も大きな負担となり、運営コストを押し上げる要因でした。 こうした課題に対し、生成AIが有効な解決策となります。AWSの「Amazon Bedrock Data Automation」は、文書や画像といった非構造化データから高精度で情報を抽出し、分類することが可能です。これにより、手作業によるミスを減らし、処理時間を短縮します。自然言語処理能力を活用して、担当者のメモなども解釈し、規制遵守を支援します。 今回発表されたソリューションは「取り込み」「抽出」「検証」「統合」の4段階で構成されます。申請者がポータル経由でアップロードした書類画像は、まずAmazon S3に保存されます。次に、Bedrock Data Automationが書類の種類を自動で識別し、必要な情報を抽出。その後、業務ルールと照合して申請を検証し、最終的に承認・否認の判断を下します。 この自動化の鍵は「Blueprint」と「Knowledge Bases for Amazon Bedrock」です。Blueprintは文書の種類ごとに抽出項目を定義した設計図の役割を担います。一方、Knowledge Basesは業務手順書を取り込み、AIがビジネスルールを理解するための知識源となります。これに基づき、AIが自動で承認・否認を判断するのです。 このソリューションの大きな利点の一つは、ビジネスルールの管理が容易になることです。従来、ルールの変更にはコードの修正が必要で、時間と開発コストがかかりました。しかし、本ソリューションでは、業務手順書を更新するだけでAIの判断基準を変更できます。これにより、市場や規制の変化に迅速に対応できる俊敏な組織運営が可能になります。 本ソリューションを導入することで、企業は請求処理の効率を飛躍的に高められます。手作業を削減し、より迅速で正確な処理を実現するだけでなく、AIによる高度な分析で不正請求のパターンを検知することも可能です。これにより、コストを最適化し、従業員や提携先との信頼関係を強化し、競争力のある福利厚生制度の提供につながるでしょう。

Google、AIムードボード「Mixboard」公開 テキストでアイデア創出

Googleは9月24日、AIを活用したムードボード作成アプリ「Mixboard」のパブリックベータ版を米国で公開しました。このサービスは、テキスト指示だけでAIがアイデアを画像化し、ムードボードを作成できるのが特徴です。Pinterestなどの競合サービスと異なり、利用者は既存の画像コレクションを必要とせず、創造的なアイデア出しを手軽に始められます。 Mixboardの最大の特徴は、テキストプロンプトを入力するだけでAIがアイデアを具現化してくれる点です。利用者は手持ちの画像がなくても、ゼロからプロジェクトを開始できます。創造性を刺激するためのテンプレートも用意されており、誰でも手軽にムードボード作りを始められる設計になっています。どのようなアイデアを形にできるでしょうか。 このアプリの中核を担うのは、Googleの最新画像編集モデル「Nano Banana」です。このモデルは、複雑な編集指示を理解し、リアルな画像を生成する能力に優れています。先に公開され人気を博したAIアプリ「Gemini」の成功を支えたのもこの技術であり、その性能の高さが証明されています。 Mixboardは、Pinterestのコラージュ機能と直接競合します。しかし、Pinterestが利用者のピン留めした画像などを使うのに対し、MixboardはAIによる画像生成を起点とします。これにより、まだ形になっていない漠然としたアイデアを探求するプロセスを強力にサポートできるのが強みです。 GoogleはMixboardの用途として、インテリアデザインの考案、イベントテーマのブレインストーミング、DIYプロジェクトのアイデア出しなどを挙げています。画像とテキストを組み合わせて、多角的な視点からアイデアを練ることが可能で、ビジネスや個人の創造活動に大きく貢献することが期待されます。 デジタルムードボードは、特に若年層の間で人気が高まっています。Pinterestのコラージュアプリ「Shuffles」がTikTokでバイラルヒットした例もあります。Mixboardは、こうした市場の需要に応え、AI技術でクリエイティブな表現を支援する新たなツールとして注目されます。 Mixboardは現在、米国の利用者を対象にGoogle Labsでパブリックベータ版として提供されています。利用者は生成した画像を再生成して新たなアイデアを得たり、ボードの内容からAIにテキストを生成させたりすることもできます。フィードバック用のDiscordコミュニティも開設されています。

Google、月額5ドルのAIプランを新興国40カ国超に拡大

Googleは9月24日、月額約5ドルの安価なAIサブスクリプションプラン「AI Plus」を、インドネシアやメキシコなど40カ国以上で提供開始しました。標準プランが高価な新興国市場で有料ユーザーを獲得し、先行するOpenAIに対抗する狙いです。この動きは、世界のAIサービス市場の勢力図に影響を与える可能性があります。 このプランでは、最新AIモデル「Gemini 2.5 Pro」へのアクセスが可能です。加えて、画像生成ツール「Flow」や動画生成ツール「Veo 3 Fast」など、クリエイティブな作業を支援する機能も含まれます。GmailやDocsといったGoogleの各種アプリ内でもAI機能が使えるようになり、業務効率の向上が期待できます。 さらに、AIリサーチアシスタントNotebookLM」の拡張機能や、200GBのクラウドストレージも提供されます。専門的な情報収集や資料作成、データ保管といったビジネスシーンでの実用性を高めており、コストパフォーマンスに優れたサービス内容となっています。 この動きの背景には、OpenAIとの激しい顧客獲得競争があります。OpenAIインドネシアなどで月額5ドル未満の「ChatGPT Go」を展開済みです。月額20ドルの標準プランが浸透しにくい市場で、両社は低価格戦略を加速させ、次なる巨大市場の主導権を争っています。 月額料金は多くの国で約5ドルに設定されていますが、ネパールやメキシコなど一部地域では、最初の6ヶ月間は50%割引が適用されます。巨大IT企業による価格競争は、今後さらに多くの地域で高機能なAIツールの普及を後押しすることになるでしょう。

Google、AIでデザイン案を探る新ツール「Mixboard」発表

Googleが2025年9月23日、テキストや画像からデザインの方向性を示すムードボードを生成する実験的AIツール「Mixboard」を発表しました。同社の研究部門Google Labsが開発したもので、デザインの初期段階におけるアイデア出しを支援します。米国で公開ベータ版として提供が開始されました。 ユーザーは「メンフィス風の食器」や「リビングでの秋のパーティー企画」といった自然言語の指示(プロンプト)を入力するだけで、関連する画像をAIに生成させることができます。自身の画像をアップロードして、それを基に新たなビジュアルを作成することも可能で、直感的なアイデア探求を実現します。 Mixboardの強みは、自然言語による柔軟な編集機能にあります。生成されたボードに対し、「画像を結合して」といった指示で修正を加えたり、「再生成」や「似た画像を生成」といったワンクリック操作で素早くアイデアを派生させたりすることができます。これにより、試行錯誤のプロセスが大幅に効率化されるでしょう。 このツールは、Googleの最新AIモデル「Gemini 2.5 Flash」と、新しい画像編集モデル「Nano Banana」を基盤としています。これらの技術により、テキストや画像の文脈を深く理解し、ユーザーの意図に沿った高精度なビジュアル生成が可能になっています。 デザイン支援ツール市場では、Figmaの「FigJam」やAdobeの「Firefly Boards」などが存在します。Googleがこの分野に参入したことは、生成AIを活用したクリエイティブ支援ツールの開発競争がさらに激化することを示唆しています。 Mixboardは現在、米国で公開ベータ版として提供されています。Googleは、このツールを通じて、専門家でなくても誰もがAIを使って創造的なアイデアを簡単に探求できる世界の実現を目指すとしています。

Google、メキシコ進出20周年 AI投資加速で事業強化へ

Googleは2025年9月23日、メキシコ進出20周年を記念し、首都メキシコシティでAI分野への投資拡大と新サービスを発表しました。教育、社会課題解決、新製品投入を柱に同国での事業を強化します。現地では国民の89%がGoogleを肯定的に評価しており、AIによるさらなる貢献が期待されます。 人材育成のため、学生に「Google AI Pro」を1年間無料で提供します。また、教員向けAI研修には200万ドルを追加拠出しプログラムを拡大。さらに、中小企業10万社を対象に、マーケティングや財務管理へのAI活用を学ぶ無料研修も開始します。 メキシコの社会課題解決にもAI技術を応用します。モンテレイ市ではAIで交通信号を最適化し渋滞を緩和する「Project Green Light」を導入。また、国家機関と協力し、衛星画像から洪水を最大7日前に予測するAIモデルの活用を進めます。 消費者向けに、最新AI検索「AIモード」をスペイン語で提供開始します。翻訳アプリもGeminiモデルで強化し、リアルタイム会話や言語学習機能を向上。さらにスマートフォン「Google Pixel」をラテンアメリカで初めて同国に投入します。 事業拡大の証として、首都メキシコシティに新オフィスを開設予定です。20年前にラテンアメリカ初のスペイン語圏拠点として進出して以来、一貫して成長しており、今後も現地のイノベーション創出と人材活用に注力する方針です。

Google、AI Plusプランを40カ国に追加、新興国市場へ展開加速

Googleは9月23日、AIサブスクリプションプラン「AI Plus」の提供国を新たに40カ国拡大したと発表しました。インドネシアでの先行導入が好評だったことを受け、より手頃な価格で高度なAIツールを世界中に提供する狙いです。対象はアジア、アフリカ、中南米の新興国が中心で、グローバルな利用者層の拡大を目指します。 「AI Plus」プランでは、Geminiアプリでの画像生成・編集や動画生成モデル「Veo 3 Fast」の利用上限が引き上げられます。さらに、Gmail、Docs、Sheetsといった主要な生産性ツールにGeminiが統合され、業務効率の大幅な向上が期待できるでしょう。ビジネスの現場でAIをどう活用できるか、試金石となりそうです。 このプランには、AI搭載のデジタルノート「NotebookLM」の利用上限拡大や、Googleフォト、ドライブ、Gmailで使える200GBのストレージも含まれます。また、これらの特典は最大5人の家族と共有可能で、個人利用だけでなく小規模なチームでの活用も視野に入ります。 新たに追加されたのは、ベトナム、フィリピン、ナイジェリア、メキシコ、ウクライナなど40カ国です。Googleは、価格を各国の市場に合わせて設定することで、新興国市場でのAIサービスの普及を加速させる戦略です。手頃な価格設定が、新たなビジネスチャンスを生むかもしれません。

Google検索AIモード、スペイン語対応で世界展開を完了

Googleは2025年9月23日、検索サービスに統合された対話型AI「AIモード」を、世界中のスペイン語話者向けに提供開始したと発表しました。これにより利用者は、自然言語での質問や対話形式での情報検索画像のアップロードなどが可能になります。今回の拡大は8月の180カ国への展開に続くもので、多言語対応を加速させ、グローバル市場での利用者基盤を強化する狙いです。 AIモードは、従来のキーワード検索とは一線を画す対話型の検索体験を提供します。利用者は自然な文章で複雑な質問を投げかけ、AIと対話を重ねながら情報を深掘りできます。画像のアップロードにも対応しており、より直感的な情報収集が可能になることで、ユーザーの検索効率は飛躍的に向上するでしょう。 GoogleはAIモードのグローバル展開を急速に進めています。今回のスペイン語対応は、8月に米国英国などに加え180カ国へ提供範囲を広げたことに続く動きです。既に日本語、韓国語、ヒンディー語などにも対応しており、世界中の多様な言語圏でAI検索の主導権を握るという同社の強い意志がうかがえます。 今回の発表は、Google全体のAI戦略の一環です。同社は検索だけでなく、Android端末での会話型写真編集機能や、より安価なAIサブスクリプションプラン「AI Plus」の提供国拡大も同時に発表しました。製品群全体でAI統合を加速させ、ユーザーの日常生活に深く浸透させる戦略です。 AI分野では、OpenAIとの競争が激化しています。OpenAIインドネシアなどで低価格プラン「ChatGPT Go」を展開する中、Googleも「AI Plus」で対抗しています。主要な言語市場への迅速な対応は、生成AIサービスの競争において利用者獲得の重要な鍵となるでしょう。 なお、GoogleのAI機能には注意が必要です。検索結果上部にAI要約を表示する「AI Overview」と、今回対象の「AIモード」は別の機能です。AIモードは、対話AI「Gemini」と直接チャットする没入型の体験であり、より能動的な情報探索を目的としています。

Googleフォト、対話型AI編集を全Androidユーザーに拡大

Googleは2025年9月23日、米国Googleフォトの対話型AI編集機能を対象の全Androidユーザーに展開開始しました。音声やテキストで指示するだけで、同社のAI「Gemini」が写真を自動で編集します。これにより、専門知識がなくても高度な写真編集が可能となり、クリエイティブな表現の幅が広がります。 この新機能は、アプリ内の「Help me edit」ボタンから利用できます。ユーザーは編集ツールやスライダーを直接操作する必要がありません。代わりに「もっと明るくして」「背景の人を消して」といった自然な言葉で指示を出すだけで、AIが意図を汲み取り、写真を編集します。 この機能は、Googleの高性能AIモデル「Gemini」の能力を活用しています。当初は最新スマートフォン「Pixel 10」の利用者向けに限定公開されていましたが、今回、対象機種が大幅に拡大されました。これにより、より多くのユーザーが最先端のAI技術を手軽に体験できます。 簡単な明るさ調整や不要物の除去はもちろん、古い写真の修復といった高度な編集も可能です。さらに「ペットのアルパカをハワイのワイキキに移動させて」のような、現実にはない創造的な画像生成にも対応し、写真編集の楽しみを広げます。 一度の指示で終わりではありません。AIによる編集結果に対して「もう少しこうして」といった追加の指示を出すことで、対話しながら微調整を重ね、理想の仕上がりに近づけることができます。「make it better(もっと良くして)」といった曖昧な指示から始めることも可能です。 現在の提供対象は、米国在住で18歳以上のユーザーに限定され、言語は英語のみです。また、GoogleはAIで生成・編集された画像であることを示す技術標準「C2PA」にも対応しており、コンテンツの信頼性確保にも配慮しています。

OpenAI、インドネシアで廉価版ChatGPT投入、Google追撃

OpenAIは、インドネシアで廉価版サブスクリプションプラン「ChatGPT Go」を開始しました。料金は月額75,000ルピア(約4.50ドル)です。8月に開始したインド市場での成功を受け、新興国への展開を加速します。この動きは、同市場で先行する米Googleの類似プランに対抗するもので、生成AIの顧客基盤拡大を狙います。 ChatGPT Goプランは、無料版と月額20ドルの「Plus」プランの中間に位置します。無料版の10倍の利用上限が設定され、質問やプロンプトの送信、画像生成、ファイルアップロードがより多く利用できます。また、過去の会話を記憶する能力が向上し、ユーザーごとに最適化された応答が期待できます。 先行して同プランを導入したインドでは、有料購読者数が2倍以上に増加したといいます。価格を抑えたプランが新興市場のユーザー獲得に有効であることを証明したかたちです。この成功が、今回のインドネシアへの迅速な展開につながったのでしょう。各市場の特性に合わせた価格戦略の重要性を示唆しています。 この動きは、競合するGoogleへの直接的な対抗策です。Googleは今月初め、インドネシアで同様の価格帯の「AI Plus」プランを先行して発表しました。同プランでは、高性能な「Gemini 2.5 Pro」や画像動画生成ツール、200GBのクラウドストレージなどを提供しており、競争は激化しています。 AI大手が新興国で廉価版プランの投入を急ぐ背景には、将来の巨大市場での主導権争いがあります。一度ユーザー基盤を確立すれば、長期的な収益源となるためです。日本企業も、海外市場へAIサービスを展開する際には、現地の経済状況に合わせた価格設定と競合の動向を分析することが成功の鍵となるでしょう。

AGIの知能は測れるか?新指標「ARC」がAIの課題を映し出す

OpenAIDeepMindなどの主要AIラボは、数年内にAGIが実現するとの見方を示しています。AGIの登場は経済や科学に計り知れない影響を及ぼす可能性があります。そのため、技術の進捗を客観的に追跡し、法規制やビジネスモデルを準備することが不可欠です。AGIの能力を測るベンチマークは、そのための羅針盤となります。 AIの知能測定はなぜ難しいのでしょうか。それは、AIの強みや弱みが人間とは根本的に異なるためです。人間のIQテストは、記憶力や論理的思考など複数の能力を総合的に測りますが、AIにはそのまま適用できません。学習データにない未知の状況に対応する「流動性知能」の評価が、特に大きな課題となっています。 かつてAIの知能を測るとされたチェスやチューリングテストは、もはや有効ではありません。1997年にチェス王者を破ったIBMのDeep Blueは、汎用的な知能を持ちませんでした。近年の大規模言語モデル(LLM)は人間のように対話できますが、簡単な論理問題で誤りを犯すこともあり、その能力は限定的です。 こうした中、Googleのフランソワ・ショレ氏が2019年に開発した「ARCベンチマーク」が注目されています。これは、いくつかの図形パズルの例題からルールを抽出し、新しい問題に応用する能力を測るテストです。大量の知識ではなく、未知の課題を解決する思考力(流動性知能)に焦点を当てている点が特徴です。 ARCベンチマークでは、人間が容易に解ける問題にAIは今なお苦戦しています。2025年には、より複雑な新バージョン「ARC-AGI-2」が導入されました。人間の平均正答率が60%であるのに対し、最高のAIモデルでも約16%にとどまっています。AIが人間レベルの思考力を獲得するには、まだ大きな隔たりがあるようです。 専門家はARCを、AIのアルゴリズム機能を解明する優れた理論的ベンチマークだと評価しています。しかし、その形式は限定的であり、社会的推論など現実世界の複雑なタスクを評価できないという限界も指摘されています。AGIの進捗を知る有力な指標の一つですが、それだけでAGIの全てを測れるわけではありません。 ARC以外にも、多様なAGIベンチマークの開発が進んでいます。仮想世界でのタスク実行能力を測るGoogle DeepMindの「Dreamer」や、テキスト、画像音声など5種類の情報を扱う「General-Bench」などがその例です。究極的には、現実世界で物理的なタスクをこなす能力が試金石になるとの見方もあります。 結局のところ、「AGIとは何か」という定義自体が専門家の間でも定まっていません。「既に実現した」という意見から「決して実現しない」という意見まで様々です。そのため、「AGI」という言葉は、それが何を指し、どのベンチマークで評価されているのかを明確にしない限り、実用的な意味を持ちにくいのが現状と言えるでしょう。

AIモデル小型化の鍵「知識蒸留」、高性能を維持しコスト削減

AI業界で、モデルの小型化とコスト削減を実現する「知識蒸留」技術が重要性を増しています。これは、大規模で高コストな「教師モデル」が持つ知識を、より小型で効率的な「生徒モデル」に継承させる手法です。なぜこの技術が、AI開発の効率化を目指す企業にとって不可欠なのでしょうか。その仕組みと可能性を探ります。 このアイデアは、AI研究の権威であるジェフリー・ヒントン氏らが2015年に発表した論文に遡ります。その核心は、教師モデルが持つ「ソフトターゲット」と呼ばれる確率的な情報を活用することにあります。単なる正解・不正解だけでなく、どの選択肢をどの程度の確率で予測したかという情報まで生徒モデルに教え込むのです。 ヒントン氏はこの詳細な情報を「ダークナレッジ(暗黒知)」と呼びました。例えば画像認識で「犬」の画像を「猫」と間違える確率は、「車」と間違える確率より高いはずです。この「間違い方の近さ」を学ぶことで、生徒モデルは世界の構造をより深く、そして効率的に理解できるようになります。 知識蒸留は、AIモデルが巨大化し運用コストが高騰する中で急速に普及しました。例えば、Googleが開発した言語モデル「BERT」に対し、その知識を蒸留した小型版「DistilBERT」が登場。現在ではGoogleOpenAIなどもサービスとして提供するほど、AI開発における一般的な手法となっています。 最近では、より複雑な推論を行う「思考の連鎖」モデルの学習にも応用されています。カリフォルニア大学バークレー校の研究室は、知識蒸留を用いてわずか450ドル未満のコストで高性能なモデルを開発。この技術がAI開発の基本的なツールであることを改めて示しました。 知識蒸留は、AI導入の障壁となる高コスト問題を解決する鍵となります。自社で巨大モデルをゼロから開発せずとも、既存モデルから知識を継承し、特定の用途に特化した軽量なモデルを安価に構築できるため、多くの企業にとって現実的な選択肢となるでしょう。

Windows 11、タスクバーにAI共有ボタンを試験導入

マイクロソフトは、Windows 11の最新プレビュー版で、AIアシスタントCopilot」との連携を強化する新機能をテストしています。タスクバーに「Share with Copilot」ボタンが追加され、ユーザーは開いているアプリケーションの画面を直接AIに共有できます。これにより、画面上の画像やテキストをCopilotが分析し、関連情報の検索や操作方法の解説などを対話形式で行えるようになります。これはOSへのAI統合を加速する動きの一環です。 今回のテストでは、タスクバー上で開いているアプリのプレビューにマウスを合わせると「Share with Copilot」ボタンが表示されます。このボタンをクリックするだけで、ウィンドウ内のコンテンツCopilot Visionに送信され、AIによる分析が始まります。これにより、スクリーンショットを撮る手間なく、シームレスなAI連携が実現します。 新機能は、ユーザーの探求心や学習意欲を支援します。例えば、写真に写っている彫刻の詳細を調べたり、スポーツの試合で活躍する選手を特定したりすることが容易になります。また、アプリケーションの操作で不明な点があれば、画面を共有してCopilotに操作方法のチュートリアルを求めることも可能になります。 マイクロソフトは、OSのあらゆる場面でAIを活用できるようCopilotの統合を積極的に進めています。すでに「ペイント」や「メモ帳」といった標準アプリ内、さらには専用の物理キーボードキーに至るまで、Copilotを呼び出すためのボタンが次々と導入されており、今回の新機能もその戦略の一環と位置づけられます。 マイクロソフトは、今回のタスクバー機能はあくまで「試行」であると説明しています。そのため、Insider Preview参加者からのフィードバックや利用状況を分析した上で、正式な機能として全ユーザーに提供するかどうかを決定する見込みです。将来的には、この機能が廃止される可能性も残されています。

Geminiが大幅進化、画像から動画生成・家庭操作も可能に

Stability AI、AWS Bedrockで画像編集ツール群を提供開始

Stability AIは、アマゾン・ウェブ・サービス(AWS)の生成AIプラットフォーム「Amazon Bedrock」上で、新たな画像編集API群「Image Services」の提供を開始しました。これにより、企業は使い慣れたAWSインフラ上で、高度な画像編集機能を自社アプリケーションに組み込めます。 Image Servicesは、クリエイティブ制作のワークフロー全体を支援する9つのツールで構成されます。これらのツールは、既存画像を精密に修正する「Edit」と、構成やスタイルを制御しながら画像を生成・変換する「Control」の2つのカテゴリに大別されます。 「Edit」カテゴリには、不要な物体を消去する「Erase Object」や背景を精密に除去する「Remove Background」などが含まれます。特定の色を変更する「Search and Recolor」もあり、ECサイトで商品の色違いを提示するなど、撮影コストの削減に貢献します。 「Control」カテゴリでは、スケッチから写実的な画像を生成する「Sketch」や、画像の構成を維持したままスタイルを適用する「Style Transfer」が利用できます。建築設計のコンセプトを可視化したり、アパレルデザインのモックアップ作成を加速させます。 このサービス群の最大の利点は、企業がAWSのエンタープライズ級のインフラ上で、セキュリティや信頼性を確保しながら最先端のAIツールを利用できる点です。外部サービスを使わずBedrock内で完結するため、ワークフローが大幅に効率化されます。 利用を開始するには、Amazon BedrockのコンソールでStability AIのモデルへのアクセスを有効にし、必要なIAM(Identity and Access Management)権限を設定します。APIとして提供されるため、既存のシステムやアプリケーションへ容易に統合することが可能です。

Zoom、フォトリアルAIアバターを導入 リアルタイム翻訳も実現

新時代の会議体験

カメラオフでもプロ仕様の分身(アバター)
写真からAIが本人そっくりに生成
リアルタイムでの動作追跡と同期
不正利用を防ぐライブカメラ認証
デジタルツイン実現への一歩

生産性向上の新機軸

リアルタイムでの音声翻訳機能
9言語対応でグローバル会議を円滑化
AIアシスタント他社プラットフォームでもメモ作成

米Zoomは9月17日、ビデオ会議サービス「Zoom」に革新的なAI機能を導入すると発表しました。特に注目されるのは、フォトリアリスティックなAIアバターリアルタイム音声翻訳機能です。これらの機能は12月以降、順次提供が開始されます。経営層やエンジニアは、国際的なコミュニケーションの円滑化と、リモートワークにおける生産性向上を直ちに享受できる見込みです。

AIアバター機能は、ユーザーがカメラに映る準備ができていない場合でも、プロフェッショナルな見た目をAIが生成し、会議に出席できるようにします。ユーザーは自身の写真をもとに分身を作成し、AIが実際の動きや発言をリアルタイムで追跡します。これにより、場所を選ばず、常に高いクオリティで会議に参加することが可能となります。

なりすましや不正利用の懸念に対し、Zoomは万全の対策を講じます。アップロードされた画像が本人であることを確認するため、ライブカメラ認証を実施する方針です。また、会議参加者には、その参加者がAIアバターを利用している旨の通知が明示されます。セキュリティ倫理的な配慮を両立させる仕組みです。

もう一つの重要なアップデートが、リアルタイム音声翻訳です。AIが話者の発言を即座に翻訳し、参加者は自らが選択した言語で音声を聞くことができます。現時点で日本語を含む9言語に対応しており、グローバルなチーム間での言語の壁を事実上撤廃し、シームレスなコミュニケーションを実現します。

さらに、AIアシスタント機能も大きく進化します。会議のスケジュール調整などに加え、アシスタントMicrosoft TeamsやGoogle Meetといった他社プラットフォームでの対面会議に「同行」させ、自動でメモを取らせることが可能となります。これは、Zoomが単なる会議ツールを超え、統合的な生産性エージェントへと進化していることを示します。

Stability AI、AI安全対策を強化。年次透明性レポート公開

安全設計と実績値

学習データからの有害コンテンツ排除
モデル・APIの多層的な悪用防止
全生成AIモデル(100%)リスク評価
学習データからのCSAM検出は0%
NCMECへの不正利用報告は計13件

透明性とガバナンス

API生成コンテンツへのC2PAメタデータ付与
リリース前におけるレッドチーミングの継続実施
業界団体や法執行機関との連携強化

Stability AIは2025年9月、2024年4月から2025年4月までの期間を対象とした年次「インテグリティ透明性レポート」を公開しました。同社は、責任ある生成AI開発の取り組みとして、児童性的虐待素材(CSAM)の防止に重点を置き、具体的な安全対策と実績値を開示しています。透明性を通じて信頼を構築し、ガバナンス強化を目指す方針です。

同社の安全対策は、「データ」「モデル」「プラットフォーム」の三層で構成されています。特に学習データについては、社内開発およびオープンソースのNSFW分類器に加え、業界団体のCSAMハッシュリストを適用し、有害コンテンツを徹底的に排除しています。報告期間中、学習データからのCSAM検出は0%でした。

モデルのリリース前には、厳格なリスク評価手法である「レッドチーミング」を実施しています。Stable Diffusion 3を含む全生成AIモデル(100%)がCSAM/CSEM生成能力に関してストレス評価を受けました。有害な生成能力が特定された場合、リリース前に概念を除去するセーフティ・ファインチューニングが施されます。

プラットフォームAPIレベルでは、入力と出力の両方に対し、リアルタイムでのコンテンツフィルターを適用しています。既知のCSAMを検出・ブロック・報告するためのハッシュシステムも統合されています。これにより、AUP(許容利用ポリシー)違反の入出力を即座に阻止する多層的な防御を実現しています。

AIコンテンツの真正性を担保するため、Stability AIはAPIを通じて生成された画像動画音声C2PAメタデータを付与しています。このメタデータにはモデル名やバージョン番号が含まれ、AI生成物であることを特定可能にし、コンテンツの透明性向上に貢献します。

悪用防止のため、自動検出ツールと人間による審査を組み合わせたコンテンツモデレーション体制を敷いています。実際にCSAMに関連する試行が検出された場合、NCMEC(行方不明・搾取児童センター)へ迅速に報告を実施。報告期間中のNCMECへの報告総数は13件でした。

フアンCEOがGemini「Nano Banana」を絶賛、AIは「格差解消の機会」

フアン氏熱狂のAI画像生成

Google Geminiの「Nano Banana」を熱狂的に称賛
公開後数日で3億枚画像生成増を記録
AIの民主化を推進する技術と評価

CEOの高度なAI活用術

日常業務や公開スピーチ作成にAIを多用
AIを「考えるパートナー」として活用
タスクに応じて複数モデルを使い分け

英国AI市場への戦略

NVIDIA英国AIインフラ企業に6.83億ドルを出資
英国のAI潜在能力を高く評価し謙虚すぎると指摘

NVIDIAのジェンスン・フアンCEOは、Google GeminiのAI画像生成ツール「Nano Banana」を熱狂的に称賛しました。同氏はロンドンで英国への大規模AI投資を発表した際、AIは「技術格差を解消する最大の機会」であると主張。AIの未来について非常に楽観的な見解を示しています。

フアンCEOが熱狂的に支持するNano Bananaは、公開から数日でGemini画像生成数を3億枚急増させた人気機能です。これは、背景の品質を維持したまま、顔や動物などのオブジェクトに精密な編集を可能にする点が評価され、ユーザーに広く受け入れられています。

フアン氏は日常業務から公開スピーチの準備まで、AIを積極的に利用しています。AIワープロを使用することで、自身の状況や意図を記憶し、適切な提案を行う「思考のパートナー」として生産性を劇的に高めていると説明しています。

同氏はタスクに応じてAIモデルを厳密に使い分けています。技術的な用途にはGeminiを、芸術的な要素が強い場合はGrokを、高速な情報アクセスにはPerplexityを、そして日常的な利用にはChatGPTを楽しむと述べています。

さらに重要なリサーチを行う際には、フアン氏独自の高度な検証プロセスを採用しています。同じプロンプト複数のAIモデルに与え、互いの出力結果を批判的に検証させてから、最適な成果を選び出す手法です。

フアン氏は、AIは電気やインターネットのように、すべての人に開かれ、誰一人として取り残されてはならないという哲学を持っています。「この技術は使い方が非常に簡単であり、技術格差を埋める最大のチャンスだ」と強調し、AIの民主化を訴えています。

NVIDIAは、英国データセンター構築企業Nscaleに対し、6億8300万ドル(約1,000億円超)の株式投資を実施しました。フアン氏は、英国が産業革命やDeepMindの創出に貢献した歴史を踏まえ、同国のAI進展における潜在能力を高く評価しています。

MSペイントがプロジェクトファイル対応、プロ用途に進化

MSペイントの機能拡張

Photoshopライクな編集機能の導入
レイヤー情報を保持したプロジェクトファイルに対応
新しい拡張子「.paint」を導入
編集途中からのシームレスな再開を実現

標準アプリの生産性向上

鉛筆・ブラシに不透明度スライダーを追加
Snipping Toolにクイックマークアップを搭載
NotepadにAI機能を無料提供開始
Copilot Plus PCでローカルAIモデルを優先利用

Microsoftは、Windows 11の標準アプリ群を大幅に強化しています。特にMSペイントでは、Adobe Photoshopのような編集機能が導入され、プロジェクトファイル形式(.paint)とレイヤー情報の保存に対応しました。これにより、標準アプリながらも高度で効率的な画像編集作業が可能となり、ビジネスにおける生産性向上に寄与します。

新しく導入される.paintファイルは、編集途中の状態を完全に保持するプロジェクト形式です。ユーザーは作業を中断しても、次回ファイルを開くだけで前回終了した場所からシームレスに再開できます。これは複数のステップが必要なデザイン作業やフィードバック対応において、作業効率を飛躍的に高めます。

.paintファイルには、編集に使用したレイヤー情報も格納されます。さらに、鉛筆やブラシツールには不透明度(オパシティ)スライダーが追加され、ピクセル単位での透明度の微調整が容易になります。これにより、プロのツールに匹敵する、柔軟かつ非破壊的な画像合成や編集が可能です。

画像編集機能の進化はペイントだけではありません。スクリーンショットを扱うSnipping Toolにもクイックマークアップ機能が追加されました。ハイライター、ペン、消しゴムなどが利用可能となり、キャプチャ後の注釈付けやクロップ作業が迅速に行えるようになり、資料作成時の生産性が向上します。

また、メモ帳(Notepad)には、Copilot Plus PCユーザー向けにAIによる文章作成、要約、書き換え機能が無料で提供されます。これはMicrosoft 365のサブスクリプションを必要とせず、ローカルモデルとクラウドモデルを切り替えて利用できるため、機密性の高いビジネス文書の処理にも柔軟に対応できる点が大きな特徴です。

インドがGoogle画像AI「Nano Banana」世界一の市場に

世界最大の利用規模

インドNano Banana利用数世界No.1に浮上
GeminiアプリのDL数がリリース後667%急増
1~8月のDL数は米国より55%高い水準

爆発的成長の要因

90年代ボリウッド風など独自のトレンドが拡大
伝統衣装「AIサリー」ブームの創出
フィギュア化などグローバルトレンドの拡散源

収益性と安全対策

アプリ内課金成長率が米国を大きく凌駕
SynthIDによるAI生成画像の識別

Google画像生成AI「Nano Banana」(正式名称Gemini 2.5 Flash Image)が、インドで爆発的な人気を集め、現在、利用規模において世界最大の市場となりました。独自のレトロポートレートやボリウッド風の画像生成といったローカルトレンドが牽引し、Geminiアプリはインドの主要アプリストアで無料チャートのトップを独占しています。

この人気により、インドでのGeminiアプリのダウンロード数は、Nano Bananaのアップデート後、わずか2週間で667%もの急増を記録しました。世界第2位のスマートフォン市場であり、オンライン人口を抱えるインドでの爆発的な普及は、AIモデルのグローバル展開において極めて重要な試金石となります。

Google DeepMindによると、インドユーザーの特徴は、その利用の仕方にあるといいます。特に注目されているのが、1990年代のボリウッドスタイルを再現するレトロポートレート生成です。また、インドの伝統衣装「サリー」を着用したビンテージ風画像、通称「AIサリー」ブームも発生しています。

インドユーザーは、単にローカルな画像生成に留まりません。例えば、自分自身をミニチュア化する「フィギュアトレンド」はタイで始まりましたが、インドで大きな牽引力を得たことで、世界的な流行へと拡大しました。インドは、AIトレンドを消費するだけでなく、拡散する主要なハブとなりつつあります。

利用規模だけでなく、収益性の面でもインド市場は高い潜在力を示しています。アプリ内課金(IAP)の全体額はまだ米国に及びませんが、Nano Bananaリリース後のIAP成長率は18%を記録し、これは世界平均の11%や、米国市場の1%未満を大きく凌駕しています。

一方で、私的な写真を用いた画像生成に伴うプライバシーやデータ悪用の懸念も指摘されています。これに対しGoogleは、AI生成画像であることを識別するため、目に見える透かしに加え、SynthIDと呼ばれる隠しマーカーを埋め込むことで、安全性の向上を図っています。

Google検索、非合意画像拡散を阻止。StopNCIIと提携し事前検知へ

提携による対策強化

英国の慈善団体StopNCII.org提携
非合意型私的画像(NCII)対策への投資深化
被害者の負担軽減とスケーラブルな解決策創出

プロアクティブな削除技術

画像の一意の識別子「ハッシュ」を利用
ハッシュに基づきNCIIコンテンツ事前に特定
ポリシー違反画像自動的・迅速な削除が可能に

従来の対応と課題

従来の対策は削除リクエスト機能が中心
ウェブの規模に対し被害者への負担が大きい点が課題

Googleは非合意型私的画像(NCII)の拡散阻止に向け、英国の慈善団体が運営するStopNCII.orgとの提携を発表しました。これは従来の受動的な対応を強化し、ハッシュ技術を活用することで、NCIIコンテンツ事前に特定・削除するプロアクティブな対策に移行するものです。被害者の負担を軽減し、よりスケーラブルな解決策の構築を目指します。

StopNCII.orgは、被害者がプライベート画像から一意の識別子(ハッシュ)を作成し、参加企業と共有することで、画像の不正利用を防ぐ仕組みを提供しています。このハッシュは画像のデジタル指紋であり、実際の画像データは含まれません。Googleはこの仕組みを取り入れることで、既存の保護体制を深化させます。

Googleは今後数カ月以内に、このStopNCIIのハッシュの使用を開始します。これにより、検索結果からポリシーに違反するNCIIを、被害者からの削除リクエストを待つことなく、自動的に検知・排除することが可能になります。ウェブの広大なスケールに対応するための重要な一歩です。

これまで、被害者はGoogleに対しNCIIの削除をリクエストする必要がありましたが、オープンウェブの規模と拡散速度を考慮すると、被害者への精神的・時間的な負担が大きいことが課題でした。今回のプロアクティブな対応強化は、この被害者負担の劇的な軽減につながります。

Googleは、安全なオンライン環境の実現を長期的な目標としています。NCIIロンドンサミットなどを通じて、政策立案者や業界リーダーとの連携を深め、市民社会との協力を強化する方針です。ウェブ全体でNCII問題に対処し、被害者を支援するための対話を継続します。

BI、記事初稿AI利用を許可。読者への非開示で生産性向上へ

記事制作におけるAI活用

初稿作成へのAI利用を正式許可
リサーチ・画像編集等もツールとして活用
メディア業界で最も踏み込んだ方針

情報開示と責任体制

原則、読者へのAI利用の非開示
完全なAI生成コンテンツ開示対象
最終的な品質責任は記者が負う体制

全社的なAI推進

AI検索ツール導入など全社的な推進
親会社はOpenAIらとライセンス契約締結

米経済ニュースメディアのBusiness Insider(BI)は、ジャーナリストに対し、記事の初稿作成にAIを使用することを正式に許可する内部指針を策定しました。特筆すべきは、AI利用の事実を原則として読者に開示しない方針を打ち出した点です。これは、AI技術を編集プロセスに深く組み込むメディア業界の動きとして、最も踏み込んだ事例の一つと見られています。

BIのエディター・イン・チーフが示した指針によると、AIは「他のツールと同様」に、リサーチや画像編集といった幅広いタスクに活用が認められます。特に初稿作成についても「使用可能」と明記されましたが、最終的な作品は記者のものでなければならないと強調されています。AIを活用しても、成果物に対する責任は全て担当記者に帰属します。

透明性のポリシーについて、BIは完全にAIが生成した、あるいは十分な検証を経ていないコンテンツに対してのみ、開示義務を負うとしています。これにより、記者がAIを下書きとして利用し、その後編集・検証した記事については、読者に通知する必要はないという判断を示しました。生産性向上とジャーナリズムの信頼性の両立を目指す試みです。

BIは、親会社であるアクセル・シュプリンガーと連携し、全社的にAI導入を加速させています。すでにAIを活用した検索ツールを導入し、エンゲージメントを高める成果を上げています。また、アクセル・シュプリンガーはOpenAIMicrosoftなどの巨大テック企業コンテンツのライセンス契約を結んでおり、AIビジネスへの投資を積極的に進めています。

同社は以前、外部ライターによるAI生成記事の掲載で物議を醸した経緯があります。こうした経験を踏まえ、今回の新方針では、AI利用を広げつつも、最終的な品質管理倫理的責任を厳格にジャーナリストに負わせる構造を敷きました。AIを単なる効率化ツールとして最大限活用する強い意志が見えます。

Amazon、出品者向けAIエージェント拡充 在庫管理から広告生成まで自動化

Agentic AI「Seller Assistant」進化

アカウント状態と在庫レベルを常時監視
売れ行き不振商品の価格変更や削除を推奨
需要パターンに基づき出荷を自動提案
新製品安全規制などコンプライアンスを自動チェック

AI広告チャットボットの導入

テキストプロンプト静止画・動画広告を生成
ブランドガイドラインを反映したクリエイティブの自動作成
タグライン、スクリプト、ボイスオーバーの生成
Amazon外のメディア(Prime Video等)への広告展開

Amazonは2025年9月、プラットフォーム上のサードパーティ出品者向けに、自律的に業務を代行するエージェントAI機能の導入・拡張を発表しました。既存の「Seller Assistant」を強化し、さらにAI広告作成チャットボットを提供します。これにより、在庫管理、コンプライアンス遵守、広告クリエイティブ制作などの広範な業務が自動化され、出品者の生産性と収益性の最大化を図ります。

拡張されたSeller Assistantは「常時稼働」のAIエージェントとして機能します。これは単なるツールではなく、セラーに代わってプロアクティブに働きかけることを目的としています。ルーティン業務から複雑なビジネス戦略までを自動で処理し、出品者は商品開発や事業成長といったコア業務に集中できる体制を構築します。

特に注目されるのが在庫管理の最適化機能です。エージェントは在庫レベルを継続的に監視し、売れ行きの遅い商品を自動的に特定します。これにより、長期保管料が発生する前に価格の引き下げや商品の削除を推奨。また、需要パターンを分析し、最適な出荷計画を立てるサポートも行います。

複雑化する規制への対応も自動化します。Seller Assistantは、出品リストが最新の製品安全性ポリシーに違反していないかをスキャンするほか、各国で販売する際のコンプライアンス要件への適合を自動で確保します。これはグローバル展開を志向するセラーにとって大きなリスク低減となります。

同時に導入されたAI広告チャットボットは、クリエイティブ制作の時間とコストを大幅に削減します。出品者が求める広告の概要をテキストで入力するだけで、AIがブランドガイドラインや商品詳細に基づき、静止画や動画のコンセプトを自動で生成します。

このチャットボットは、タグラインや画像だけでなく、スクリプト作成、音楽追加、ボイスオーバー、絵コンテのレイアウトまでを完結できます。生成された広告は、Amazonのマーケットプレイス内だけでなく、Prime VideoやKindle、TwitchといったAmazonの広範なプロパティに展開され、露出を最大化します。

これらの新機能は、Amazon独自の基盤モデルであるNova AI、およびAnthropicClaudeを活用しています。今回の発表は、AIが商取引を主体的に推進する「エージェント主導型コマース」の流れを加速させています。Googleなども同様にエージェントによる決済プロトコルを公開しており、AIによる業務代行競争が本格化しています。

QuoraのPoe、AWS BedrockでAIモデル統合を96倍高速化

開発生産性の劇的向上

デプロイ時間を96倍高速化(数日→15分)。
必須コード変更を95%削減
テスト時間を87%短縮。
開発リソースを機能開発へ集中

統一アクセスレイヤーの構築

異なるAPI間のプロトコル変換を実現。
設定駆動型による迅速なモデル追加。
認証(JWTとSigV4)のブリッジング機能

マルチモデル戦略の強化

30以上のテキスト/画像モデル統合。
設定変更でモデル能力を拡張可能に。

QuoraのAIプラットフォーム「Poe」は、Amazon Web Services(AWS)と協業し、基盤モデル(FM)のデプロイ効率を劇的に改善しました。統一ラッパーAPIフレームワークを導入した結果、新規モデルのデプロイ時間が数日からわずか15分に短縮され、その速度は従来の96倍に達しています。この成功事例は、複数のAIモデルを大規模に運用する際のボトルネック解消法を示しています。

Poeは多様なAIモデルへのアクセスを提供していますが、以前はBedrock経由の各モデルを統合するたびに、独自のAPIやプロトコルに対応する必要がありました。Poeはイベント駆動型(SSE)、BedrockはRESTベースであり、この違いが膨大なエンジニアリングリソースを消費し、新しいモデルの迅速な提供が課題となっていました。

AWSのGenerative AI Innovation Centerとの連携により、PoeとBedrockの間に「統一ラッパーAPIフレームワーク」を構築しました。この抽象化レイヤーが、異なる通信プロトコルのギャップを埋め認証や応答フォーマットの違いを吸収します。これにより、「一度構築すれば、複数のモデルを展開可能」な体制が確立されました。

この戦略の結果、新規モデルを統合する際の必須コード変更量は最大95%削減されました。エンジニアの作業内容は、以前の65%がAPI統合だったのに対し、導入後は60%が新機能開発に集中できるようになりました。この生産性向上により、Poeはテキスト、画像動画を含む30以上のBedrockモデルを短期間で統合しています。

高速デプロイの鍵は、「設定駆動型アーキテクチャ」です。新しいモデルの追加には統合コードの記述は不要で、設定ファイルへの入力のみで完結します。さらに、Bedrockが導入した統一インターフェース「Converse API」を柔軟に活用することで、チャット履歴管理やパラメーター正規化が容易になり、統合作業がさらに簡素化されました。

本フレームワークは、マルチモーダル機能の拡張にも貢献しています。例えば、本来テキスト専用のモデルに対しても、Poe側が画像を分析しテキスト化することで、擬似的な画像理解能力を付与できます。これにより、基盤モデルのネイティブな能力によらず、一貫性のあるユーザーエクスペリエンスを提供可能になりました。

本事例は、AIモデル活用の競争優位性を得るには、個別のモデル連携に時間を使うのではなく、柔軟な統合フレームワークへの初期投資が極めて重要であることを示唆しています。抽象化、設定駆動、堅牢なエラー処理といったベストプラクティスは、AIを大規模展開し、市場価値を高めたい組織にとって必須の戦略となるでしょう。

Google、Windows向け新検索アプリ提供 生産性向上のAIハブ狙う

瞬時に統合検索

Mac Spotlight類似のデスクトップ検索機能
Alt + Spaceで即座に起動しフロー中断回避
ローカル、Drive、Webの情報源を統合
デスクトップ上に検索バーを常時配置可能

AIとLens連携

内蔵されたGoogle Lensによる画面検索
画像・テキストの翻訳や宿題解決の支援
AI Modeによる高度な検索応答と質問継続
検索結果の表示モード(AI, 画像, 動画など)を切り替え

現状と要件

現在、Search Labs経由の実験機能として提供
Windows 10以降が必要、当面は米国・英語限定

Googleは、Windowsデスクトップ向けに新しい検索アプリの実験提供を開始しました。これはMacのSpotlightに似た機能を持つ検索バーをPCにもたらし、ユーザーの生産性向上を強力に支援します。ローカルファイル、Google Drive、ウェブ上の情報を瞬時に横断検索できる統合機能が最大の特長です。AIモードも搭載されており、作業フローを中断することなく、高度な情報処理と検索を可能にします。

このアプリは、ショートカットキー「Alt + Space」を押すだけで即座に起動し、現在作業中のウィンドウを切り替えることなく利用できます。文書作成中やゲーム中でも、必要なファイルや情報にすぐにアクセス可能です。特に、ローカルPC内のファイルとGoogle Drive上のクラウドデータを一元的に検索できる点は、ハイブリッドなデータ環境を持つビジネスパーソンにとって大きなメリットとなります。

さらに、Googleのビジュアル検索機能「Google Lens」が内蔵されています。これにより、画面上の任意の画像やテキストを選択し、そのまま検索したり、翻訳したりできます。AI Modeを有効にすれば、複雑な数式問題の解答補助など、より深いAI駆動型の応答を得ることも可能です。検索を単なる情報発見から課題解決ツールへと進化させています。

MicrosoftCopilot Plus PCなどで検索とAI機能をOSレベルで強化していますが、Googleはこのデスクトップアプリで対抗します。Googleは、Windows環境においても、WebとDriveの圧倒的なデータ連携力と、独自のAI技術を武器に検索における優位性を確立しようとしています。これは、両社のAI戦略の主戦場がOS/デスクトップ環境に移っていることを示唆します。

この新アプリは、ウィンドウの切り替え工数を削減し、情報探索時間を短縮することで、ユーザーの集中力を維持させます。特に大量の文書やデータを行き来する経営者やリーダー、エンジニアにとって、タスクフローを中断しないシームレスな検索体験は、生産性の大幅な改善に直結します。今後の機能拡張次第では、業務における「AIハブ」となる可能性を秘めています。

現在、この新アプリはGoogleのSearch Labsを通じた実験段階にあり、利用はWindows 10以降のPCで、米国ユーザーのみ、言語は英語に限定されています。しかし、この戦略的な動きは、GoogleデスクトップOSの垣根を越えて検索体験の主導権を握る意図を示しています。今後の対応言語や機能の拡大に注目が集まります。

Geminiが新AI画像モデルでApp Store首位獲得

ランキング勢力図の変化

米国iOSChatGPTを抜き首位 (9/12)
世界108カ国でiPhone総合Top 5入り
Google Playでは26位から2位に急伸

DLと収益の爆発的成長

9月のDL数が前月比45%増を記録
Nano Banana導入後、新規ユーザー2300万人
iOS収益が1月比1,291%増を達成

GoogleのAIチャットアプリ「Gemini」が、新画像編集AIモデル「Nano Banana」の導入により、モバイルアプリ市場で記録的な成長を見せています。特に米国iOSApp Storeでは、長らく首位を維持していたOpenAIChatGPTを抜き、トップの座を獲得しました。

Geminiは9月12日に米国App Store総合ランキング1位を達成し、現在もその座を維持しています。また、AndroidプラットフォームのGoogle Playでも、9月8日の26位から一気に2位まで躍進。AIアプリ市場の勢力図が大きく変化しています。

アプリインテリジェンス企業Appfiguresのデータによると、9月のダウンロード数は前月比45%増となり、わずか半月で1,260万ダウンロードを記録しました。さらに世界108カ国でiPhone総合アプリのTop 5に入るなど、グローバルな浸透が加速しています。

この成長の最大の要因は、ユーザーが複雑な画像編集やリアルな画像生成を容易に行えるようになった「Nano Banana」モデルへの高い評価です。同モデル導入後、新規ユーザーは2,300万人を超え、共有された画像5億枚以上に達しています。

利用者の増加は収益にも直結しています。iOSにおけるGeminiの年間収益は630万ドルに達しており、特に「Nano Banana」がリリースされた8月の収益は160万ドルでした。これは1月と比較して1,291%もの大幅な伸びです。

GPT-5-Codexが開発生産性を劇的に向上させる理由

エージェント能力の進化

複雑なタスクで最長7時間以上の独立稼働
タスクに応じた思考時間の動的な調整
迅速な対話と長期的な独立実行の両立
実世界のコーディング作業に特化しRL学習を適用

ワークフローへの密着

CLI、IDE拡張機能、GitHubへシームレスに連携
ローカル環境とクラウド間のコンテキスト維持
画像やスクリーンショットを入力可能

品質と安全性の向上

コードレビューの精度が大幅に向上
重大なバグを早期に発見しレビュー負荷を軽減
サンドボックス環境による強固なセキュリティ

OpenAIは、エージェントコーディングに特化した新モデル「GPT-5-Codex」を発表し、開発環境Codexを大幅にアップグレードしました。これはGPT-5を実世界のソフトウェアエンジニアリング作業に最適化させたバージョンです。開発者はCLI、IDE、GitHubChatGPTアプリを通じて、より速く、信頼性の高いAIアシスタントを活用できるようになります。

最大の進化は、タスクの複雑性に応じて思考時間を動的に調整する能力です。GPT-5-Codexは、大規模なリファクタリングデバッグなどの複雑なタスクにおいて、最長7時間以上にわたり独立して作業を継続できることが確認されています。これにより、長期的なプロジェクトの構築と迅速なインタラクティブセッションの両方に対応します。

モデルは、既存のコードベース全体を理解し、依存関係を考慮しながら動作検証やテスト実行が可能です。特にコードレビュー機能が強化されており、コミットに対するレビューコメントの正確性と重要性が向上。重大な欠陥を早期に特定し、人間のレビュー工数を大幅に削減します。

開発ワークフローへの統合も一層強化されました。刷新されたCodex CLIとIDE拡張機能(VS Codeなどに対応)により、ローカル環境とクラウド環境間でシームレスに作業を移行できます。コンテキストが途切れないため、作業効率が劇的に向上します。

さらに、Codex画像やスクリーンショットを入力として受け付けるようになりました。これにより、フロントエンドのデザイン仕様やUIバグなどを視覚的にAIへ共有し、フロントエンドタスクの解決を効率化します。また、GitHub連携によりPRの自動レビューや編集指示も可能です。

安全性確保のため、Codexはデフォルトでサンドボックス環境で実行され、ネットワークアクセスは無効です。プロンプトインジェクションリスクを軽減するとともに、開発者セキュリティ設定をカスタマイズし、リスク許容度に応じて運用することが可能です。

MIT、AIで胎児の動きを精密再現 3Dモデル「Fetal SMPL」を開発

診断精度を革新

従来の3D MRIは医師の解釈が困難
胎児のランダムな動きのモデル化が課題
より詳細な胎児の健康診断を支援

技術的コアと精度

MIT CSAILなどが成人モデルから適合
2万件のMRIボリューム機械学習
23関節を持つ骨格構造を3Dで再現
平均誤差はわずか約3.1ミリメートル

応用と将来性

頭部や腹部サイズの正確な測定が可能
内臓構造の容積モデル化を今後目指す

マサチューセッツ工科大学(MIT)のコンピューター科学・人工知能研究所(CSAIL)などは、胎児の健康診断を革新する機械学習ツール「Fetal SMPL」を開発しました。これはMRIスキャンデータから、胎児の動きや体形を高精度に再現した詳細な3Dモデルを生成します。従来の3Dスキャン画像は医師にとって解釈が難しく、診断のボトルネックとなっていましたが、本ツールはその課題を解決します。

Fetal SMPLは、成人向けの人体モデリング技術「SMPL」を胎児用に適合させたものです。約2万件のMRIボリュームで訓練され、彫刻のような3D表現を生み出します。モデル内部には23の関節を持つ「キネマティックツリー」と呼ばれる骨格構造があり、これを利用して胎児のリアルなポーズと動きを再現できる点が大きな特長です。

このモデルは実証実験において、非常に高い精度を示しました。これまでに学習していないMRIフレームに対しても、胎児の位置とサイズを正確に予測し、平均誤差はわずか約3.1ミリメートルに留まっています。これにより、医師は胎児の頭部や腹部のサイズなどを正確に測定し、同年齢の健康な胎児のデータと比較した精密な診断が可能になります。

研究チームは現在、Fetal SMPLが表面的な分析に留まっている点を改善するため、内臓などの内部解剖学的な構造をモデル化する「容積(volumetric)」対応を目指しています。この進化により、肝臓や肺などの発達状況もモニタリングできるようになります。本技術は、ヒトの成長と運動が様々な条件でどのように影響を受けるかを長期的に研究する上でも画期的な一歩です。

M365 Copilot Chatが無料化、主要Officeアプリで生産性を底上げ

無料化の対象と範囲

全てのM365ビジネスユーザーが対象
Word、Excelなど主要5アプリに搭載
Copilot Chatサイドバーを実装
追加ライセンス費用は不要

提供される主要機能

ドキュメントの迅速な下書き・要約
スプレッドシートのデータ分析を支援
開いたファイル内容を理解し回答
Webベースの安全なAIチャット利用

Microsoftは、全てのMicrosoft 365ビジネスユーザーを対象に、WordやExcelなどの主要Officeアプリケーション内でAI機能「Copilot Chat」の無料提供を開始しました。これにより、ドキュメントの下書きやデータ分析といった生成AIの基本機能が、追加費用なしで利用可能になります。これは、企業やチームの生産性向上を強力に後押しする戦略的な動きです。

今回搭載されたのは、アプリ内で利用できるCopilot Chatサイドバーです。ユーザーが開いているファイルの内容を瞬時に理解し、関連性の高い回答を返す「コンテンツアウェア」なチャット機能が特徴です。例えば、Wordでの文書の書き換えや、PowerPointでのスライド作成補助などを、すぐに開始できます。

ただし、月額30ドル/ユーザーの有償ライセンス「Microsoft 365 Copilot」は引き続き提供されます。有償版は、単一ファイルに限定されず、企業全体の作業データに基づいて推論できる点で無料版と一線を画します。真の全社的なAI活用を目指す企業には、引き続き有償版の検討が必要です。

さらに、有償ライセンスユーザーは、最新技術であるGPT-5への優先アクセス権や、ファイルアップロード、画像生成といった高度な機能を利用できます。また、応答速度の向上や、ピーク利用時でも安定した可用性といった技術的な優位性も享受できます。

今回の無料化は、既存のビジネスプランの価格調整を伴わず実施されました。企業は、AI活用のハードルが大幅に下がることで、従業員のAIリテラシー向上と生産性改善を同時に進めることが可能になります。日常業務へのAI浸透を加速させる、重要な施策と言えるでしょう。

GeminiがChatGPTを抜き首位獲得 Nano Bananaで3Dフィギュアブーム

利用急増のインパクト

Geminiアプリの利用者数、2週間で2300万増加
同期間の画像変換回数、5億回を突破
主要国のアプリストアChatGPTを抜き1位
極端な需要により一時的な利用制限を検討

バイラル化した要因

火付け役は超リアルな3Dフィギュア生成
Geminiアプリ内で簡単かつ高速に編集可能
画像の顔の特徴を維持したまま生成
詳細なプロンプトオンラインで拡散

GoogleのAIモデル「Gemini」が、画像編集機能「Nano Banana」のバイラルな成功により、OpenAIの「ChatGPT」を抜き去り、主要なアプリストアで首位を獲得しました。特にユーザー自身をモデルにした超リアルな3Dフィギュアを生成するトレンドが世界中で爆発的に広がり、Geminiの利用が急増しています。AI市場における競争環境が、一気に塗り替えられた格好です。

この勢いはデータにも明確に表れています。Nano Bananaが8月下旬にリリースされてからわずか2週間で、Geminiアプリの新規ユーザーは2300万人増加しました。また、この期間中にGeminiを通じて変換された画像5億枚を突破。米国英国ドイツなど複数の国のApple App Storeで、GeminiChatGPTを抜いてダウンロードランキングのトップに躍り出ています。

利用急増の最大の原動力となっているのが、自分自身やペットを超リアルなミニチュア人形に変身させる「3Dフィギュア」生成機能です。ユーザーは画像を入力し、詳細なプロンプトを与えるだけで、デスク上の人形や箱、デザイン用ワイヤーフレームまで再現された精巧なフィギュア画像を作成できます。この詳細なプロンプトがオンラインで共有され、利用の敷居を下げています。

Nano Bananaは、Geminiアプリ内でシームレスかつ高速に機能します。他の画像編集AIツールと比較して処理待ち時間が非常に短く、ユーザーが求める画像迅速に提供できる利便性が評価されています。シンプルな操作性とスピード感が、一般ユーザーの継続的な利用を促す大きな要因となりました。

成功の鍵は、他のAIツールとの決定的な差別化にもあります。多くのAI編集ツールが顔の特徴を不自然に変えてしまう傾向がある中、Nano Bananaは元の画像の顔の特徴を認識可能な形で維持しながら、可愛らしいミニチュア化を実現します。この精度と信頼性が、ユーザーの満足度を大きく高めています。

あまりにも爆発的な需要のため、Googleインフラ管理に追われています。同社幹部は、極端なトラフィックに対処するため、一時的に利用制限(Temporary limits)を導入する必要があると述べました。開発チームはシステム稼働を維持するために「英雄的な努力」を続けている状況です。

DeepMind、年間1.4兆エンベディングで地球をデータ化するAI公開

地球動態把握AIの核心

衛星データなどから地球を統一デジタル表現
10m四方のセルごとに64次元のエンベディング生成
年間1.4兆超の緻密なデータ要約

技術的優位性と応用範囲

従来のストレージ要件を16分の1に大幅削減
競合比でエラー率23.9%減を達成
ラベルデータが少ない状況でも高精度な分類を実現
都市計画や山火事リスク管理など広範に適用

Google DeepMindは、地球の広範な変化を高精度に追跡するAIモデル「AlphaEarth Foundations」を発表しました。このモデルは地球を「生きたデータセット」として捉え、衛星画像やセンサーデータなど多様な情報を統合します。年間1.4兆を超えるエンベディングを生成し、従来困難だった地球規模のデジタル表現と分析を革新します。

AlphaEarthの核心技術は、地球上の10m四方のセルごとに64次元の「エンベディング(数値要約)」を作成する点です。これにより、膨大な地理空間データを統一的に扱えるようになりました。この緻密なアプローチにより、ストレージ要件を従来の16分の1にまで削減しつつ、高い空間的・時間的な詳細度を維持しています。

地球観測における長年の課題であった、衛星データの不規則性や雲による欠損を本モデルは克服しています。光学画像だけでなく、レーダー、気候モデル、さらには地理タグ付きのWikipedia情報まで組み込むことで、マルチソース・マルチレゾリューションな一貫性のあるデータセットを構築しています。

ベンチマークテストの結果、AlphaEarthは競合する既存のアプローチと比較して、平均で23.9%低いエラー率を記録しました。また、ラベルデータが非常に少ない状況下でも高精度な分類を可能にし、通常数千のラベルを必要とするタスクで、少数のサンプルで87種の農作物や土地被覆タイプを特定できています。

この技術は、都市計画やインフラ管理、生態系追跡といった幅広い分野で即戦力となります。特にビジネス領域では、保険会社や通信会社などが空間分析プラットフォームCARTOを経由して利用を開始しています。

これにより、APIや追加ストレージなしで山火事リスクの高い地域を特定するなど、迅速なリスクモデル構築が可能になります。自社の既存ワークフローにエンベディングをロードするだけで、高度な環境プロファイリングが可能になる点がメリットです。

AlphaEarthは、パターンを学習しコンパクトに要約する自己教師あり学習フレームワークであり、生成モデルではありません。非営利利用向けにGoogle Earth Engineデータカタログを通じて無償提供されており、国連食糧農業機関(FAO)を含む世界50以上の組織が既に活用を進めています。