オンデバイス(ハードウェア)に関するニュース一覧

Gemma 4活用事例をGoogleが紹介

オンデバイスAIの実用化

Gemma 4累計1.5億回超のDL
オフライン英語学習アプリの実現
4bit量子化でモバイル動作

視覚・長文脈の応用展開

画像認識とペルソナ維持の両立
256Kコンテキストで長期記憶
Apache 2.0で柔軟な展開
エッジからワークステーションまで対応

Googleは2026年6月9日、オープンモデルGemma 4を活用した開発者プロジェクト3件を公式ブログで紹介しました。Gemma 4はリリース以来1億5000万回以上ダウンロードされており、Multi-Token Prediction(MTP)による推論高速化や12B Unifiedモデル、量子化対応チェックポイントなど機能拡張が進んでいます。Apache 2.0ライセンスで公開されており、エッジデバイスからローカルワークステーションまで幅広い環境で利用できます。

1つ目の事例は、アプリ開発企業HubXが構築したオフラインAI英語学習プラットフォーム「BetterSpeak」です。エッジ最適化されたGemma 4 E2B(実効2Bパラメータ)モデルを推論エンジンとして採用し、インターネット接続なしでプライベートかつ低遅延の英語指導を実現しています。Googleが公開した4bit量子化版を使うことで、文法解説や進捗管理をモバイル端末上で処理しています。

2つ目の事例では、開発者Gemma 4の視覚言語タスク能力を活用し、「中世の吟遊詩人」というペルソナを維持しながら画像内の物体を正確に識別するデモを作成しました。物体検出や画像キャプション生成など多様なビジョン機能を、キャラクター設定と両立させた応用例です。

3つ目の事例では、開発者の@GOROmanが現実世界を冒険ゲームに変換するアプリを構築しました。大型モデルが提供する最大256Kコンテキストウィンドウにより、ゲーム内の長い履歴を記憶し続けることが可能です。Googleはこれらの事例を通じて、Gemma 4がローカル環境で最大限の制御性を持って利用できるオープンモデルとしての実用性を示しています。

Apple、WWDC26でSiri AIと独自基盤モデルAFM 3を発表

Siri AI刷新の全容

Google Geminiベースの新Siri AI
専用アプリとして独立、全デバイス対応
画面認識で文脈に応じた操作を実行
Private Cloud Computeプライバシー確保

AFM 3とAI写真編集

AFM 3は20Bパラメータをフラッシュに格納
オンデバイスで1B〜4Bを動的に活性化
写真のフォトリアル生成を解禁
SynthID透かしで改変を識別

開発者向けAI基盤

App Intentsでアプリ操作をSiriに公開
Shortcutsの自然言語生成でバイブコーディング実現

Appleは2026年6月9日、年次開発者会議WWDC 2026で、AIアシスタントSiri AI」の全面刷新と、第3世代の独自基盤モデルAFM 3」ファミリーを発表しました。新SiriGoogle Geminiをベースとし、専用アプリとして独立。テキスト・音声画像によるマルチモーダル対話に対応し、iPhoneからMac、Apple Watchまで全デバイスで利用できます。Tim Cook CEOにとって最後のWWDCとなる今回、同社はAI分野での遅れを取り戻す姿勢を鮮明にしました。

Siri AIの最大の特徴は、画面上のコンテンツを認識して文脈に応じた操作を実行するエージェント機能です。InstagramやSafariで表示中の情報をもとに検索や予定登録を行ったり、メッセージの文脈からリマインダーを自動提案したりできます。Apple上級副社長のCraig Federighi氏は「AIにおけるプライバシーは交渉の余地がない」と強調し、処理はオンデバイスまたはPrivate Cloud Computeで完結すると説明しました。

技術面で注目されるのがAFM 3 Core Advancedです。20億パラメータの重みをDRAMではなくNANDフラッシュに格納し、プロンプトごとにルーティングして1B〜4Bのパラメータを動的にDRAMへロードします。従来のMoEモデルがトークンごとにエキスパートを切り替えるのに対し、プロンプト単位で一度だけ選択する設計により、メモリ帯域の制約を回避しています。サーバー側のAFM 3 Cloud ProGoogle Cloud上のNvidia GPUで稼働し、複雑な推論エージェント処理を担います。

写真編集では、Appleはこれまでの慎重姿勢を転換し、Image Playgroundフォトリアルスタイル画像生成を解禁しました。新ツール「Extend」は画像の枠外をAIで補完し、「Spatial Reframing」は写真の視点を3D的に変更できます。改変画像にはGoogleSynthID透かしを付与し、AI生成コンテンツの識別を可能にしています。かつてFederighi氏が「写真は現実を正確に捉えるべき」と述べていたことを考えると、大きな方針転換です。

開発者向けには、App IntentsApp Schemasを通じてアプリの機能をSiriやSpotlightに公開する仕組みが拡充されました。Shortcutsアプリでは自然言語による操作の自動化が可能になり、Safariでも自然言語でブラウザ拡張機能を作成できます。一方、Siri AIはEUと中国では当初利用不可で、対応ハードウェアも限定されるため、グローバル展開には課題が残ります。Appleの戦略はスタンドアロンのチャットボットではなく、OS全体にAIを統合するアプローチであり、プライバシーを武器にMicrosoftGoogleとの差別化を図っています。

AppleがSiri AIを発表、Google連携で対話型AIアシスタントに刷新

Siri AIの全面刷新

専用アプリで会話履歴を管理
画面内容を読み取りアプリ横断で操作
Google Gemini基盤の新モデル搭載
Dynamic Islandからスワイプで起動
音声のペース・表現力をカスタマイズ可能

Apple Intelligence全体の進化

Safariがタブを自動分類
Shortcutsを自然言語で作成可能に
写真の空間リフレームで構図を変更

展開と制約

年内ベータ、EU・中国では当初利用不可
対応言語は英語のみで順次拡大予定
小規模開発者にAIクラウド基盤を無償提供

Appleは2026年6月8日のWWDC 2026基調講演で、音声アシスタントSiriを全面的に刷新した「Siri AI」を発表しました。2024年に予告しながら実現できなかったAI強化を、Googleとの提携によりGeminiベースの新しいApple Foundation Modelsとして再構築しています。新しいSiriChatGPTClaudeのような対話型インターフェースを備えた専用アプリとして提供され、会話履歴がiCloud経由で全デバイス間で同期されます。

Siri AIの最大の特徴は、システム全体への統合です。画面に表示されている内容を読み取り、アプリをまたいで操作を実行できます。たとえば通話中にメールから航空便の詳細を表示したり、カレンダーの予定を自然言語で作成したりすることが可能です。iPhoneではDynamic Islandからのスワイプ、MacではSpotlight、Vision Proでは視線で起動でき、あらゆるデバイスでシームレスにアクセスできます。

Apple Intelligenceの進化はSiri以外にも広がっています。SafariはAIによるタブ自動整理やウェブサイトの変更通知機能を獲得し、Shortcutsは自然言語でワークフローを構築できるようになりました。写真アプリには撮影後に構図を変更できる「Spatial Reframing」、画像の端を拡張する「Extend」ツール、精度が向上した「Cleanup」ツールが追加されています。Image Playgroundもより高品質な画像生成が可能になり、開発者向けAPIも公開されます。

カメラアプリにはSiriモードが追加され、レシートを撮影して割り勘計算からApple Cash送金まで一連の操作を自動化できます。また、200万ダウンロード未満の小規模開発者にはPrivate Cloud Compute上のFoundation Modelsを無償で提供し、AI開発の参入障壁を下げる施策も発表されました。

ただし展開には制約があります。Siri AIは年内にベータ版として提供されますが、EUではiOS・iPadOSで当初利用できず、中国では規制上の理由から提供されません。対応言語も英語のみでのスタートです。高度なオンデバイスAI機能はiPhone Air・iPhone 17 Pro、M4以降のiPad、M3以降かつ12GB以上のRAMを搭載したMacに限定されます。なお今回のWWDCは、9月1日にCEOをJohn Ternusに引き継ぐTim Cookにとって最後の基調講演となりました。

Apple、Siri刷新の全容がリーク iOS 27でChatGPT対抗

新Siriアプリの概要

独立アプリとしてChatGPT対抗
Dynamic Islandからチャット起動
文書・写真アップロードに対応
チャット履歴の閲覧・管理機能

Gemini搭載とオンデバイスAI

GoogleGemini技術を基盤に採用
巨大モデルのiPhone向け蒸留を推進
RAM・NPU制約でクラウド依存が不可避
プライバシー重視路線との両立が課題

Appleが6月8日開幕のWWDC 2026で発表予定とされるiOS 27の新機能について、Bloombergがリーク画像を公開しました。最大の注目点は、ChatGPTClaudeGeminiに対抗するSiri独立アプリの登場です。従来の音声アシスタントから本格的なAIチャットボットへと進化し、テキスト入力に加えて文書や写真のアップロード、過去の会話履歴の管理にも対応します。

UIも大幅に刷新されます。Siriの応答はiPhoneのDynamic Islandから吹き出し形式で表示され、画面上部から下にスワイプすることでどのアプリからでもSiriチャットを呼び出せるようになります。従来のSpotlight検索もAI搭載のSiriに統合され、アプリ起動やメッセージ作成、カレンダー追加などの操作がカード型インターフェースで完結します。

技術面では、Appleが2026年1月に発表したGoogleとの提携に基づき、Geminiの大規模言語モデルがSiriの基盤となります。一方、The Informationの報道によると、Appleは数兆パラメータ規模のGeminiモデルをiPhone上で動作するよう蒸留(圧縮)する取り組みも進めています。しかし、スマートフォンのRAMやNPUの制約から、会話型AIの完全なオンデバイス処理は困難であり、クラウド処理への依存が避けられない状況です。

Appleにとっての強みは25億台の端末というインストールベースです。ChatGPTの週間アクティブユーザーが9億人に達する一方で、Appleはまだ単体のAIツールを使っていない膨大なユーザー層にリーチできます。カメラアプリへのSiriモード追加や写真アプリのAI編集機能強化も予定されており、OSレベルでのAI統合を着実に進めています。プライバシーを訴求しつつ外部パートナーの技術を活用するという、検索エンジンでのGoogle提携と同様の戦略が繰り返されています。

Stability AIが6分超の楽曲生成モデルを公開

モデルの全体像

4モデルを同時公開
最大27億パラメータの大規模構成
小型版はオープンウェイトで提供
6分20秒の長尺楽曲に対応

ライセンスと事業戦略

Warner・Universal提携済み
学習データは完全ライセンス取得
プロ向け音楽制作ツールを開発中
音楽業界幹部の採用を加速

Stability AIは2026年5月20日、音声生成モデルの新シリーズ「Stable Audio 3.0」を発表しました。最上位モデルは6分20秒のプロ品質の楽曲を生成でき、2024年リリースの前世代モデルが対応していた長さの2倍以上を実現しています。

今回公開されたのは、小型SFX(4.59億パラメータ)、小型(同)、中型(14億パラメータ)、大型(27億パラメータ)の4モデルです。小型2モデルは最大2分の音楽デバイス上で生成でき、中型・大型は楽曲構造やメロディの一貫性を保った長尺生成が可能です。小型SFX・小型・中型の3モデルはオープンウェイトで公開され、誰でも利用・改変できます。

大型モデルはAPIとセルフホスティング経由のみの提供で、売上100万ドル超の企業はエンタープライズライセンスが必要となります。Stability AIは学習データがすべて正規にライセンスされたものであると説明しており、Warner Music GroupおよびUniversal Music Groupとの提携がその基盤となっています。

AI音楽生成の分野ではGoogleElevenLabsも参入していますが、SunoやUdioが著作権訴訟に直面するなど、学習データのライセンスが事業継続の鍵となっています。Stability AIはライセンス問題をクリアした点で競合との差別化を図っています。

同社はプロのミュージシャン向けに新たな製品群を開発中で、Universal AudioやFenderで最高デジタル責任者を務めたEthan Kaplan氏をプロ向け音楽事業の責任者として迎えました。AI音楽企業が音楽業界の経験者を積極的に採用する動きは業界全体のトレンドとなっています。

DeepMind、視覚障害者向けAIランニングガイド発表

二重構造で安全性を確保

Pixel 10 Pro胸部装着で走路認識
オンデバイス処理で超低遅延の停止警告
Gemma 4が高次の状況判断を担当
高エントロピーフレームのみ選択処理

マルチエージェント協調

Planner:天候・地図取得と目標設定
Coach:危険度3段階で音声指示
Break:休憩・再開を柔軟に管理

ウェアラブル展開と実地検証

スマートグラス試作で視野拡大
シンガポールSG Enableと共同テスト

Google DeepMindは2026年5月20日、視覚障害者や弱視のランナーがガイドランナーなしで走れるようにする「Running Guide agent」を発表しました。従来、視覚障害者のランニングには伴走者やトラックの誘導ラインが必要でしたが、本エージェントはリアルタイムの空間認識AIにより単独走行を目指します。

システムの核心は安全性を最優先した二重経路アーキテクチャです。第一の経路はPixel 10 Proのカスタムシリコン上で完全オフライン動作するセグメンテーションモデルで、超低遅延の停止警告や方向指示音を提供します。第二の経路はGemma 4 E4Bによる高度なマルチモーダル推論で、地形変化や新たな障害物など情報量の多いフレームだけを選択処理することで、遅延を抑えつつ的確なコーチングを実現します。

ランニング体験全体を3つの専門エージェントが分担します。Planner天候Google Maps情報を取得しワークアウト目標を設定します。Coachは走行中に「DANGER」「WARNING」「NOTICE」の3段階で簡潔な音声フィードバックを届けます。Breakは休憩と再開を管理し、ランナーが自分のペースで運動を続けられるよう支援します。

今後の展開として、胸部装着のスマートフォンに加えスマートグラスへの搭載を試作中です。グラスはより広く安定した視野を提供し、マルチモーダルモデルへの入力品質を大幅に向上させます。また、シンガポールの障害者支援機関SG Enable提携し、実際の視覚障害ランナーとともに実地テストを進めています。エッジコンピューティングと深い環境理解の組み合わせにより、すべてのランナーに自立した走行体験を届けることが目標です。

IrisGoがPC操作自動化で280万ドル調達

プロアクティブAIの挑戦

Andrew NgのAI Fund主導で資金調達
ユーザー操作を学習し自動再現
コーディング支援機能も搭載

普及戦略と今後の展開

NvidiaGoogleも出資
Acerとプリインストール契約締結
macOSWindows向けベータ版公開
他メーカーへの搭載拡大を計画

IrisGoは、Andrew NgのAI Fundが主導した280万ドルのシードラウンドを完了したスタートアップです。同社はPCのデスクトップ上でユーザーの日常的なワークフローを学習し、人間の指示なしに自動化する「プロアクティブAI」コンパニオンを開発しています。共同創業者のJeffrey Lai氏は元Apple技術者で、中国語版Siriの開発に携わった経歴を持ちます。

IrisGoの基本的な仕組みは、操作を一度見せるだけでそのプロセスを記憶し、以降は自動で再現するというものです。デモではオンラインでのコーヒー注文手順を一度記録し、その後エージェントが自律的に同じ注文を完了する様子が披露されました。メール作成や請求書処理、レポート作成など、すぐに使えるスキルライブラリも内蔵されています。

プライバシー面では、多くのデータをオンデバイスで処理する設計を採用しています。クラウド処理はユーザーが明示的に許可した場合のみ実行され、エンドツーエンド暗号化が適用されます。ただし大規模なタスクについてはクラウドとのハイブリッド構成となっています。

事業拡大の面では、NvidiaGoogleからも出資を受けており、著名な支援者との連携で信頼性を確保しています。最近macOSWindows向けのベータ版をリリースしたほか、Acerと新デバイスへのプリインストール契約を締結しました。今後は他のデバイスメーカーとも同様の提携を目指す方針です。

OSS Mac用AIサーバーOsaurusが注目集める

ローカルとクラウドの統合

ローカル・クラウドAIを自在に切替
ファイルやツールを自端末に保持
仮想サンドボックスで安全性を確保

充実の機能と今後の展望

20以上のネイティブプラグイン搭載
MCP対応で外部クライアントと連携
累計11万超ダウンロード達成
法務・医療など企業向け展開を検討

OsaurusはMac専用のオープンソースLLMサーバーで、ローカルとクラウドの両方のAIモデルを単一インターフェースで切り替えて利用できるのが最大の特徴です。元TeslaおよびNetflixのエンジニアであるTerence Pae氏が共同創業し、デスクトップAIコンパニオン「Dinoki」の開発経験から着想を得ました。ユーザーのファイルやツールをすべて自身のハードウェア上に保持したまま、AIの能力を活用できます。

技術面では、ハードウェア分離された仮想サンドボックス内でAIを実行することでセキュリティを確保しています。OpenClawやHermesといった既存のAIハーネスツールが開発者向けであるのに対し、Osaurusは開発者でも使いやすいUIを提供する点で差別化しています。MCP(Model Context Protocol)サーバーとしても機能し、メール・カレンダー・ブラウザ・Gitなど20以上のネイティブプラグインを搭載しています。

対応モデルはMiniMax M2.5、Gemma 4、Qwen3.6、LlamaDeepSeek V4などのローカルモデルに加え、OpenAIAnthropicGeminiなどのクラウドサービスにも接続可能です。Appleオンデバイス基盤モデルやLiquid AIのLFMファミリーにも対応しています。ただし、ローカル実行には最低64GBのRAMが必要で、大規模モデルには128GB以上が推奨されます。

公開から約1年で累計11万2,000回以上のダウンロードを記録しました。OllamaやLM Studioなどの競合と比較して、非開発者にも親しみやすいオプションとして位置づけています。現在、NYのアクセラレーターAllianceに参加中で、法務や医療など機密性の高い業界向けの企業展開を検討しています。Pae氏はローカルAIの性能向上が続けばデータセンター依存を減らせると展望を語っています。

AIが先回りする新アシスタント「Poppy」登場

Poppyの基本機能

カレンダーやメール等を一元管理
AIが状況を判断し能動的に提案
空き時間に散歩や店を自動推薦

開発背景と展望

元Humaneエンジニアが創業
125万ドルのプレシード調達
将来はオンデバイスAIへ移行目標
データ暗号化とLLM零保持を採用

スマートフォンのアプリやプッシュ通知の洪水に対し、AIで情報を整理する新たなアシスタントアプリ「Poppy」が登場しました。カレンダー、メール、メッセージ、位置情報などを接続すると、AIが今の自分にとって重要な情報を判断し、単一のダッシュボードにまとめて表示します。

最大の特徴はプロアクティブな提案機能です。たとえばカレンダーの30分の空き時間と現在地の近くに公園があることを検知すれば散歩を提案し、友人とのブランチ予定では過去のやり取りから食の好みを考慮してレストランを推薦します。フライトの追跡や服薬リマインドなど、パーソナルアシスタントのように使うこともできます。

開発者のSai Kambampati氏はHCI専門の修士号を持ち、AIハードウェアスタートアップHumaneの元エンジニアです。「AIの進化により、周囲の文脈を察知して先回りするアンビエントコンピューティングがかつてないほど実現可能になった」と語っています。Apple Calendar、Gmail、iMessage、WhatsAppなど主要サービスに対応し、UberやInstacartとも連携します。

サンフランシスコ拠点の4人チームで、Kindred Ventures主導の125万ドルのプレシード資金を調達済みです。DeepMindのLogan Kilpatrick氏もエンジェル投資家として参加しています。ユーザーデータは暗号化して保存され、クラウドLLM利用時にはゼロリテンションポリシーを適用。2〜3年以内にオンデバイスAIへの完全移行を目指すとしています。

Google、AI活用の詐欺対策5施策を発表

AI防御と利用者向けツール

Gmailで毎日150億件の迷惑メール遮断
83億件超の違反広告を削除
通話中の詐欺検知AIをリアルタイム提供
Circle to Searchで不審メッセージ判定

業界連携と犯罪ネットワーク撲滅

Global Signal Exchangeに12億件超の脅威情報
英NCAと連携し西アフリカ詐欺網を摘発
フィッシング業者への法的措置で即日閉鎖
啓発プログラムで700万人保護を目標

Googleは2026年5月、スイス・チューリッヒで開催した第2回EMEA詐欺対策サミットに合わせ、AI駆動の詐欺防止策5項目を発表しました。同社のGoogle Safety Engineering Center(GSEC)が主催し、政府・テック企業・消費者団体・学術機関の専門家が集結しています。

第一の柱はAIによる自動防御です。Gmailでは毎日約150億件のスパム・フィッシングメールを遮断し、99.9%以上の到達を阻止しています。2025年には83億件超のポリシー違反広告をブロックし、うち6億200万件が詐欺関連でした。Androidの「Phone by Google」ではオンデバイスAIが通話中にリアルタイムで詐欺パターンを検知します。

利用者側のツールも強化されました。Security Checkupでパスキーや2段階認証を簡単に有効化でき、Circle to Searchでは不審なテキストメッセージを囲むだけでAIが詐欺の可能性を判定します。教育面では体験型プログラム「Be Scam Ready」を多言語展開し、Google.orgの500万ドル助成で700万人以上の脆弱な利用者の保護を目指しています。

業界横断の取り組みとしては、脅威データの共有基盤Global Signal Exchange(GSE)が中核を担います。現在12億件超のシグナルを蓄積し、AIがパターンを分析して犯罪捜査や法執行に活用されています。英国国家犯罪対策庁(NCA)との連携では、GSE経由の情報をもとに西アフリカの詐欺ネットワークを特定・摘発しました。

法的措置にも積極的で、フィッシング・アズ・ア・サービス業者「Lighthouse」は提訴翌日に運営を停止しました。BadBoxボットネットの運営者にも訴訟を起こしています。Googleはこれらの施策を通じ、AIと官民連携の両輪でオンライン詐欺の根絶を目指す姿勢を鮮明にしています。

Google、Gboardに音声入力AI「Rambler」搭載

Ramblerの主要機能

Gemini基盤の多言語対応音声入力
フィラー語の自動除去と文中訂正理解
コードスイッチングで言語切替に対応
音声データ非保存のプライバシー設計

市場への影響

Gboardの数億人規模の配布網が武器
Wispr FlowやTypelessなど新興勢力に打撃
Galaxy・Pixel限定で夏に提供開始
スタートアップは差別化が急務に

Googleは2026年5月12日、Android向けキーボードアプリGboardに、Geminiベースの音声入力機能「Rambler」を搭載すると発表しました。Android Show: I/O Edition 2026で披露されたこの機能は、「えーと」「あー」などのフィラー語を自動除去し、文中での時刻訂正なども自然に処理します。

Ramblerの大きな特徴は、Geminiベースの多言語モデルによるコードスイッチング対応です。英語からヒンディー語など、文の途中で言語を切り替えても文脈を維持したまま正確に書き起こせます。これは多言語話者の実際のコミュニケーションを反映した機能であり、欧米の音声入力アプリが対応に遅れていた領域です。

プライバシー面では、音声録音を保存せず、オンデバイスクラウドハイブリッド処理を採用しています。Android Core ExperiencesディレクターのBen Greenwood氏は、安全性とプライバシーへの長年の投資を強調し、サードパーティアプリとの差別化を図りました。

市場への影響は大きいと見られます。Wispr Flow、Typeless、Superwhisperなど音声入力スタートアップはデスクトップやiOSで成長してきましたが、Android市場は未開拓でした。Gboardは大多数のAndroid端末にプリインストールされており、Ramblerは数億人規模のユーザーに一気にリーチします。まずSamsung GalaxyとGoogle Pixel向けに夏から提供が始まり、その後他のAndroid端末にも拡大予定です。

プラットフォーム企業がOS層で参入する場合、独立系アプリはより高い精度や独自機能、強固なプライバシー保証といった明確な優位性がなければ生き残りが困難になります。音声入力スタートアップにとって、「良いものを作れるか」ではなく「ユーザーがわざわざ探してまで使いたいものを作れるか」が問われる局面に入りました。

Chromeの4GB AIモデル、2年前から存在も説明不足で混乱拡大

混乱の経緯と実態

Gemini Nanoは2024年から配布済み
4GBモデルの存在に最近気づくユーザー続出
ハード構成やAPI利用状況で配布時期に差

設定変更が不信感を増幅

Chrome 148でプライバシー表記を変更
「データ未送信」の文言が削除
Google側は処理方式に変更なしと説明

オプトアウト方式への批判

同意なく4GBの容量を占有
AI忌避の流れとデフォルト戦略の衝突

Google Chromeが約4GBのGemini Nanoモデルをローカルにダウンロードしていることが一部ユーザーの間で話題となりました。しかしこの機能は2024年に導入されたもので、新たな変更ではありません。Googleの説明不足が混乱を招いた形です。

Googleは2024年にChromeへのオンデバイスAI機能の搭載を発表し、文章作成支援やタブ整理、詐欺検知などに活用してきました。モデルの配布はハードウェア構成やアカウント設定、オンデバイスGemini APIを利用するサイトへの訪問履歴など複数の条件で決まるため、ユーザーごとにダウンロード時期が異なります。そのため最近初めて存在に気づく人が相次ぎ、新機能と誤解されました。

混乱に拍車をかけたのがChrome 148での設定画面の変更です。オンデバイスAIの設定トグルから「データをGoogleのサーバーに送信しない」という記述が削除されました。Googleはデータ処理の仕組み自体に変更はなく、WebサイトのAPIを通じた利用時にサイト側がデータを受け取る点を正確に伝えるための表記見直しだと説明しています。

根本的な問題として、GoogleオンデバイスAIをオプトアウト方式で導入している点が批判されています。ユーザーの明示的な同意なく4GBのストレージを占有しており、AI機能を不要とするユーザーにとっては不本意な状況です。設定画面からオフにすればモデルは削除されますが、そもそも許可を求めるべきだという指摘が出ています。

AI機能への反発が強まる2026年において、Googleデフォルト戦略リスクを伴います。ローカルAI処理はプライバシー面で利点がある一方、ユーザーの選択権を尊重しない導入方法は信頼を損なう要因になり得ます。

Zyphra、8Bパラメータで大規模モデルに迫る推論モデルを公開

ZAYA1-8Bの革新

総パラメータ8B、活性パラメータわずか760M
独自MoE++アーキテクチャ採用
KVキャッシュ8分の1に圧縮
Apache 2.0で商用利用可能

驚異的ベンチマーク性能

AIME '25で91.9%達成
HMMT数学Claude 4.5 Sonnet超え
LiveCodeBenchでDeepSeek-R1超え

AMD基盤と業界への示唆

AMD Instinct MI300で全訓練完了
エッジデバイスへの展開が現実的に

Palo AltoのスタートアップZyphraは2026年5月7日、オープンソースの推論特化型言語モデルZAYA1-8BをApache 2.0ライセンスで公開しました。総パラメータ数は約84億、活性パラメータはわずか7.6億という超効率設計で、AMD Instinct MI300 GPUのみで訓練された点が大きな特徴です。

ZAYA1-8Bは独自のMoE++アーキテクチャを採用しています。圧縮畳み込みアテンション(CCA)によりKVキャッシュを従来の8分の1に削減し、長文脈での推論効率を大幅に向上させました。さらにMLPベースのルーター設計やPID制御に着想を得た安定化手法など、Transformer基盤に根本的な改良を加えています。

最大の技術的突破は推論時の計算手法Markovian RSAです。複数の推論トレースを並列生成し、末尾部分のみを集約して再推論するという手法で、コンテキスト窓を溢れさせずに深い思考を実現します。これによりAIME '25で91.9%、HMMT '25数学89.6%Claude 4.5 Sonnetの79.2%を上回る)、LiveCodeBenchで69.2%DeepSeek-R1-0528超え)という驚異的なスコアを記録しました。

事前学習段階から推論能力を組み込む「推論ファースト事前学習」も特徴的です。長い思考連鎖がコンテキストに収まらない場合、問題設定と最終回答を保持しつつ中間部分を刈り込むAnswer-Preserving Trimmingを開発し、問題と解答の関係を効率的に学習させています。

企業にとっての実用的意義は大きく、活性パラメータ760Mという軽量さオンデバイス展開やエッジ推論を現実的にします。データ所在地の制約やAPI依存コストといった課題を解消し、高度な推論能力をローカル環境で利用可能にします。AMD GPUでの訓練成功は、Nvidia一強への有力な対抗軸が成立することを示しました。2025年にユニコーン評価を得たZyphraは、AMDやIBMの支援のもと「パラメータを増やす」以外のAI進化の道筋を示しています。

Chrome内蔵Gemini Nanoの無断導入が波紋

サイレント導入の実態

2024年から約4GBのAIモデルを自動配布
多くのユーザーが存在自体を認識せず
手動削除しても再起動時に自動再ダウンロード

無効化と影響

設定の「オンデバイスAI」トグルで停止可能
無効化で詐欺検出等のセキュリティ機能も停止
サードパーティのローカルAI APIにも影響

プライバシーの論点

ローカル処理はクラウド送信より高プライバシー
通知不足がユーザー信頼を損なう結果に

GoogleChromeブラウザに組み込んだAIモデルGemini Nanoが、多くのユーザーに認知されないまま約4GBのファイルとして自動ダウンロードされていた問題が注目を集めています。プライバシー研究者の報告をきっかけに、2024年の導入以来ユーザーへの十分な告知がなかったことが広く知られるようになりました。

Gemini Nanoを無効にするには、Chromeの「設定」から「システム」に進み、「オンデバイスAI」のトグルをオフにします。直接ファイルを削除してもブラウザ再起動時に自動で再ダウンロードされるため、必ず設定から操作する必要があります。Googleは2月からこの設定の提供を開始しました。

Googleの広報担当者はWIREDに対し、Gemini Nanoはオンデバイスの詐欺検出開発者向けAPIを実現するためのもので、ユーザーデータをクラウドに送信せずに処理できる利点があると説明しています。Chrome責任者のParisa Tabriz氏も、セキュリティ機能の基盤であることを強調しました。

一方で、セキュリティコンサルタントのDavi Ottenheimer氏は「オンデバイスモデルは隠れた地雷原になりうる」と指摘しています。導入から数カ月間ユーザーが無効化する手段すらなかったことは、当初この機能がユーザーの操作対象として設計されていなかったことを示唆しています。

無効化するとAI詐欺検出が機能しなくなり、サードパーティのオンデバイスAI APIを利用するサイトの動作にも影響が出ます。ローカル処理はクラウド型よりプライバシー面で優位であるため、削除が必ずしも最善とは限らないという複雑な判断を、ユーザーは迫られています。

Google、世界パスワードデーに5つの安全対策ツールを紹介

パスキーと二段階認証

パスキーで指紋・顔認証ログイン
2段階認証でなりすまし防止
生体データは端末内に保持

アカウント管理の簡素化

Googleログインでパスワード削減
復旧連絡先で最大10人を登録可能
パスワードマネージャーで一元管理
パスキーもデバイス間で同期

Googleは2026年5月7日の世界パスワードデーに合わせ、Googleアカウントの安全性を高める5つのツールと設定を公式ブログで紹介しました。パスキー、2段階認証、復旧連絡先、Googleログイン、パスワードマネージャーの5機能で、パスワードに依存しない安全なアカウント管理を推奨しています。

パスキーは2023年の世界パスワードデーにGoogleアカウント向けに提供が開始された認証方式です。指紋や顔認証、PINなど端末のロック解除機能をそのまま使えるため、パスワードより簡単かつ安全にログインできます。生体データはデバイス上に留まり、Googleには共有されません。

2段階認証(2SV)はパスキーと併用することで、第三者がパスキー紛失を偽装した場合にも多要素認証による保護が働きます。また復旧連絡先機能では、信頼できる家族や友人を最大10人登録でき、端末を紛失した際にアカウントへの復帰を支援してもらえます。復旧連絡先がアカウントや個人情報にアクセスすることはありません。

Googleでログイン」機能を活用すれば、新しいアプリやサイトごとにパスワードを作成・記憶する必要がなくなります。他サービスでの情報漏洩リスクも軽減できます。Googleログインに対応していないサイトでは、Googleパスワードマネージャーがパスワードとパスキーの生成・保存・自動入力を担い、デバイス間で安全に同期します。

ChromeのAI機能が4GBのストレージを無断消費

問題の概要

Gemini Nanoのモデルファイルが原因
AI機能有効時に自動ダウンロード
4GBのweights.binがローカル保存
ユーザーへの事前通知なし

対処と背景

ファイル削除だけでは再ダウンロード
設定からオンデバイスAIの無効化が必要
プライバシー重視のローカル処理が前提
Googleはストレージ要件の明示不足

Google Chromeで特定のAI機能を有効にすると、Gemini Nanoのモデルファイル(weights.bin)が自動的にダウンロードされ、約4GBのストレージを消費していることが判明しました。The Vergeが2026年5月6日に報じたもので、多くのユーザーがストレージの不可解な減少に気づいてから問題が表面化しています。

Gemini Nanoは、Chromeの詐欺検出やライティング支援、オートフィル、サジェスト機能などを動かすオンデバイスAIモデルです。クラウドではなくローカルで推論を行うため、学習パラメータをデバイス上に保持する必要があります。これによりプライバシー面の利点はあるものの、ストレージ容量が限られたデバイスでは大きな負担となります。

問題の解決にはファイルの単純な削除では不十分です。AI機能が有効のままだとChromeが再ダウンロードするため、「設定」から「システム」を開き、オンデバイスAIオプションを無効化する必要があります。これにより関連ファイルが削除され、再ダウンロードも防止できます。

Google開発者向けドキュメントで「Gemini Nanoの正確なサイズはブラウザ更新に応じて変動する」と記載していますが、この情報はAI機能を有効化する画面ではなく、長大な技術ガイドの中にしか掲載されていません。機能有効化の時点でストレージ要件を明示するか、クラウドベースの代替オプションを提供していれば、混乱は避けられたはずです。

OpenAIが独自スマートフォンを2027年量産へ

ハードウェアの全容

MediaTek Dimensity 9600カスタム版を搭載
デュアルNPUで言語・視覚タスクを同時処理
強化ISPによる実世界の視覚認識能力
LPDDR6メモリとUFS 5.0ストレージ採用

事業目標と展望

2027年初頭の量産開始を目指す
2027〜2028年の累計出荷約3000万台を想定
Jony Iveデバイスとは別の製品ライン
Samsung旗艦機に匹敵する販売規模

OpenAIChatGPT専用スマートフォンの開発を加速させていることが明らかになりました。サプライチェーンアナリストのMing-Chi Kuo氏が詳細を公開し、同社初のハードウェア製品となるこの端末は2027年初頭の量産開始を目指しているとのことです。以前から噂されていたJony Ive氏との協業によるAIデバイスとは別のプロジェクトとなります。

端末にはMediaTek Dimensity 9600のカスタム版が搭載される予定です。このチップは2026年秋にリリース見込みで、現行のDimensity 9500の後継にあたります。最大の特徴は強化されたHDR対応の画像信号プロセッサ(ISP)で、実世界の視覚認識能力を高める設計です。メモリにはLPDDR6、ストレージにはUFS 5.0が採用されます。

注目すべきはデュアルNPUアーキテクチャの搭載です。これにより言語処理と画像認識といった異なる種類のAI演算を同時に実行できるようになります。ChatGPTのマルチモーダル機能をデバイス上で高速に動作させることを狙った設計と考えられます。

Kuo氏によれば、2027年から2028年にかけての累計出荷台数は約3000万台に達する可能性があるとのことです。この数字はSamsungのフラッグシップモデルの年間販売台数に匹敵する規模であり、ハードウェア初参入の企業としてはきわめて野心的な目標です。AI企業がソフトウェアだけでなくハードウェアまで手掛ける動きが加速するなか、OpenAIがどこまで市場に食い込めるかが注目されます。

Apple CEO交代、クックが9月退任しターナスが後任に

CEO交代の背景

クックが9月に退任し会長職へ
ハードウェア責任者ジョン・ターナスが後任
Apple在籍25年の実務型リーダー

新CEOの最大課題はAI

Apple Intelligenceは期待以下の評価
キラーAI製品の投入が急務
ジョニー・スロウジがハード部門SVPに昇格
独自AIチップ戦略が鍵を握る

変わるAppleの事業環境

App Store手数料30%への圧力増大
AI生成アプリがエコシステムを変容

ティム・クックが2026年9月にApple CEOを退任し、取締役会の執行会長に就くことが明らかになりました。後任には、ハードウェアエンジニアリング担当上級副社長のジョン・ターナス氏が就任します。クック氏は2011年のスティーブ・ジョブズ後任以来15年にわたりAppleを率い、AirPodsなどのヒット製品を生みサプライチェーン経営で時価総額を飛躍的に伸ばしました。

新CEOターナス氏にとって最大の課題はAI戦略の立て直しです。2024年に発表されたApple Intelligenceは「期待はずれ」との評価が多く、AIエージェント技術が急速に進む中、Appleは出遅れています。WIREDのスティーブン・レヴィ氏は「iPhoneがモバイルを定義したように、AIを一般消費者向けに解き明かす製品が必要だ」と指摘しています。

人事面では、ターナス氏の後任としてAppleのシリコン戦略を率いてきたジョニー・スロウジ氏がハードウェアエンジニアリング担当SVPに昇格しました。AppleはBroadcomとのAIチップ開発も進めており、より強力なニューラルエンジンをデバイスに搭載することで、プライバシーを守りながらオンデバイスAIの性能を引き上げる戦略を描いているとみられます。

一方で、ターナス氏が引き継ぐAppleの事業環境はクック時代とは大きく異なります。App Storeの30%手数料に対する規制圧力が強まり、開発者に対するAppleの支配力が揺らいでいます。さらに、AIを活用した「バイブコーディング」アプリの台頭がプラットフォームの在り方そのものを変えつつあり、エコシステム全体の再設計が求められています。

テック業界はこのCEO交代を、Apple史上最大の転換点の一つと捉えています。ターナス氏は実直な実務家タイプとされていますが、Appleの価値基準を体現する感覚を持つと自負しています。AIがiPhoneのエコシステムを根底から変える可能性がある中、新CEOがどのようなビジョンを示すかに注目が集まっています。

Nothing、AI音声入力ツールを発表

機能と特徴

システムレベルで全アプリ対応
フィラー語の自動除去
カスタム音声ショートカット設定
100以上の言語に対応

展開と展望

Phone (3)で先行提供開始
Phone (4a) Proへ今月中に展開
アプリ別トーン調整機能を予定
Google等も類似ツール開発中

英スマートフォンメーカーのNothingは2026年4月24日、AI搭載の音声入力ツール「Essential Voice」を発表しました。同ツールはデバイス上のあらゆるアプリで動作し、音声をフォーマット済みテキストに変換します。Wispr FlowやSuperwhisperなどの競合製品がひしめくAI音声入力市場に、ハードウェアメーカーとして参入した形です。

Essential Voiceの特徴は、「um」「ah」といったフィラー語を自動で除去する点に加え、ユーザーが独自の音声ショートカットを設定できる点にあります。たとえば「my address」と発話するだけで、登録した住所全文を入力できます。Essentialキーまたはキーボードから起動する仕組みです。

対応端末はまずPhone (3)からスタートし、今月中にPhone (4a) Pro、来月にはPhone (4a)へと順次展開される予定です。100以上の言語をサポートし、音声入力しながら別言語へのリアルタイム翻訳も可能です。

今後はアプリカテゴリごとにAI編集のトーンを切り替える「アプリベースカスタムスタイリング」機能も追加予定です。仕事用とメッセージ用で文体を自動調整できるようになります。

NothingはOS統合型の音声入力を提供する数少ないハードウェアメーカーの一つです。Googleも4月初旬にオフラインAI音声入力アプリをリリースしており、今後同様のシステムレベル統合が業界全体で広がる可能性があります。

Gemma 4 VLA、8GBのJetsonで音声・視覚応答を実現

エッジ上のVLA構成

8GBのJetson Orin Nanoで動作
音声認識・TTS・視覚を統合
llama.cppでQ4量子化モデルを使用
ツール呼び出しで自律的に判断

デモの仕組みと導入

Parakeet STTで音声をテキスト化
必要時のみウェブカメラを起動
Kokoro TTSで音声応答を生成
単一スクリプトで環境構築可能

GoogleGemma 4 VLA(Vision-Language-Action)モデルが、わずか8GBメモリNVIDIA Jetson Orin Nano Super上で動作するデモが公開されました。音声入力から視覚認識、音声応答までを一台のエッジデバイスで完結させるチュートリアルで、NVIDIAのAsier Arranz氏がHugging Faceブログで詳細な手順を紹介しています。

デモの構成は、Parakeet STTによる音声認識、Gemma 4による推論、Kokoro TTSによる音声合成を組み合わせたパイプラインです。ユーザーがスペースキーを押して質問を話すと、モデルが質問内容を解析します。視覚情報が必要と判断した場合は、自律的にウェブカメラを起動して撮影し、画像を踏まえた回答を生成します。

技術的なポイントは、llama.cppを使ったローカル推論サーバーの構築です。モデルはQ4_K_M量子化版のGGUFフォーマットで提供され、ビジョンプロジェクターと合わせてGPUにオフロードされます。--jinjaフラグによりGemmaのネイティブツール呼び出し機能が有効化され、キーワードマッチングではなくモデル自身が視覚の必要性を判断する仕組みです。

導入手順はシステムパッケージのインストール、Python環境の構築、メモリの最適化、llama.cppのビルド、デバイスの設定、デモの実行という6ステップで構成されています。8GBという限られたメモリを最大限活用するため、スワップの追加やDocker・不要プロセスの停止といったメモリ管理の工夫も紹介されています。

テキストのみで試したい場合は、NVIDIA公式のDockerイメージを使ったワンライナーでの起動も可能です。ただしDocker版はビジョンプロジェクターを読み込まないため、VLAデモのフル機能は利用できません。エッジデバイス上でマルチモーダルAIを手軽に体験できる実践的なチュートリアルとなっています。

Adobe Premiere新カラーグレーディング機能、NVIDIA GPU加速で32bit処理実現

Color Modeの主要機能

Premiere内蔵のカラーグレーディング環境
32bit色深度で初の高精度処理
6ゾーンの輝度調整に対応
文脈対応スコープとHUDオーバーレイ搭載

GPU活用と関連発表

GeForce RTX・RTX PRO系で高速化
Project G-Assist v0.2.1も同時更新
NAB Show 2026で正式発表
Filmora等他社ツールもNVIDIA連携強化

NVIDIAは2026年4月18日から22日にラスベガスで開催されるNAB Show 2026に合わせ、AdobePremiereの新機能「Color Mode」をベータ版として発表することを明らかにしました。この機能はNVIDIA RTX GPUによるアクセラレーションを活用し、映像制作者がPremiere内で直接カラーグレーディングを行える専用環境を提供します。6万人以上のコンテンツプロフェッショナルが集まる同イベントで披露されます。

Color Modeは、Premiere内にネストされた専用グレーディング環境として設計されています。大型のプログラムモニターが中心に配置され、調整結果を即座に視覚的にフィードバックすることで、迅速な判断と精密な操作を可能にします。クリップグリッドビューにより、シーケンス内のショット間の一貫性を維持しやすくなっています。

技術面では、32bit色深度での処理に初めて対応し、最大限の色再現性を実現しています。従来のハイライト・ミッドトーン・シャドウの3ゾーンモデルを超え、最大6つの輝度調整ゾーンを利用できます。双方向コントロールやマルチゾーントーナルシェーピング、スタック型カラー操作など、すべての処理がNVIDIA GPU上で実行されます。

NVIDIAはあわせて、デバイス上で動作するAIアシスタントProject G-Assist」のv0.2.1アップデートも発表しました。ゲーム設定の高度な検出システムと知識システムの強化により、eスポーツやAAAタイトルの設定調整でより高精度な助言が可能になっています。DLSS Overrides、Smooth Motion、RTX HDRなどNVIDIA Appの高度な機能も制御対象に加わりました。

そのほかNAB関連の動向として、WondershareのFilmoraがNVIDIA Broadcast技術を活用したアイコンタクト補正機能を追加したほか、UnslothとNVIDIAの協力によりファインチューニング性能が15%向上したことも報告されています。GoogleGemma 4モデルファミリーもNVIDIA GPU向けに最適化され、RTX搭載PCからJetson Orin Nanoまで幅広いデバイスで効率的に動作します。

Google医療AIコンペMedGemma受賞者を発表

主要受賞プロジェクト

EpiCast:西アフリカの疾病監視支援
FieldScreen AI:結核スクリーニング
Tracer医療ミス防止ワークフロー

技術特別賞と展望

BridgeDX:災害時オフライン診断支援
CaseTwin:胸部X線の類似症例照合
BigTB6音声駆動の結核・貧血検査
850超チームがHAI-DEF活用で参加
途上国の医療格差解消に焦点

Googleは、医療AI開発者向けオープンモデル基盤「Health AI Developer Foundations(HAI-DEF)」プログラムの一環として開催した「MedGemma Impact Challenge」の受賞者を発表しました。Kaggleと共催した本コンペには850以上のチームが参加し、医療課題の解決に挑みました。

グランプリのEpiCastは、西アフリカ経済共同体の疾病監視の空白を埋めるモバイルファーストのソリューションです。ファインチューニングしたMedGemmaモデルにMedSigLIPやHeARを組み合わせ、地域言語による臨床観察をWHOの統合疾病監視・対応シグナルに変換し、感染症アウトブレイクの早期発見を支援します。

FieldScreen AIは、リソースが限られた環境向けの結核スクリーニングワークフローです。MedGemmaによる胸部X線解析とHeARベースの咳音声分類を組み合わせ、完全にオンデバイスで動作します。Tracerは医師のメモから仮説を抽出し、検査結果と照合することで医療ミスの防止を目指します。

技術特別賞では3テーマが表彰されました。BridgeDXは2015年ネパール地震の経験から着想を得たオフライン診断支援デモで、WHOやMSFのガイドラインに基づきます。CaseTwinエージェントワークフローで胸部X線の類似症例を照合し、農村部の病院での紹介プロセスを数時間から数分に短縮します。

本コンペは、HAI-DEFオープンウェイトモデルが世界中の医療格差解消に大きな可能性を持つことを示しました。Googleは2024年末にHAI-DEFを立ち上げ、2025年1月にはMedGemma 1.5を公開しており、今後も開発者コミュニティとの連携を通じて医療AIの民主化を推進する方針です。

Amazon、Alexa搭載スマートフォン再参入を計画

端末の概要

コードネーム「Transformer
Light Phoneから着想の簡素設計
従来型アプリストア不要の可能性
ミニアプリ方式を検討中

課題と懸念

AppleSamsung独占市場への挑戦
プライバシー問題の根深い歴史
関税・供給網混乱によるコスト増大

AmazonがFire Phone撤退から10年以上を経て、Alexa+AIアシスタントを中核に据えた新型スマートフォンの開発を進めていることが、Reutersの報道で明らかになりました。コードネーム「Transformer」と呼ばれる同端末は、社内のZeroOneグループが開発を主導しています。

開発チームを率いるのは、MicrosoftでZuneやXboxを手がけたJ・アラード氏です。チームはスマートフォンと「ダムフォン」の両方のデザインを検討しており、白黒ディスプレイとアプリストア非搭載が特徴のミニマリスト端末Light Phoneからインスピレーションを得ているとされます。

2014年に発売された初代Fire Phoneはアプリ不足と低調な売上により1年で撤退に追い込まれました。今回はChatGPTのようなミニアプリ方式を採用し、従来型アプリストアへの依存を回避する戦略が検討されています。AIが生成するUIにより、アプリそのものが不要になる可能性も示唆されています。

市場アナリストからは厳しい見方も出ています。IDCのジェロニモ副社長は「ハードウェアAppleSamsungに対抗するのは不可能」と指摘し、メモリ危機や関税による製造コスト上昇も懸念材料に挙げました。一方で、Alexa+を搭載した常時携帯型のコンパニオンデバイスとしての可能性には一定の評価を示しています。

プライバシー面では、Amazonデジタル権利ランキングで下位に位置し、Alexa音声データの広告利用が過去に指摘されている点が大きな課題です。専門家は、スマートフォン参入によりデータ収集の規模が飛躍的に拡大し、広告事業強化の手段となる可能性を警告しています。発売時期や価格は未定で、計画自体が中止される可能性も残されています。

Perplexity、Mac常駐型AIエージェント「Personal Computer」発表

製品の主な特徴

Mac Mini上で24時間常駐稼働
ローカルファイルとアプリに直接アクセス
任意デバイスから遠隔操作が可能
操作の監査証跡と承認機能を搭載

競合との差別化

OpenClawより安全性を訴求
誤操作時の取り消し機能搭載
キルスイッチで暴走を防止

提供状況と展望

現在招待制の早期アクセス段階
CEO「一人で10億ドル企業構築可能」と主張

Perplexityは2026年3月、Mac上でローカル稼働するAIエージェントツール「Personal Computer」を発表しました。同ツールは専用デバイス上で24時間稼働し、ユーザーのファイルやアプリに直接アクセスして業務を自律的に遂行します。

Personal Computerは、先月発表されたクラウド型の「Perplexity Computer」をローカル環境に拡張した製品です。ユーザーは具体的な操作指示ではなく、「投資家へのメール作成」「レポートのスライド化」といった目的レベルの指示を与えるだけで、AIが自律的にタスクを完了します。

セキュリティ面では、競合のオープンソースツールOpenClawとの差別化を強調しています。全操作の監査証跡を提供し、機密性の高い操作は事前承認を求める仕組みを備えます。さらにキルスイッチを搭載し、エージェントの暴走リスクに対応しています。

現時点ではウェイトリストによる招待制の早期アクセス段階にあり、正式な提供開始時期は未定です。対応ハードウェアはMac Miniが示されていますが、その他のプラットフォームへの対応は明らかにされていません。

CEOのAravind Srinivas氏はX上で、「人間最大の弱点である睡眠を克服し、一人で10億ドル企業を構築できる」と野心的なビジョンを語りました。プロフェッショナル用途を主軸としつつ、コンシューマー市場への展開も視野に入れた戦略が見て取れます。

NXPがロボットAIのエッジ実装手法を公開

データ収集の要点

カメラ固定とコントラスト確保
グリッパーカメラの併用推奨
作業空間を分割し多様なエピソード収録
失敗リカバリ動作を20%含める

エッジ最適化と成果

VLAモデルをブロック分割し個別最適化
量子化でレイテンシ2.86秒→0.32秒
非同期推論で連続動作を実現
i.MX 95で精度96%を達成

NXPは2026年3月5日、組み込みプラットフォーム上でロボットAIを動作させるための実践ガイドをHugging Faceと共同で公開しました。データ収録からVLAモデルの微調整、オンデバイス最適化までの一連の手法を体系的に示しています。

Vision-Language-Action(VLA)モデルは、視覚と言語の理解に基づきロボットの動作を生成する次世代技術です。しかし組み込み環境では計算資源やメモリ、消費電力の制約があり、リアルタイム制御との両立が大きな課題となっています。

データ収集ではカメラの固定設置、照明の統一、対象物とのコントラスト確保が重要とされています。特にグリッパーに装着したカメラが精密操作の成功率を大幅に向上させることが確認されました。作業空間を11クラスタに分割し、各クラスタで多様な開始位置を記録する手法が推奨されています。

最適化ではVLAモデルをビジョンエンコーダ、LLMバックボーン、アクションエキスパートの3ブロックに分解し、それぞれ独立に量子化を適用しました。ビジョンとLLM部分は4〜8ビット量子化が可能な一方、ノイズ除去を繰り返すアクション部分は高精度を維持する必要があります。

NXP i.MX 95プロセッサ上でACTポリシーを実行した結果、最適化モデルで推論レイテンシ0.32秒、テストセット精度100%、全体精度89〜96%を達成しました。非同期推論により動作中に次の指令を並行生成でき、滑らかなロボット制御を実現しています。今後はシミュレーション環境や強化学習を活用し、より複雑なタスクへの展開を目指します。

llama.cppがHFに合流して機能強化

ローカルAI基盤の統合

Georgi Gerganov率いるGGMLチームがHFに合流
llama.cppは最も広く使われるローカル推論エンジン
HuggingFace傘下でコミュニティ規模の拡大を目指す
GGML形式がGGUFフォーマットとして業界標準に確立
商業利用・研究利用双方でのオープン推進が継続

ローカルAIエコシステムへの影響

エッジ・オンデバイス推論の民主化が加速
クラウドへの依存を減らすプライバシー重視AIが普及
企業向けオンプレAI展開の標準スタックとして定着
HFのモデルハブとの深い統合でアクセスが容易に
コミュニティ持続性の確保が長期課題

Hugging Faceは、最も影響力のあるローカルAI推論フレームワークであるGGMLとllama.cppの開発者Georgi Gerganovとそのチームを迎え入れたと発表しました。この統合は、ローカルAI推論エコシステムの長期的な発展を担保する重要な動きです。

llama.cppは、MacのM系チップからRaspberry Piまで幅広いデバイスでLLMを実行できるフレームワークとして、ローカルAI革命の立役者となってきました。GGUF形式はモデルの量子化・配布の事実上の標準フォーマットとして採用されています。

HuggingFaceとの統合により、GGMLチームはHFの広大なモデルハブ、コミュニティ、インフラを活用できるようになります。一方、HFにとってはオンデバイスAI分野での存在感を大幅に強化できるメリットがあります。

ローカルAIの重要性はプライバシー保護、オフライン利用、低コスト展開の観点から高まり続けています。企業がクラウドAIコストに悩む中、オンプレミスLLMの需要は急速に拡大しており、llama.cppはそのユースケースで中心的役割を担っています。

この統合はオープンソースAIエコシステムの成熟を示す重要なマイルストーンです。商業的に成功したHFがコミュニティ主導の重要プロジェクトを取り込むことで、オープンソースの持続可能性モデルの新たな形を示しています。

Reface創設者がオンデバイスAI最適化を創業

オンデバイスAIの強化

Reface・Prisma創設者が新会社設立
オンデバイスモデルの高速化
エッジAIの新手法開発

動画顔交換アプリRefaceと写真フィルターアプリPrismaの共同創設者たちが、オンデバイスAIモデルの性能向上に特化した新スタートアップを設立しました。

スマートフォンやエッジデバイスで動作するAIモデルの高速化・軽量化技術を開発しており、クラウドへの依存を減らしながら高度なAI機能を実現することを目指しています。

NvidiaとGroqがリアルタイムAI推論競争、企業の勝敗を決める速度戦

リアルタイム推論の重要性

応答遅延が企業AIの競争力を左右
GroqLPUアーキテクチャが高速推論をリード
NvidiaのH200・Blackwellが追撃
ミリ秒単位の差がユーザー体験を決定

企業への実装示唆

遅延予算を明確に定義することが重要
ストリーミング応答で知覚遅延を低減可能
推論インフラの選択がコア競争力に
エッジ展開と中央集権型の使い分けが鍵

記事は古代ピラミッドの比喩を用いながら、AIリアルタイム推論の重要性と、NvidiaGroqがこの分野でどのように企業向け市場を争っているかを分析しています。

GroqLPU(Language Processing Unit)という専用アーキテクチャにより、汎用GPUよりも大幅に高速なテキスト生成を実現しています。1秒あたりのトークン生成数Nvidia GPUを凌駕するデモが注目を集めています。

NvidiaはH200やBlackwellシリーズで推論性能を向上させながら、CUDAエコシステムという強固な参入障壁を維持しています。エンタープライズ市場での信頼性・サポート体制Groqを圧倒しています。

企業が推論インフラを選ぶ際には、ピーク遅延、スループット、コスト、信頼性を明確に定義した上で選択することが重要です。遅延バジェットを設定し、それに基づいてアーキテクチャを選ぶアプローチを推奨しています。

長期的には、エッジデバイス上での軽量モデル実行と、クラウド上の高性能モデルを使い分けるハイブリッド推論が主流になると見られており、企業はその両方に対応できる柔軟な設計が求められます。

Appleの改良型Siriが再び延期、AI競争で遅れ鮮明に

延期の実態

iOS 26.4向け機能が26.5以降に先送り
AI強化Siriをめぐる2年越しの遅延が継続
ライバル各社AIとの格差拡大を招く懸念

戦略的影響

Apple Intelligenceの旗艦機能が未実装のまま
WWDC発表と実際の提供時期の乖離が深刻
ユーザーの信頼低下リスクが高まる

Appleは改良型Siriの主要機能をiOS 26.4に導入する計画でしたが、再び延期が報じられています。新機能はiOS 26.5やiOS 27での提供に後ずれする見通しで、Apple Intelligenceの目玉とされていた機能の実現がいつになるか不透明な状況です。

Appleは2024年のWWDCでAI強化版Siriを大々的に発表して以来、約2年間にわたり継続的な遅延に苦しんでいます。OpenAIGoogleなどの競合がリアルタイム音声AIを次々と商用化する中、Siriの遅れは戦略的なリスクへと発展しています。

エンジニアリングの複雑性とプライバシー要件の両立が、開発を難しくしていると言われています。特にオンデバイス処理とクラウドAIの統合において、品質基準を満たすことができていないとの指摘があります。

今回の延期はAppleにとって単なる製品スケジュール問題にとどまらず、AI時代におけるブランド価値にも影響を及ぼしかねません。iPhoneの購買動機としてAI機能を重視する消費者層の期待を裏切ることで、販売に影響する可能性があります。

業界アナリストは、AppleがAI競争において後手に回っていると分析しています。完璧主義的なアプローチと市場投入速度のバランスをいかに取るかが、今後のAppleの課題となります。

MistralがオープンソースVoxtral音声モデルと超高速翻訳モデルを公開

新モデルの特徴

Voxtral Transcribe 2をオープンソース公開
オンデバイス動作で低コスト実現
高速翻訳モデルが大手AIに匹敵
数セント音声処理を実現
プライバシー保護のエッジ処理対応
多言語対応の幅が大幅拡大

開発者・企業への影響

オープンウェイト自社サービス統合可能
コスト効率クラウドAPIへの代替
リアルタイム翻訳アプリ開発が加速

Mistralは2026年2月4日、オープンソースの音声文字起こしモデル「Voxtral Transcribe 2」と超高速翻訳モデルを相次いで公開した。

Voxtral Transcribe 2はオンデバイスで動作し、処理コストが数セント程度と非常に低く、プライバシーを重視するアプリケーション開発者にとって魅力的な選択肢となる。

翻訳モデルはWiredの報道によると、OpenAIGoogleなど大手企業のモデルに匹敵する速度と精度を実現しており、オープンソースの競争力を示した。

両モデルともにHuggingFace経由でダウンロード・利用可能であり、開発者は自社サービスに統合することでクラウドAPIコストを削減できる。

Mistralのオープンソース戦略は欧州発AIの競争力を示すものとして注目されており、日本企業にとっても活用しやすいモデルの登場となった。

QualcommがSpotDraftのオンデバイスAI法律契約支援に出資

投資の概要

QualcommSpotDraftに出資
評価額2倍に上昇
オンデバイスAIの法律業務応用

オンデバイスAIの可能性

エンタープライズ法律AIの市場拡大
Snapdragonチップとの連携

Qualcommは契約管理AI企業SpotDraftに出資し、Snapdragonチップ上でオンデバイスで動作する法律AIの開発を支援します。評価額は2倍に上昇しました。

オンデバイス処理により機密法律文書クラウドに送信されないため、企業のプライバシーセキュリティ要件を満たしつつAIの恩恵を受けられます。

AppleがAI競争で周回遅れになった後、本当の挑戦が始まる

Appleの現状評価

Apple Intelligence の機能が競合に遠く及ばず
SiriGemini採用が独自AI限界を露呈
ハードウェア優位性だけでは不十分
AI時代の主導権をGoogleOpenAIに奪われる
独自LLM開発の遅延が競争力に直結

今後の課題と対策

エコシステム閉鎖性とAI開放性のジレンマ
プライバシー重視という戦略的定位を維持
オンデバイスAIでの差別化が重要
大型AI買収提携を検討か
デバイス販売への影響が深刻化リスク

複数のアナリストやメディアが、AppleがAI競争において本質的に出遅れていることを分析しています。SiriChatGPTGeminiと比べて大幅に見劣りし、最終的にGeminiSiriの基盤として採用するという判断自体が、Apple Intelligenceの限界を公式に認めるものです。

Appleプライバシー重視というポジショニングでオンデバイスAI処理を差別化戦略として活用しようとしていますが、クラウドAIとの性能差は顧客体験の差として直接現れています。ハードウェアの優位性だけでAI時代を乗り切れるかは疑問視されています。

今後のAppleの真の課題は単なる性能向上ではなく、AI時代のユーザー体験における独自の価値をどう定義するかです。プライバシーセキュリティエコシステム統合の観点から独自の立場を確立できるかが今後数年の競争力を左右します。

フィジカルAIが自動車産業を変革する——CES後の最新分析

自動車×AIの変革ロードマップ

Wiredが「フィジカルAIが自動車を変える」特集記事を掲載
センサーフュージョン・オンデバイス推論が成熟化
レベル2+から3への移行タイムラインが具体化
AI搭載ECUが車の知能化を本格的に担う時代へ
OEMとAI半導体企業の提携が相次ぐ
2026年から2028年が本格的な車載AI革命の期間

Wiredの特集記事は、「フィジカルAI」という概念が自動車産業でどのように具現化しているかを詳しく分析しています。NvidiaのDrive ThorQualcomm Snapdragon Ridgeなどの次世代車載AI半導体が、センサーフュージョン・自律走行判断・乗客インタラクションを統合的に処理できるようになりました。

CES 2026での各社発表を踏まえ、L2+(運転支援)からL3(特定条件下の完全自律)への移行が2026〜2028年に具体化すると見込まれています。トヨタ・BMW・Mercedes-Benzなど主要OEMがNvidiaQualcommとのパートナーシップを強化し、AI搭載ECUの車両統合を進めています。

日本の自動車産業にとっても、AI半導体の選択と車載ソフトウェア開発能力の構築が競争力を決める重要な局面です。ソフトウェア定義車両(SDV)への移行にAIが不可欠な要素として組み込まれています。

DellがAI PC消費者の無関心を公式認定——製品戦略の転換を迫られる

消費者離れの背景と実態

DellのCEOが「消費者はAI PCに無関心」と公式認定
AI PCのマーケティングが消費者に届いていない現実
高価格帯にもかかわらずAI機能の使用率が低い
エンタープライズ市場に軸足を移す戦略的シフト
Intel・AMDとの協調マーケティングの見直しを検討
Windows AI機能の普及が期待以下に止まる

AI PCエコシステムへの示唆

キラーアプリ不在が需要停滞の根本原因
ハードウェア先行でソフトウェアが追いつかない課題
Microsoftのローカルオンデバイス戦略の再考が必要
NPUの差別化が消費者に伝わっていない
PCメーカー各社の販売戦略の見直しを促す
B2B向けAI PC需要は堅調で二極化が進む

DellのMichael Dell CEOは公式に「消費者はAI PCの機能に関心を持っていない」と認め、業界に衝撃を与えました。AI PC市場を牽引するはずだったNPU(Neural Processing Unit)搭載モデルが、プレミアム価格にもかかわらず消費者の心を掴めていない実態が明らかになりました。

この発言は、IntelのCore Ultra、AMD Ryzen AI、QualcommのSnapdragon Xなど各社がAI PCを推進してきた2024〜2025年のマーケティング戦略の限界を示しています。キラーアプリケーションの欠如が最大の障壁で、ハードウェアの準備はできても使いたい体験が提供されていないことが原因です。

Dellはエンタープライズ向けのAI PC需要が堅調であることを踏まえ、B2Bセグメントへの注力を強化する方針です。AI PCの一般消費者への普及には、Copilot+のような具体的な価値提案が不可欠であり、ソフトウェアとユースケースの充実が最優先課題となっています。

CaterpillarがNvidiaとエッジAIで建設機械をスマート化

Caterpillar × Nvidiaの提携内容

建設機械へのエッジAI搭載を共同で推進
Nvidia Jetsonプラットフォームを重機に組み込む
リアルタイム作業最適化と予知保全を実現
機械の自律化・半自律化を段階的に実現
鉱山・建設・インフラ整備現場での活用を想定
人手不足が深刻な建設業界の課題解決に貢献

産業AIの普及に向けた意義

フィジカルAIの代表的な実用事例
過酷環境での信頼性を確保した堅牢な設計
低遅延処理でリアルタイム安全管理が可能
Caterpillarの広大なグローバル機材台数を活用
建設DXを加速するエコシステムの構築
製造業でのAI活用が他産業にも波及

世界最大の建設機械メーカーCaterpillarが、Nvidia提携して重機へのエッジAI統合を進めると発表しました。Nvidia Jetsonプラットフォームをブルドーザーや油圧ショベルなどの大型重機に搭載し、リアルタイムの作業最適化・予知保全・安全管理を実現します。

建設現場は変化の激しい非構造化環境であり、オンデバイスでのリアルタイムAI推論が不可欠です。クラウドへの接続が困難な鉱山・遠隔地建設現場でも動作する堅牢なエッジAIシステムとして、過酷な環境条件にも対応しています。

建設業界では深刻な人手不足と安全事故削減が急務であり、AI搭載重機は作業員の補助・代替だけでなく、危険作業の自動化による安全性向上も期待されます。Caterpillarのグローバルな機材台数を活かした大規模展開が見込まれ、産業AIの重要な先進事例となっています。

ReolinkがローカルAIハブで監視カメラの月額不要化を実現

プライバシー重視の設計思想

Reolink AI BoxがCESでローカル処理AIハブを発表
クラウドサブスクリプション不要でAI機能を利用可能
動体検知・人物認識・車両識別をローカルで処理
映像データがクラウドに送信されないため高いプライバシー
家庭・中小企業向けの費用対効果の高い選択肢に

セキュリティカメラ市場への影響

クラウド依存型のビジネスモデルへの挑戦
継続課金なしで高度なAI機能を提供
映像処理のリアルタイム性が向上
ネット環境に依存しないオフライン動作も可能
Arlo・Ringなどのクラウド型競合との差別化
IoTセキュリティ設備のAI化に新しい方向性

Reolinkが発表したAI Boxは、監視カメラのAI機能をクラウドではなくローカルで処理するハブデバイスです。QualcommEdge AIチップを搭載し、動体検知・人物認識・車両識別などの機能をサブスクリプション料金なしで利用できます。

月額料金が必要なArloやRingなどのクラウド型競合との差別化として、プライバシー重視とコスト効率を前面に打ち出しています。映像データが自宅のネットワーク内で完結するため、データ流出リスクが根本的に低減されます。

IoTセキュリティ機器のAI化において、クラウド課金モデルに代わるローカル処理モデルが選択肢として確立されつつあります。特に映像プライバシーを重視するユーザー層や、サブスクリプションコストを削減したい中小企業にとって魅力的な選択肢となっています。

AMD、CES 2026でAI PC向け新プロセッサを発表

Ryzen AI PC向け新アーキテクチャ

Lisa SuがCESキーノートでRyzen AI新世代を発表
NPU性能を大幅に向上させた最新アーキテクチャ
一般用途とゲーミング向けの2ラインを展開
Windows Copilot+との統合を最適化
ローカルAI処理でプライバシーとパフォーマンスを両立
QualcommIntelとのAI PC競争が本格化

AI PCエコシステムの成熟

PC搭載NPUがAI処理の主役に
クラウド依存なしのオンデバイスAIが普及段階へ
ゲーミング向けでAIフレーム補間精度が向上
電力効率向上でノートPCのバッテリー寿命延長
AIモデルのローカル実行が一般ユーザーに開放
対応アプリの増加がエコシステムを拡大

AMDのLisa Su CEOがCES 2026のキーノートでRyzen AIの新世代プロセッサを発表した。NPU(ニューラルプロセシングユニット)の性能を大幅に向上させ、一般用途とゲーミングの両カテゴリー向けに展開する。

新プロセッサはMicrosoftWindows Copilot+認定要件を大幅に上回る性能を持ち、ローカルでのStable Diffusion・Phi-3・Llamaなどの推論を快適に実行できる。クラウドに頼らないプライベートなAI処理が一般ユーザーに開放される。

ゲーミング向けプロセッサでは、AIフレーム生成技術の精度とレスポンスが向上し、低スペックのGPUでも高品質なゲーム体験が可能になる。AMDのFSR(FidelityFX Super Resolution)とAIの組み合わせがさらに進化した。

AI PCの競争ではQualcomm(Snapdragon X)・Intel(Meteor Lake後継)との激しい競合が続いている。AMDは特にx86アーキテクチャの互換性と高い実行性能を武器に、既存のWindowsソフトウェア資産を活かした差別化を図る。

電力効率の向上も注目点で、同等のAI処理性能を前世代より低い消費電力で実現するとされる。ノートPCでの長時間AI処理が可能になることで、モバイルワーカーにとっての実用性が大幅に向上する見込みだ。

GemmaとHF v5が新展開を加速

Gemmaの新バリアント

FunctionGemmaエッジ公開
T5Gemma 2が長文脈対応
累計DL3億件超を達成

研究・ツールの進展

MITが学習不適を覆す実験
HF v5で設計刷新
Kaggleで5日集中講座
C2Scaleで癌研究応用

GoogleGemmaモデルの新バリアント「FunctionGemma」を公開しました。エッジデバイス上でのカスタム関数呼び出しに特化した軽量設計で、オフライン環境での活用が広がります。

「T5Gemma 2」はGemma 3基盤のエンコーダー・デコーダーモデルで、マルチモーダル処理と長文脈への対応を初めて実現しており、文書分類や翻訳タスクでの活用が期待されています。

MITのCSAIL研究チームは、これまで学習不適とされてきたニューラルネットワークも短期間のガイダンスで効果的に学習できることを実験的に実証し、従来の通説を覆しました。

Hugging FaceTransformers v5でトークナイザーの設計を大幅に刷新し、学習済み語彙との分離によってコードのモジュール性を高め、カスタマイズと保守の容易さを向上させました。

KaggleとGoogleが共催した5日間のAIエージェント集中講座には世界中から多数の参加者が集まり、実践的なAI教育への高い需要と世界的なAI学習熱の高まりを改めて示しました。

Gemmaファミリーの累計ダウンロード数は3億件を突破しており、一般的なNLPタスクを超えて癌研究(C2Scale)など高度に専門化された科学的応用も着実に増加しています。

AdobeにAI学習の著作権集団訴訟

Adobeへの著作権集団訴訟

Adobe海賊版書籍でAIモデルを学習したと訴訟
問題のSlimPajamaデータセットにBooks3が含まれると主張
同様の訴訟がAppleSalesforceにも拡大
Anthropicは類似訴訟で15億ドルの和解に合意

AI時代の創造性論争

Wicked監督Chuが人間の即興こそ映画の美しさと主張
AIツールの利便性と創造的原罪を対比
雨中の撮影など予期せぬ瞬間がアートを生む

Adobe著作権侵害を主張する集団訴訟に直面しています。オレゴン州の作家Elizabeth Lyonが原告となり、AdobeオンデバイスAIモデル「SlimLM」の学習データに彼女の著作物が無断使用されたと訴えています。

訴状によれば、AdobeはSlimPajama-627Bデータセットを学習に使用しており、このデータセットは著作権問題で知られるBooks3を含むRedPajamaデータセットの改変版であるとされています。Books3は19万1000冊の書籍データを含むデータセットで、GenAI学習に広く使用されてきました。

同様の訴訟はAppleApple Intelligenceの学習データ問題)やSalesforceにも提起されており、AI学習データにおける著作権問題は業界全体の課題となっています。AnthropicClaudeの学習データに関する類似訴訟で2025年9月に15億ドルの和解に合意しており、業界の転換点とみられています。

一方でWicked映画の監督Jon M. Chuは、AI時代における芸術の本質について深い見解を示しました。生成AIは有用なツールであると認めつつも、スクリプトには書けないような予期せぬ瞬間、例えば雨中の撮影でカメラを役者に近づけた瞬間こそがアートを本物にすると語っています。

Chuは生成AIが学習データの「原罪」(同意なしの大規模データマイニング)を抱えており、アーティストにとってそれを乗り越えることは難しいと述べています。同時に技術が進歩し続ける現実も認識しており、「私はテクノロジーが嫌いではない。私たちが何を大切にするかを人間が選ぶ」と語っています。

AI著作権問題は、技術の急速な発展と既存の知的財産保護の枠組みとの根本的な衝突を示しています。訴訟の行方は業界全体のAI学習データの在り方に大きな影響を与える可能性があります。

Google、オンデバイスAI開発コンペの受賞者を発表

障害者支援とオフライン活用

視覚障害者向けウェアラブルAIが優勝
胸部カメラ映像をリアルタイム解析
認知障害者支援の完全オフライン動作
個人の発話特徴をローカル学習

警備・教育へのエッジ実装

警備カメラ映像の文脈的脅威判定
通信遮断地域での教育ハブ構築
ロボットJetson上での実装

Googleは12月10日、オンデバイスAIモデル「Gemma 3n」を活用した開発コンペ「Impact Challenge」の受賞者を発表しました。600以上の応募から選出されたプロジェクトは、クラウドに依存しないエッジAIが、低遅延かつ高プライバシーで社会課題を解決する可能性を実証しています。

最優秀賞の「Gemma Vision」は、視覚障害者が胸部に装着したカメラ映像をAIが解析し、周囲の状況を伝えるウェアラブルアシスタントです。白杖を持つ手が塞がらないよう音声や小型コントローラーで操作でき、すべての処理をデバイス上で完結させることで、実用的な応答速度を実現しています。

2位の「Vite Vere Offline」は、認知障害者のために画像音声指示に変換する完全オフラインアプリです。3位の「3VA」は、脳性麻痺を持つデザイナー向けにピクトグラムを豊かな文章へ変換するシステムで、ローカル環境での追加学習により、個人の意図を正確に反映させることに成功しました。

そのほか、警備カメラの映像から脅威のみを文脈的に識別するシステムや、インターネット接続がない地域向けの教育用マイクロサーバーなど、多彩なプロジェクトが入賞しました。これらの事例は、AIが画面の中だけでなく、物理的な制約のある現場でいかに具体的価値を生み出せるかを示唆しています。

Google、Android XR拡大 Galaxy新機能とXreal製グラス公開

Galaxy XRの機能拡張

Galaxy XRがWindows PCと連携、作業空間を拡張
移動中も画面が安定するトラベルモードを搭載
表情をリアルに再現するLikenessで自然な対話

軽量グラス「Project Aura」

Xrealと協業、軽量な有線XRグラスProject Aura
70度の視野角を持ち、現実とデジタル情報を融合
サングラスのような形状でAndroidアプリが動作

エコシステムの開放戦略

既存アプリが修正なしで動作、開発コストを抑制
AIグラスはiPhoneにも対応、囲い込みを打破

Googleは8日、Android XRの大型アップデートと新デバイス計画を発表しました。Samsung製ヘッドセット「Galaxy XR」の機能強化に加え、Xrealと共同開発した軽量グラス「Project Aura」を初公開。AppleMetaが先行するXR市場に対し、オープンなエコシステムで攻勢を強めます。

Galaxy XR向けには、生産性を高める新機能が追加されました。Windows PCと接続して仮想空間に画面を表示する「PC Connect」や、飛行機内でも安定した映像を楽しめる「トラベルモード」が登場。自身のリアルな表情をアバター化する「Likeness」により、ビデオ会議の質も向上します。

注目は、Xrealと提携した有線XRグラス「Project Aura」です。従来のヘッドセットとは異なり、サングラスのような軽量な形状を実現。スマホ等と有線接続し、70度の視野角で現実世界にデジタル情報を重ねて表示できます。2026年の発売を目指し、日常使いできるXRデバイスとして期待されます。

Android XRの最大の強みは、既存のAndroidアプリ資産を活用できる点です。UberやYouTube Musicなどのアプリが、開発者の追加作業なしでXRデバイス上で動作します。これにより、競合他社が苦戦するアプリ不足の問題を解消し、ユーザーにとっての実用性を即座に提供します。

さらにGoogleは、AIグラスにおけるiOS対応も明言しました。iPhoneユーザーでもGemini機能をフルに利用可能にする方針で、OSの壁を超えた普及を狙います。特定のハードウェアに縛られない柔軟な戦略は、ウェアラブル市場におけるGoogleの優位性を高める一手となるでしょう。

スマホNPU進化も恩恵不明確、主要AIはクラウド依存

性能向上と用途の乖離

NPU性能は数ヶ月で4割向上
具体的な実用メリットの説明不足
メーカーによるスペック競争が先行

オンデバイスAIの現在地

理想はセキュリティな個人AI
現実はクラウド処理が主流
ハード進化に見合うアプリ不在

スマートフォンに搭載されるNPUの性能が飛躍的に向上しているにもかかわらず、ユーザーが享受するAI体験の質は変わっていないと米Ars Technicaが報じました。チップメーカーが誇るハードウェアの進化と、実際のアプリ利用におけるクラウド依存の現状に大きな乖離が生じています。

NPUは数ヶ月ごとに30〜40%の高速化を実現していますが、その処理能力を活かす具体的な用途は提示されていません。消費者は「なぜAI用のハードウェアが必要なのか」という疑問に対する明確な答えを得られず、メーカーによるスペック競争の恩恵を実感できていないのが実情です。

専門家は、プライバシー保護に優れたオンデバイスAIの普及を期待していますが、主要な生成AIツールは依然としてデータセンター上の巨大サーバーで稼働しています。スマホ単体で完結する高度なAI処理が実現しない限り、手元の高性能チップは有効活用されません。

Liquid AI、エッジAI開発の「設計図」を全公開

企業向け小規模モデルの革新

51ページの技術レポートを公開
独自のLFM2アーキテクチャ詳解
CPU環境での推論効率を最大化
競合を凌ぐ処理速度と品質

実践的なハイブリッド戦略

自社データでのオンプレミス運用
画像音声対応のマルチモーダル
クラウド不要のローカル処理実現
エッジとクラウド協調動作

MIT発のスタートアップLiquid AIは2025年12月1日、最新AIモデル「LFM2」の技術レポートを公開しました。これは単なるモデル提供にとどまらず、企業が独自のハードウェア制約に合わせて高性能な小規模モデルを構築するための「設計図」を提供するものです。巨大なGPUクラスターを前提としないこのアプローチは、コストやプライバシーを重視する企業のAI戦略に、オンデバイスでの実用化という新たな選択肢をもたらします。

LFM2の最大の特徴は、一般的なCPUやモバイルSoC上での動作に最適化されている点です。独自開発されたハイブリッドアーキテクチャにより、同規模の競合モデルであるLlama 3.2やGemma 3と比較して、推論速度と品質の両面で高いパフォーマンスを発揮します。これにより、スマートフォンやノートPC、産業機器など、通信環境や電力に制約のあるエッジ環境でも、遅延の少ない高度なAI処理が可能になります。

今回公開された51ページのレポートでは、アーキテクチャ探索プロセスやトレーニングデータの混合比率、知識蒸留の手法など、モデル開発の詳細なレシピが明かされました。企業はこの情報を参照することで、ブラックボックス化した外部APIに依存することなく、自社のデータセンターデバイス上で完結するAIシステムを構築・運用できるようになります。これは、セキュリティ要件の厳しい産業分野において大きなアドバンテージです。

さらにLFM2は、テキストだけでなく画像音声にも対応するマルチモーダル機能を、トークン効率を極限まで高めた形で実装しています。現場でのドキュメント理解や音声操作といったタスクを、データを外部に送信することなくローカルで完結させることが現実的になります。Liquid AIの提示するこのモデルは、エッジとクラウドが適材適所で連携する「ハイブリッドAI」時代の標準的な構成要素となるでしょう。

Hugging Faceがv5発表、PyTorch特化と相互運用性強化

開発効率を高める構造改革

モデル定義をモジュール化し保守性向上
開発基盤をPyTorchへ完全一本化

実用性を極めた学習・推論

大規模な事前学習への対応を強化
OpenAI互換の推論サーバー機能導入
低精度の量子化を標準機能として統合

エコシステムをつなぐハブへ

外部推論エンジンとの連携を円滑化
ローカル実行オンデバイス対応

Hugging Faceは、AI開発のデファクトスタンダードであるライブラリの最新版「Transformers v5」を発表しました。本バージョンでは「相互運用性」と「シンプルさ」を最優先し、コード構造のモジュール化やPyTorchへのバックエンド一本化を断行。急速に拡大するAIエコシステムにおいて、エンジニアがより効率的に学習・推論を行えるよう、量子化の標準サポートや外部ツールとの連携を強化した大型アップデートです。

前バージョンのリリースから5年、Transformersは爆発的な成長を遂げました。1日あたりのインストール数は2万回から300万回へと急増し、累計ダウンロード数は12億回を突破。サポートするモデルアーキテクチャも40種類から400種類以上へと拡大しており、AI技術の民主化と普及を支える重要なインフラとしての地位を確立しています。

v5の最大の焦点は「シンプルさ」の追求です。開発チームは「コードこそが製品である」という哲学のもと、モデル定義のモジュール化を推進。複雑化していたコードベースを整理し、新しいモデルの追加や保守を容易にしました。これにより、コミュニティによる貢献プロセスが簡素化され、最新モデルへの対応速度がさらに向上します。

技術的な大きな転換点として、バックエンドをPyTorchに一本化します。TensorFlowやFlaxのサポートを縮小し、PyTorch財団との連携を深めることで、パフォーマンスと安定性を最大化します。同時に、JAXエコシステムとの互換性は維持し、多様な開発環境やニーズに応える柔軟性も確保しています。

実用面では、推論機能と量子化が大幅に強化されました。新たにOpenAI互換のAPIを持つ「transformers serve」を導入し、手軽な推論サーバー構築が可能に。また、8-bitや4-bitといった低精度モデルの量子化を「第一級市民」として扱い、リソース制約のある環境でも高性能なモデルを効率的に扱えるようになります。

最終的な目標は、あらゆるAIツールとのシームレスな連携です。UnslothやAxolotlでの学習から、vLLMやllama.cppを用いた推論・ローカル実行まで、Transformers v5はエコシステムのハブとして機能します。この高い相互運用性により、開発者は最適なツールを自由に組み合わせ、生産性を最大化できるでしょう。

MSのPC操作AI「Fara-7B」 端末完結でGPT-4o凌駕

端末完結でGPT-4o超え

70億パラメータの軽量モデルでPC動作
WebVoyagerで勝率73.5%を達成
視覚情報のみでマウス・キー操作

高度なプライバシーと安全設計

データが外部に出ないピクセル主権
重要操作前に停止する安全機構

革新的な学習手法と入手性

合成データによる効率的な学習
MITライセンスで商用利用も可能

マイクロソフトは2025年11月24日、PC操作に特化した新しい小規模言語モデル(SLM)「Fara-7B」を発表しました。わずか70億パラメーターながら、GPT-4oベースのエージェントを凌駕する性能を記録。データが外部に出ないオンデバイス実行を実現し、プライバシー保護と低遅延を両立させています。

最大の特徴は、人間と同じように画面の視覚情報だけを頼りに操作を行う点です。HTMLコード等の裏側情報を必要とせず、スクリーンショットからボタン位置などを認識してマウスやキーボードを操作します。Web操作のベンチマーク「WebVoyager」では、GPT-4o(65.1%)を上回る73.5%のタスク成功率を達成しました。

ビジネス利用で重要なのがセキュリティです。Fara-7Bはローカル環境で動作するため、機密情報がクラウドに送信されるリスクを排除する「ピクセル主権」を確立しています。また、送金やメール送信などの不可逆的な操作の直前には、必ずユーザーの同意を求める「クリティカルポイント」機能が組み込まれています。

開発には「知識の蒸留」という高度な手法が用いられました。マルチエージェントシステム「Magentic-One」が生成した14万件以上の高品質な合成データを学習させることで、小型モデルながら複雑な推論能力を獲得しています。ベースモデルには視覚処理に優れたQwen2.5-VL-7Bが採用されました。

本モデルは現在、Hugging Face等を通じてMITライセンスで公開されており、商用利用を含む試験運用が可能です。Windows 11搭載のCopilot+ PCでも動作確認済みで、企業は自社のセキュリティ要件に合わせたPC操作自動化エージェントの開発を、低コストかつ安全に開始できます。

PowerToysのAI貼り付け、ローカル処理で無料・安全化

ローカルAI活用でコスト削減

NPU活用でAPI課金不要
データを守るオンデバイス処理
オフラインでも翻訳・要約が可能

多様なモデルへの対応拡大

GeminiMistralも選択可能
オープンソースのOllamaと連携
UI改善で操作性向上

MicrosoftWindows 11向けユーティリティ「PowerToys」を更新し、Advanced Paste機能を強化しました。ユーザーはクラウドを経由せず、デバイス上のAIモデルを利用して高度な貼り付けが可能になります。

特筆すべきは、NPU(ニューラル処理装置)を活用した完全ローカル処理です。これによりAPI利用料が不要になるほか、データが外部に送信されないため、機密情報を含むテキストも安心して扱えます。

具体的には、Microsoft Foundry LocalやOllamaを介してローカルモデルを実行します。クリップボードの内容を瞬時に翻訳・要約するなど、業務効率を飛躍的に高める機能が手軽に利用可能です。

さらに、連携可能な外部モデルも拡充されました。従来のOpenAIに加え、Azure OpenAIGeminiMistralに対応。用途や契約状況に応じて最適なAIモデルを柔軟に選択できる設計へと進化しています。

Google、インドでAI詐欺対策強化も機種と言語に課題

AIによる通話詐欺検知

Gemini Nanoで解析
Pixel 9以降かつ英語のみ

画面共有の悪用防止

金融アプリ利用時に警告
ワンタップで共有停止

普及への高いハードル

Pixelシェア1%未満
偽アプリ根絶に至らず

Googleは20日、インドにおけるデジタル詐欺対策として、AIを活用した新たな保護機能を発表しました。Pixel 9シリーズ向けのリアルタイム詐欺検出や、主要な金融アプリでの画面共有警告などが導入されます。インドではデジタル決済の普及に伴い詐欺被害が急増しており、2025年だけで数億ドル規模の損失が発生している深刻な状況に対応する狙いです。

目玉となるのは、同社の軽量AIモデルGemini Nanoを活用した通話分析機能です。デバイス上で処理が完結するため、通話内容がGoogleのサーバーに送信されることはありません。未知の番号からの通話中に詐欺の兆候を検知すると、ユーザーに警告音と通知で知らせる仕組みですが、現状は英語のみの対応となっています。

この機能の普及には大きな壁が存在します。インドのスマートフォン市場でAndroidは96%を占めますが、対応するPixel端末のシェアは1%未満に過ぎません。また、多言語国家であるインドにおいて、英語話者のみを対象とした機能展開では、最も脆弱な層を保護しきれないという指摘もあります。

一方で、より広範なユーザーに向けた対策も講じられています。PaytmやGoogle Payなどの金融アプリと連携し、通話中に画面共有を求められた際に警告を表示する機能を試験導入しました。詐欺師がワンタイムパスワード等を盗み見る手口を防ぐもので、こちらは将来的にインドの現地言語にも対応する予定です。

Googleは他にも、サイドローディングによる危険なアプリのインストールを1億回以上ブロックするなど対策を強化しています。しかし、公式ストアであるGoogle Play上でも依然として偽アプリが散見されるなど、巨大なエコシステムの健全化には依然として課題が残されています。

Pixel大型更新、AIが通知要約し生産性を劇的改善

AIで業務効率を最大化

長文会話をAIが自動で要約
通話内容を自動で文字起こし・要約
AIが詐欺の可能性をチャットで警告
重要連絡先(VIP)の通知を自動で優先

Geminiで創造性を解放

メッセージ内で写真をAIが再構成
集合写真の表情や装飾をAIが修正

利便性と安全性の向上

詐欺電話検知を多国で展開
マップに電力モードを追加

Googleは2025年11月、同社のスマートフォン「Pixel」シリーズ向けに、AI機能を大幅に強化するソフトウェアアップデート「Pixel Drop」を発表しました。AIモデルGeminiを活用し、通知の自動要約や高度な詐欺検知、写真編集など多岐にわたる新機能を提供。ビジネスユーザーの生産性向上とセキュリティ強化を両立させるアップデートとなっています。

今回のアップデートの目玉は、AIによる通知の自動要約機能です。長文のメッセージや活発なグループチャットの内容を通知画面で簡潔にまとめてくれるため、重要な情報を素早く把握できます。情報過多になりがちな現代において、ビジネスパーソンが集中力を維持し、効率的にコミュニケーションを取る上で強力なツールとなるでしょう。

セキュリティ面も大幅に強化されました。チャットメッセージの通知段階で、AIが詐欺の可能性を検知し「Likely scam」と警告を表示する新機能を追加。従来の通話中の詐欺検知機能も、イギリスやカナダなど提供地域を拡大し、巧妙化するオンライン詐欺からユーザーを保護する体制をグローバルに広げています。

Googleの最新AIモデルGemini Nanoオンデバイスで活用される点も注目です。メッセージアプリ内で写真を再構成する「Remix」機能や、通話内容を文字起こし・要約する「Call Notes」機能(日本でも利用可能に)が実装され、創造性と業務効率の両面でAIの力をより身近に体感できるようになりました。

Googleフォトでは、AIによる写真編集機能がさらに進化。「Help me edit」機能を使えば、「サングラスを外して」「笑顔にして」といった自然言語の指示で、集合写真の細部を簡単に修正できます。個人の写真ライブラリから最適な画像を基に編集するため、極めて自然な仕上がりが特徴です。

このほか、重要な連絡先からの通知を優先するVIP機能の強化や、Googleマップ運転中のバッテリー消費を抑える省電力モードも追加されました。今回のアップデートは、AIをあらゆる場面で活用し、ユーザー体験を向上させるGoogleの強い意志を示すものと言えます。

Google、新AI基盤でプライバシーと高性能を両立

プライバシーとAI性能の両立

高度なAI処理をクラウドで実現
AppleのPCCに類似した仕組み

堅牢なセキュリティ技術

専用チップTPUで処理を高速化
技術TEEでデータを隔離・暗号化
Googleさえアクセス不可能な設計

身近な機能の高度化

Pixel 10の新機能「Magic Cue」強化
Recorderアプリの多言語要約

Googleは11日、ユーザーデータのプライバシーを保護しながら、クラウド上で高度なAIモデル「Gemini」を実行できる新基盤「Private AI Compute」を発表しました。オンデバイス処理と同等のセキュリティを保ちつつ、より複雑なAIタスクを可能にします。これはAppleの「Private Cloud Compute」に追随する動きです。

AI機能が高度化するにつれ、スマートフォンなどのデバイス上での処理には計算能力の限界が見えてきました。そこでGoogleは、プライバシーを保護したままクラウドの膨大な計算資源を活用するハイブリッドなアプローチとして、この新基盤を開発しました。利便性と安全性の両立を目指します。

新基盤の中核は、Google独自のAIチップTPU(Tensor Processing Units)と、データを隔離・暗号化するTEE(信頼できる実行環境)です。これにより、ユーザーデータはクラウド上で処理される際にも保護され、Google自身でさえ内容を閲覧することは不可能だと説明しています。

この動きは、Appleが先に発表した「Private Cloud Compute」と酷似しており、大手IT企業間でAIのプライバシー保護が重要な競争軸となっていることを示しています。ユーザーは、利便性とプライバシーの両方を高いレベルで享受できる時代を迎えつつあるのではないでしょうか。

具体的な応用例として、次期スマートフォン「Pixel 10」に搭載されるAI機能「Magic Cue」の提案精度が向上するほか、録音アプリ「Recorder」での文字起こし要約がより多くの言語で利用可能になります。身近な機能がより賢く、便利になることが期待されます。

Googleは、このシステムの安全性を客観的に示すため、セキュリティ企業NCC Groupによる独立した分析を受けたことも公表しています。厳格なプライバシーガイドラインを満たしていることが確認されており、技術的な透明性の確保に努める姿勢を見せています。

今回の発表は始まりに過ぎないとGoogleは述べています。今後、オンデバイスクラウドの長所を融合させたプライベートAI技術が、検索Gmailなど、より広範なサービスに展開される可能性があります。企業のAI活用においても重要な選択肢となるでしょう。

家庭用AI『Gemini』、米国で先行提供開始

Gemini搭載の新アシスタント

既存アシスタント刷新
Nestデバイス上動作
より複雑なタスクと自然な会話
基盤はGemini LLM

早期アクセスの注意点

アシスタントには戻れない
一部機能は有料プラン限定
参加にはアプリからの申請が必要
対象は米国ユーザーから

Googleは2025年10月29日、米国のスマートホームユーザー向けに、新しいAIアシスタントGemini for Home」の早期アクセス提供を開始しました。これは、同社のNestデバイスに搭載されている既存のGoogleアシスタントを置き換えるもので、スマートホーム体験を根本から刷新する重要なアップデートとなります。

Gemini for Home」の最大の特徴は、基盤となる大規模言語モデル(LLM)Geminiです。これにより、従来のGoogleアシスタントと比較して、より複雑な指示を理解し、実行できるようになります。また、人間と話しているかのような、より自然で文脈に沿った会話が可能になる点も大きな進化と言えるでしょう。

早期アクセスに参加するには、Google Homeアプリの設定メニューから申請が必要です。承認されると、利用者が持つ全ての対応デバイスでGemini for Homeが有効になります。ただし、一度切り替えると元のGoogleアシスタントに戻すことはできないため、注意が必要です。

また、一部の高度な機能は有料サブスクリプション「Google Home Premium」の加入者限定となります。リアルタイムで対話できる「Gemini Live」や、カメラの録画履歴をAIで検索する機能などがこれに該当します。今回の動きは、家庭におけるAI活用を本格化させるGoogleの強い意志の表れと言えます。

AI開発の生産性向上、ソフトウェアの断片化解消が鍵

AI開発を阻む「複雑性の壁」

断片化したソフトウェアスタック
ハードウェア毎のモデル再構築
6割超のプロジェクトが本番前に頓挫
エッジ特有の性能・電力制約

生産性向上への道筋

クロスプラットフォームの抽象化レイヤー
最適化済みライブラリの統合
オープン標準による互換性向上
ハードとソフトの協調設計

ArmをはじめとするAI業界が、クラウドからエッジまで一貫した開発を可能にするため、ソフトウェアスタックの簡素化を急いでいます。現在、断片化したツールやハードウェア毎の再開発がAIプロジェクトの大きな障壁となっており、この課題解決が開発の生産性と市場投入の速度を左右する鍵を握っています。

AI開発の現場では、GPUやNPUなど多様なハードウェアと、TensorFlowやPyTorchといった異なるフレームワークが乱立。この断片化が非効率な再開発を招き、製品化までの時間を浪費させています。調査会社ガートナーによれば、統合の複雑さを理由にAIプロジェクトの6割以上が本番前に頓挫しているのが実情です。

このボトルネックを解消するため、業界は協調した動きを見せています。ハードウェアの違いを吸収する抽象化レイヤーの導入、主要フレームワークへの最適化済みライブラリの統合、ONNXのようなオープン標準の採用などが進んでいます。これにより、開発者はプラットフォーム間の移植コストを大幅に削減できるのです。

簡素化を後押しするのが、クラウドを介さずデバイス上でAIを処理する「エッジ推論」の急速な普及です。スマートフォンや自動車など、電力や処理能力に制約のある環境で高性能なAIを動かすには、無駄のないソフトウェアが不可欠です。この需要が、業界全体のハードウェアとソフトウェアの協調設計を加速させています。

この潮流を主導するのが半導体設計大手のArmです。同社はCPUにAI専用の命令を追加し、PyTorchなどの主要ツールとの連携を強化。これにより開発者は使い慣れた環境でハードウェア性能を最大限に引き出せます。実際に、大手クラウド事業者へのArmアーキテクチャ採用が急増しており、その電力効率の高さが評価されています。

AIの次なる競争軸は、個別のハードウェア性能だけでなく、多様な環境でスムーズに動作する「ソフトウェアの移植性」に移っています。エコシステム全体で標準化を進め、オープンなベンチマークで性能を競う。こうした協調的な簡素化こそが、AIの真の価値を引き出し、市場の勝者を決めることになるでしょう。

MITとIBM、小型・効率AIで産業応用を加速

産学連携が生む圧倒的成果

特許54件、引用12万件超
産業ユースケース50件以上を創出
医療や化学など多分野へ応用

「巨大」から「小型・効率」へ

巨大モデルからタスク特化型へ転換
性能を維持しモデルを小型化
エッジデバイスでの高速処理実現

少ないデータで賢く学習

自己修正で推論精度を高める新手法
PoCで終わらせない実用化を推進

マサチューセッツ工科大学(MIT)とIBMが共同で運営する「MIT-IBM Watson AI Lab」は、AI開発の新たな方向性を示しています。設立8周年を迎えた同ラボは、巨大な基盤モデルから、より小さく効率的でタスクに特化したモデルの開発に注力。研究と実用化のギャップを埋め、産業界でのAI活用を加速させることを目指します。これは、AIプロジェクトの多くが概念実証(PoC)で頓挫する現状への明確な回答と言えるでしょう。

この産学連携は目覚ましい成果を上げています。これまでに特許54件を出願し、論文の引用数は12万8000件を超えました。さらに、ヘルスケアや金融、化学など多岐にわたる分野で50件以上の産業ユースケースを創出。AI画像技術によるステント留置の改善や、計算コストの大幅な削減など、具体的なイノベーションを生み出し続けています。

なぜ今、「小型・効率化」が重要なのでしょうか。調査会社ガートナーによると、生成AIプロジェクトの少なくとも30%が2025年末までに概念実証(PoC)の段階で中止されると予測されています。多くの企業がAIへの期待を抱きつつも、価値ある成果に繋げられていないのです。同ラボは、この研究と実用の間の「死の谷」を埋める役割を担っています。

小型化の鍵を握るのが、`once-for-all`や`AWQ`といった革新的な技術です。これらの手法は、モデルのアーキテクチャを最適化し、性能を維持したままサイズを圧縮します。これにより、スマートフォンなどのエッジデバイス上でもAIを高速に実行できるようになります。遅延を減らし、リアルタイムでの応用範囲を大きく広げる可能性を秘めています。

さらに、少ないデータで賢く学習する技術も進化しています。例えば`COAT`(Chain-of-Action-Thought)と呼ばれる手法は、AIが自らの推論プロセスを反復的に自己修正することで、より正確な答えを導き出します。これは、限られた計算資源とデータで、現実世界の複雑な課題を解決するための重要なアプローチです。

これらの研究成果は、IBMのプラットフォーム`watsonx`などを通じて実用化されています。一例が、コンパクトながら高精度な文書理解能力を持つ`Granite Vision`モデルです。企業が保有する膨大な文書から、信頼性の高い情報を抽出し、要約するニーズに応えます。

MIT-IBM Watson AI Labが目指すのは「有用で効率的な知能」の創出です。巨大モデルの開発競争から一歩進み、目的に合わせて最適化されたAIこそが、真の経済的・社会的価値を生み出すと彼らは考えています。この産学連携の取り組みは、AIの実用化を目指す全ての企業にとって、重要な指針となるでしょう。

AI PCが再定義する生産性、鍵は「創造性」

AI PCがもたらす価値

ローカルAI処理による高速化
機密データを保護するセキュリティ
オフラインでも作業可能
低遅延と省エネルギーの実現

創造性が生む事業成果

市場投入までの時間短縮
外部委託費の削減
顧客エンゲージメントの向上
従業員の満足度と定着率向上

AI PCの登場が、ビジネスにおける「生産性」の定義を根底から変えようとしています。マサチューセッツ工科大学(MIT)の研究で生成AIが人間の創造性を高めることが示される中、NPU(Neural Processing Unit)を搭載した次世代PCがその能力を最大限に引き出します。デバイス上でAI処理を完結させることで、低遅延、高セキュリティ、省エネを実現し、単なる効率化ツールを超えた価値を提供し始めています。

企業のIT意思決定者の45%が、すでにAI PCを創造的な業務支援に活用しています。しかし、一般の知識労働者における同目的での利用率は29%にとどまり、組織内で「クリエイティブ格差」が生じているのが現状です。この格差を埋めることが、AI PCのポテンシャルを全社的に引き出す鍵となります。

AI PCは、従業員が創造的な作業に集中できる環境を整えます。専用のNPUがAI関連の負荷を担うため、ユーザーは思考を中断されることなく、アイデア創出に没頭できます。これにより、バッテリー寿命が延び、待ち時間が減少。デザイン動画制作、資料作成など、あらゆる業務でリアルタイムの試行錯誤が可能になります。

この創造性の向上は、具体的な事業成果に直結します。マーケティング部門では、数週間かかっていたキャンペーン素材を数時間で生成。技術部門では、設計や試作品開発のサイクルを大幅に短縮しています。営業担当者は、オフラインの顧客先でもパーソナライズされた提案書を即座に作成でき、案件化のスピードを高めています。

最終的に、AI PCは従業員の働きがいをも向上させます。HPの調査では、従業員が仕事に健全な関係を築く上で最も重要な要素は「充実感」であることが示されています。単なるタスク処理ではなく、創造性を発揮できるツールを与えることは、生産性、満足度、定着率の向上につながるのです。

CIO(最高情報責任者)にとって、AI PCの導入は単なる機器の高速化ではありません。その真価は、従業員の創造性を解放し、新たなアイデアや協業、競争力を生み出す企業文化を醸成することにあります。AI PCをいかに活用し、組織全体の創造性を高めるかが、今後の成長を左右するでしょう。

Acer、50TOPSのAI搭載Chromebookを投入

強力なオンデバイスAI

MediaTek製CPUを搭載
50TOPSのAI処理能力
高速・安全なオフラインAI
AIによる自動整理や画像編集

ビジネス仕様の高性能

360度回転する2-in-1設計
最大17時間の長時間バッテリー
最新規格Wi-Fi 7に対応
Gemini 2.5 Proが1年間無料

Googleは、Acer製の新型ノートPC「Acer Chromebook Plus Spin 514」を発表しました。最大の特徴は、MediaTek Kompanio Ultraプロセッサが実現する強力なオンデバイスAI機能です。オフラインでも高速に動作するAIが、ビジネスパーソンの生産性を飛躍的に高める可能性を秘めています。

新モデルは、50TOPSという驚異的なAI処理能力を備えています。これにより、タブやアプリを自動で整理する「スマートグルーピング」や、AIによる高度な画像編集デバイス上で直接、高速かつ安全に実行できます。機密情報をクラウドに送る必要がないため、セキュリティ面でも安心です。

ハードウェアもビジネス利用を強く意識しています。360度回転するヒンジでノートPCとタブレットの1台2役をこなし、14インチの2.8K高解像度タッチスクリーン、最大17時間持続するバッテリー、最新のWi-Fi 7規格への対応など、外出先でも快適に作業できる仕様です。

購入者特典として、Googleの最先端AIモデル「Gemini 2.5 Pro」や2TBのクラウドストレージを含む「Google AI Proプラン」が12ヶ月間無料で提供されます。これにより、文書作成やデータ分析といった日常業務がさらに効率化されるでしょう。

今回、デスクトップ型の「Acer Chromebox CXI6」と超小型の「Acer Chromebox Mini CXM2」も同時に発表されました。オフィスでの固定利用から省スペース環境まで、多様なビジネスシーンに対応する製品群で、AI活用を推進する姿勢がうかがえます。

AI21が25万トークン対応の小型LLMを発表、エッジAIの経済性を一変

小型モデルの定義変更

30億パラメータのオープンソースLLM
エッジデバイスで25万トークン超を処理
推論速度は従来比2〜4倍高速化

分散型AIの経済性

MambaとTransformerハイブリッド構造採用
データセンター負荷を減らしコスト構造を改善
高度な推論タスクをデバイスで実行

企業利用の具体例

関数呼び出しやツールルーティングに最適
ローカル処理による高いプライバシー確保

イスラエルのAIスタートアップAI21 Labsは、30億パラメータの小型オープンソースLLM「Jamba Reasoning 3B」を発表しました。このモデルは、ノートPCやスマートフォンなどのエッジデバイス上で、25万トークン以上という異例の長大なコンテキストウィンドウを処理可能であり、AIインフラストラクチャのコスト構造を根本的に変える可能性を秘めています。

Jamba Reasoning 3Bは、従来のTransformerに加え、メモリ効率に優れたMambaアーキテクチャを組み合わせたハイブリッド構造を採用しています。これにより、小型モデルながら高度な推論能力と長文処理を両立。推論速度は従来のモデルに比べて2〜4倍高速であり、MacBook Pro上でのテストでは毎秒35トークンを処理できることが確認されています。

AI21の共同CEOであるオリ・ゴーシェン氏は、データセンターへの過度な依存が経済的な課題となっていると指摘します。Jamba Reasoning 3Bのような小型モデルをデバイス上で動作させることで、高価なGPUクラスターへの負荷を大幅に軽減し、AIインフラストラクチャのコスト削減に貢献し、分散型AIの未来を推進します。

このモデルは、特に企業が関心を持つユースケースに最適化されています。具体的には、関数呼び出し、ポリシーに基づいた生成、そしてツールルーティングなどのタスクで真価を発揮します。シンプルな業務指示や議事録作成などはデバイス上で完結し、プライバシーの確保にも役立ちます。

Jamba Reasoning 3Bは、同規模の他の小型モデルと比較したベンチマークテストでも優位性を示しました。特に長文理解を伴うIFBenchやHumanity’s Last Examといったテストで最高スコアを獲得。これは、同モデルがサイズを犠牲にすることなく、高度な推論能力を維持していることを示しています。

企業は今後、複雑で重い処理はクラウド上のGPUクラスターに任せ、日常的かつシンプルな処理はエッジデバイスでローカルに実行する「ハイブリッド運用」に移行すると見られています。Jamba Reasoning 3Bは、このハイブリッド戦略の中核となる効率的なローカル処理能力を提供します。

iOS 26、オンデバイスAIでアプリ体験を刷新

オンデバイスAIの利点

推論コスト不要でAI機能実装
プライバシーに配慮した設計
ネット接続不要のオフライン動作

主な活用パターン

テキストの要約・生成・分類
ユーザー入力に基づく自動提案機能
音声からのタスク分解・文字起こし
パーソナライズされた助言・フィードバック

Appleが2025年の世界開発者会議(WWDC)で発表した「Foundation Models framework」が、最新OS「iOS 26」の公開に伴い、サードパーティ製アプリへの実装が本格化しています。開発者は、デバイス上で動作するこのローカルAIモデルを利用し、推論コストをかけずにアプリの機能を向上させることが可能です。これにより、ユーザーのプライバシーを保護しながら、より便利な体験を提供できるようになりました。

AppleのローカルAIモデルは、OpenAIなどの大規模言語モデルと比較すると小規模です。そのため、アプリの根幹を覆すような劇的な変化ではなく、日常的な使い勝手を向上させる「生活の質(QoL)」の改善が主な役割となります。推論コストが不要でオフラインでも動作する点が、開発者にとって大きな利点と言えるでしょう。

具体的な活用例として、生産性向上機能が挙げられます。タスク管理アプリ「Tasks」では音声からタスクを自動分割し、日記アプリ「Day One」はエントリーの要約やタイトルを提案します。また、レシピアプリ「Crouton」では、長文から調理手順を自動で抽出するなど、手作業を削減する機能が実装されています。

学習や創造性の分野でも活用が進んでいます。単語学習アプリ「LookUp」は、AIが単語の例文を生成し、学習をサポートします。子供向けアプリ「Lil Artist」では、キャラクターとテーマを選ぶだけでAIが物語を生成。ユーザーの創造性を刺激する新たな体験を提供しています。

個人の趣味や健康管理といった専門分野でも応用は多彩です。フィットネスアプリ「SmartGym」はワークアウトの要約を生成し、テニス練習アプリ「SwingVision」は動画から具体的なフォーム改善案を提示します。このように、AIがパーソナライズされた助言を行う事例が増えています。

今回の動きは、AI機能の導入がより身近になることを示唆しています。開発者は、サーバーコストやプライバシー問題を気にすることなく、高度な機能をアプリに組み込めるようになりました。iOS 26を皮切りに、オンデバイスAIを活用したアプリのイノベーションは、今後さらに加速していくとみられます。

Pixel 10、AIが不在着信を文字起こし・要約

新AI機能「Take a Message」

不在着信・拒否通話のスマートな処理
会話型AIによるリアルタイム文字起こし
通話後のAIによるアクション提案

2つの人気機能を統合

通話スクリーニングのスパム検出活用
通話メモの要約・ネクストステップ生成

高度なオンデバイスAI

プライバシーに配慮した端末内処理
最新のPixel 10シリーズに搭載

Googleは2025年10月2日、最新スマートフォン「Pixel 10」シリーズ向けに、新たなAI通話支援機能「Take a Message」を発表しました。この機能は、不在着信や応答を拒否した通話の内容をAIがリアルタイムで文字起こしし、通話後には次のアクションを提案するものです。多忙なビジネスパーソンが重要な連絡を逃さず、効率的に対応できるよう支援することを目的としています。

「Take a Message」の最大の特徴は、Google高度な会話型AIを駆使している点です。相手が残したボイスメッセージをリアルタイムで画面にテキスト表示するため、音声を聞けない状況でも内容を即座に確認できます。これにより、会議中や移動中でも重要な用件を逃す心配がありません。

さらに、通話が終了するとAIがメッセージ内容を分析し、要約と推奨される次のアクションを自動生成します。「明日15時に折り返し電話」といった具体的なタスクを提示し、迅速な対応を支援。これは既存の人気機能「Call Notes」の進化形と言えます。

この新機能は、既存の「Call Screen」と「Call Notes」の長所を統合したものです。迷惑電話をブロックする強力なスパム検出機能も継承し、安全性と利便性を両立。処理はすべて端末内で完結するオンデバイスAIのため、プライバシーの観点でも安心できます。

「Take a Message」は、まず最新の「Pixel 10」シリーズで利用可能となります。Googleは、AIを用いてスマートフォンの原点である「通話」体験の再発明を目指しています。今回の新機能は、AIが日常業務を効率化する可能性を示す好例と言えるでしょう。

Pixel 10 Pro、AIで100倍ズームを実現

Pro Res Zoomとは

Pixel 10 Pro搭載の新ズーム技術
AIで100倍ズームを実現
Tensor G5チップ高速処理

AIによる画質向上

単なるデジタルズームではない
生成AIが欠落情報を補完
ノイズ除去とシャープ化を両立
デバイス上数秒で完結

Googleが、次期スマートフォン「Pixel 10 Pro」に搭載される新たなAIカメラ技術「Pro Res Zoom」を発表しました。この技術は、生成AIを活用して最大100倍のズーム撮影でも鮮明な画質を実現するものです。遠くの被写体を、これまでにないほど詳細に捉えることが可能になります。

Pro Res Zoomの核心は、単なる画像の切り出しと拡大(デジタルズーム)ではない点にあります。撮影データから色や形といった僅かな手がかりを基に、AIが欠落したディテールを生成・補完します。これにより、従来のズーム機能ではぼやけてしまっていた被写体も、驚くほど鮮明な一枚の写真として仕上がります。

この高度な処理は、最新の「Tensor G5」チップによってデバイス上で直接実行されます。最先端の拡散モデル(diffusion model)を数秒で動作させ、ノイズ除去とシャープ化を同時に行います。クラウドにデータを送ることなく、手元で高速に処理が完結するのが大きな特徴です。

この新技術は、ユーザーにどのような価値をもたらすのでしょうか。例えば、遠くにいる野生動物や、スポーツ観戦中の選手の表情など、これまで諦めていたシーンの撮影が可能になります。Pixel 9 Proの「Super Res Zoom」が最大30倍だったのに対し、100倍という圧倒的なズーム性能は、スマートフォンの写真撮影の常識を覆す可能性を秘めています。

Googleの取り組みは、生成AIがクラウド上のサービスから、スマートフォンという日常的なデバイスへと活躍の場を広げていることを示しています。カメラ機能の進化は、AIがもたらすユーザー体験向上の好例と言えるでしょう。

Hance、KB級AI音声処理でエッジ市場に革新

驚異の超小型・高速AI

モデルサイズは僅か242KB
遅延10ミリ秒のリアルタイム性
電力で多様なデバイスに対応

F1からインテルまで

F1公式無線サプライヤーが採用
Intelの最新チップNPUへ最適化
防衛・法執行分野への応用
大手スマホメーカーとも協議中

ノルウェーのスタートアップHanceが、キロバイト級の超小型AI音声処理ソフトウェアを開発しました。クラウドを介さずデバイス上で動作し、わずか10ミリ秒の低遅延でノイズ除去や音声の明瞭化を実現。すでにF1の公式無線サプライヤーやIntelといった大企業を顧客に持ち、10月27日から開催されるTechCrunch Disrupt 2025でデモを披露します。

この技術の核心は、わずか242KBという驚異的なモデルサイズにあります。これにより、スマートフォンや無線機など、リソースが限られたエッジデバイス上でのリアルタイム処理が可能になりました。従来のクラウドベースのAIと異なり、通信遅延や消費電力を大幅に削減できる点が大きな強みです。

HanceのAIモデルは、共同創業者が運営する高品質なサウンドライブラリ「Soundly」の音源を用いてトレーニングされました。F1マシンの轟音から火山の噴火音まで、多種多様なデータを学習させることで、過酷な環境下でも特定の音声を分離し、ノイズやエコー、反響を除去する高い性能を達成しています。

その実用性はすでに証明されています。F1チームが使用する無線システムを手がけるRiedel Communicationsは、高速走行中のドライバーとエンジニア間の極めて重要な通信をクリアにするため、Hanceの技術を採用。他にも、防衛や法執行機関といった、リアルタイム性と信頼性が求められる分野からの関心も高まっています。

Hanceは事業拡大を加速させています。半導体大手Intelとは、同社の最新チップ「NPU(ニューラル・プロセッシング・ユニット)」向けにモデルを最適化するパートナーシップを締結。他のチップメーカーや、非公開のスマートフォンメーカーとも協議を進めており、競争優位を保つため、研究開発に注力し続ける方針です。

Pixel 10、AI通話機能でビジネスを加速

AIが変えるビジネス通話

関連情報をAIが自動提示
通話内容からタスクを自動生成
不在着信をAIが要約・分類
迷惑電話をAIが自動で判別

グローバル化と利便性向上

オンデバイスAIでリアルタイム翻訳
AIによる自動応答・フィルタリング
カスタマイズ可能な通話画面
車内でのAIアシスタント連携

Googleが2025年9月29日、最新スマートフォン「Pixel 10」向けに、AIを活用した9つの新しい通話機能を発表しました。これらの機能は、最新AIモデル「Gemini Nano」と独自プロセッサ「Tensor G5」を搭載し、通話中の情報検索やリアルタイム翻訳、議事録作成などを自動化。ビジネスパーソンの生産性向上と、より円滑なコミュニケーションの実現を目指します。

中でも注目すべきは「Magic Cue」機能です。これは、ユーザーの許可のもとGmailやメッセージの内容をAIが解析し、通話中に必要な情報を先回りして提示するものです。例えば、顧客との通話中に注文番号を自動で表示するなど、情報検索の手間を大幅に削減し、ビジネスの機会損失を防ぎます。

グローバルなビジネス展開を加速させるのが「Voice Translate」です。デバイス上で完結するAIが、通話内容をリアルタイムで翻訳します。話者の声質を保ったまま自然な翻訳が可能なため、言語の壁を越えた円滑なコミュニケーションを実現。海外の取引先やチームとの連携を強力にサポートするでしょう。

「Call Notes」機能も大幅に進化しました。通話内容を記録するだけでなく、そこからカレンダーの予定やタスクをAIが提案し、ワンタップで作成可能になります。これにより、通話後のフォローアップ作業が劇的に効率化され、重要なアクションの抜け漏れを防ぐことが期待できます。

このほかにも、迷惑電話をAIが自動で判別・対応する「Call Screen」や「Scam Detection」の対象国拡大、不在着信をテキスト化して要約する「Take a Message」、車内で安全に通話機能を活用できるAndroid Auto連携など、日々の業務を効率化する機能が多数盛り込まれています。

これらの革新的な機能は、Pixel 10に搭載される強力なオンデバイスAI基盤によって実現されています。AIアシスタントが単なるツールから真の「ビジネスパートナー」へと進化する可能性を示しており、今後のスマートフォンがもたらす生産性革命に大きな期待が寄せられます。

Hugging Face、Apple向けAIライブラリv1.0を公開

Apple開発者向けAIツール

ローカルLLMのアプリ統合を簡素化
Tokenizer, Hubなど必須機能を提供
Core MLやMLXを補完する設計

v1.0の進化点

パッケージの安定性向上とAPI整理
モジュール分割による依存性削減
最新Core ML APIとSwift 6に対応

今後のロードマップ

MLXフレームワークとの連携深化
エージェント型ユースケースの探求

AIプラットフォームのHugging Faceが、Apple製品開発者向けライブラリ「swift-transformers」のバージョン1.0を公開しました。本ライブラリは、iPhoneなどのデバイス上でローカルにAIモデルを動作させる際の技術的ハードルを下げ、アプリへの組み込みを容易にすることを目的としています。

swift-transformersは、AppleのCore MLやMLXといった機械学習フレームワークを補完する重要な機能群を提供します。具体的には、複雑なテキスト入力を処理する「Tokenizers」、Hugging Face Hubからモデルを管理する「Hub」、Core ML形式モデルの推論を簡素化する「Models」と「Generation」が中核をなします。

すでに、Apple自身のサンプル集「mlx-swift-examples」や、高性能な音声認識フレームワーク「WhisperKit」など、多くのプロジェクトで採用されています。これにより、AppleエコシステムにおけるオンデバイスAI開発の基盤技術としての地位を確立しつつあると言えるでしょう。

今回のv1.0リリースは、ライブラリの安定性を公式に保証する初のメジャーアップデートです。主要な変更点には、必要な機能だけを導入できるモジュール分割や、最新のCore ML APIへの対応、そしてSwift 6への完全準拠が含まれます。開発者はより安心して長期的なプロジェクトに採用できます。

Hugging Faceは今後の展望として、Apple機械学習フレームワーク「MLX」との連携強化を掲げています。さらに、自律的にタスクを処理する「エージェント」のような、より高度なユースケースの実現も視野に入れており、オンデバイスAIの新たな可能性を切り拓くことが期待されます。

Google、次期チップ「Tensor G5」でPixel 10のAI機能を大幅強化

Googleは9月24日、公式ポッドキャストで、次期スマートフォン「Pixel 10」シリーズに搭載する最新チップ「Tensor G5」の詳細を明らかにしました。同社のシリコンチーム担当者が解説し、Tensor G5がGoogle史上最大のアップグレードであり、デバイス上のAI機能を飛躍的に進化させることを強調しました。これにより、スマートフォンの利便性が新たな段階に入ることが期待されます。 Tensor G5は、AI処理能力の向上に特化した設計が特徴です。Googleのシリコンチーム担当者によれば、このチップは技術的なブレークスルーであり、これまでのチップから大幅な性能向上を実現したとのことです。スマートフォンの「頭脳」が進化することで、複雑なAIタスクをデバイス上で高速に処理できるようになります。 新機能で特に注目されるのが、自分の声でリアルタイム翻訳を行う「Live Translate」です。従来の翻訳機能と異なり、まるで自分がその言語を話しているかのような自然なコミュニケーションを可能にします。Tensor G5の高度な音声処理能力が可能にするこの機能は、海外とのビジネスなどで大きな変革をもたらす可能性があります。 さらに、ユーザーの意図を先読みしてアシストするエージェント機能「Magic Cue」や、Pixel 10 Proに搭載される「100x ProRes Zoom」もTensor G5の性能によって実現されます。これらの機能は、単なる操作の補助にとどまらず、ユーザーの生産性を高めるパートナーとしてのスマートフォンの役割を強化することを示唆しています。 今回の発表は、AI処理がクラウドから個人のデバイス(エッジ)へ移行する流れを象徴します。デバイス上でAIが完結すれば、プライバシーと応答速度の向上が両立します。経営者エンジニアにとって、この「エッジAI」の進化がもたらす新たなビジネスチャンスや生産性向上の可能性は、注視すべき重要なトレンドと言えるでしょう。

AppleのオンデバイスAI、iOS 26アプリで実用化進む

サードパーティの開発者らが、Appleの最新OS「iOS 26」の公開に伴い、同社のオンデバイスAIモデルを自社アプリに組み込み始めています。この動きは、Apple開発者向け会議(WWDC)で発表したAIフレームワーク「Foundation Models」を活用したものです。開発者推論コストを気にすることなく、支出分析やタスク管理の自動化といった機能を実装できます。これにより、ユーザー体験の向上が期待されます。 Appleの「Foundation Models」は、デバイス上でAI処理を完結させるのが特徴です。これにより開発者推論コストを負担せず、ユーザーのプライバシーも保護できます。OpenAIなどの大規模モデルとは異なり、既存アプリの利便性を高める「生活の質(QoL)」向上に主眼が置かれています。 生産性向上アプリでの活用が目立ちます。タスク管理アプリ「Tasks」は、入力内容からタグを自動提案したり、音声内容を個別のタスクに分解したりします。日記アプリ「Day One」では、エントリーの要約やタイトルをAIが提案し、より深い記述を促すプロンプトを生成します。 専門分野や学習アプリでも導入が進んでいます。家計簿アプリ「MoneyCoach」は、支出が平均より多いかを分析して提示します。単語学習アプリ「LookUp」では、単語を使った例文をAIが自動生成したり、その語源を地図上に表示したりするユニークな機能が追加されました。 活用範囲は多岐にわたります。子供向けアプリ「Lil Artist」では、キャラクターとテーマを選ぶとAIが物語を創作。レシピアプリ「Crouton」はテキストから調理手順を自動分割します。電子署名アプリ「SignEasy」は契約書の要点を抽出し、利用者に要約を提示します。 これらの事例は、AppleオンデバイスAIが大規模生成AIとは異なる形でユーザー体験を向上させる可能性を示します。プライバシーとコストの課題をクリアしたことで、今後多くの開発者が追随するでしょう。身近なアプリがより賢くなることで、iPhoneエコシステム全体の魅力が一層高まりそうです。

Google Chrome、AI統合で大刷新 Geminiで生産性向上へ

Googleは9月18日、Webブラウザ「Chrome」に自社のAIモデル「Gemini」を統合する、史上最大級のアップデートを発表しました。これにより、複数タブ情報の要約やアドレスバーからのAI検索が可能になります。将来的には面倒な作業を自動化するエージェント機能も導入し、ユーザーの生産性を飛躍的に高めることを目指します。 新たに搭載される「Gemini in Chrome」は、ブラウザの強力なAIアシスタントとして機能します。例えば、調査のために開いた多数のタブの内容を横断的に比較・要約させ、旅行の旅程作成や商品の比較検討といった作業を効率化します。これにより、情報収集にかかる時間を大幅に短縮できるでしょう。 アドレスバー(オムニボックス)もAIで強化されます。Google検索の「AIモード」が統合され、より長く複雑な質問を直接入力できるようになります。また、閲覧中のページ内容に基づいた関連質問が提案され、ページを離れることなく、サイドパネルでAIによる回答を確認できます。 最も注目されるのが、数ヶ月以内に導入予定の「エージェント機能」です。これは、ユーザーの指示に基づき、食料品の注文や散髪の予約といった複数ステップのタスクをChromeが自律的に実行する機能です。面倒な日常業務をAIに任せる未来が近づいています。 Geminiは、カレンダーやYouTube、マップといった他のGoogleアプリとも深く連携します。これにより、閲覧中のページから離れることなく会議の予定調整や動画内の特定場面の検索が可能になります。また、過去に閲覧したページを曖昧な記憶から探し出す機能も追加される予定です。 AIはセキュリティ強化にも活用されます。オンデバイスAIモデル「Gemini Nano」を用いて、巧妙化するフィッシング詐欺や偽のウイルス警告を検知・ブロックします。さらに、パスワードが漏洩した際には、対応サイトでワンクリックでパスワードを自動変更する機能も近日中に追加されます。 これらの新機能は、まず米国のMacおよびWindowsユーザー(言語設定が英語)向けに提供が開始されます。その後、モバイル版(Android/iOS)や他の国・言語へも順次展開される計画です。企業向けにはGoogle Workspaceを通じて提供されます。

Google、Pixel 10とWatch 4を発表、Gemini AI機能を大幅強化

最新Pixel製品群

Pixel 10シリーズをフル展開
Pixel Watch 4を同時発表
Pixel Buds A Series 2も投入
アクセサリー「Pixelsnap」も展開

最先端AIと機能強化

Pixel向けGemini新機能5種
最新Google AIによる利便性向上
Watch 4に緊急衛星通信搭載
Pixel開発10周年記念のモデル

Googleは2025年9月16日の「Made by Google 2025」において、スマートフォン「Pixel 10」シリーズや「Pixel Watch 4」を含む新製品ラインナップを発表しました。この最新ポートフォリオは、Pixel開発10周年という節目を記念し、最先端のGoogle AIを深く統合しています。特に、デバイス上で動作する生成AI「Gemini」の機能が大幅に強化され、ユーザー体験の劇的な向上を目指します。

今回発表されたPixel 10シリーズには、通常モデルに加え、Pro、Pro XL、そして折りたたみ式のPro Foldが揃い、フルラインナップとなりました。デザインも一新され、発売10周年を飾るにふさわしいアップグレードが施されています。企業や開発者は、これらの多様なフォームファクターで、AIを活用した新しいモバイルソリューションの可能性を探ることが可能です。

新しいPixel製品群の核となるのは、高度に統合されたAI機能です。Googleは、Pixel上でGemini5つの新たな機能を提供することを明らかにしました。この最新のGoogle AIは、これまで以上にユーザーのパーソナライゼーションを可能にし、日常的なタスクをよりスムーズに実行できるよう設計されています。AIによる生産性向上は、ビジネス利用における最大の関心事となるでしょう。

また、同時に発表された「Pixel Watch 4」にも注目が集まります。Watch 4は、緊急時に備えた衛星通信機能(Emergency Satellite Communications)を搭載しており、ユーザーの安全確保を最優先しています。さらに「Pixel Buds A Series 2」やアクセサリー群「Pixelsnap」も投入され、Googleエコシステム全体が強化されています。

AT&T、AI秘書で迷惑電話を遮断 ネットワーク履歴活用し精度向上

機能と動作原理

未登録番号からの着信を自動で一次応答
通話履歴に基づき人間関係を分析
声や緊急性から発信者が人間か判定

優位性とユーザー体験

特定のデバイス依存なしで利用可能
GoogleAppleとの差別化要素
リアルタイムで文字起こしを確認可能
AIによる要約やメッセージ取得

AT&T;は、迷惑電話やロボコールを自動で選別するAIアシスタント機能「デジタルレセプショニスト」のテストを一部顧客向けに開始しました。これは個人の通話履歴データを活用し、キャリアのネットワーク側で自動的に通話をスクリーニングするものです。未知の番号からの着信に対し、AIが発信者と用件を確認することで、多忙なビジネスパーソンの生産性向上に貢献します。

この機能の最大の特徴は、AIが個々の端末ではなく、AT&T;のネットワーク全体に組み込まれている点です。GoogleAppleの既存機能がデバイス上の連絡先リストに依存するのに対し、AT&T;のAIはネットワークから得るユーザーのコールパターンを分析します。これにより、頻繁なやり取りを把握し、信頼できる発信者を正確に判断することで、より高い精度での通話フィルタリングを実現しています。

未知の番号から着信があった場合、AIアシスタントが自動で応答し、発信者が人間であるか、または緊急性があるかを声のトーンなどから判定します。基準を満たした通話のみを本人に転送するか、メッセージを残すかを選択できます。

また、ユーザーは専用アプリを通じてAIによる通話のリアルタイム文字起こしを確認し、いつでも会話に加わることも可能です。AT&T;の最高データ責任者によると、このAIアシスタントは単なるスクリーニングに留まらず、将来的に予約やスケジュール調整といった複雑なタスクの代行へと進化する可能性を秘めています。