オンデバイスに関する最新ニュース（29件） | 【AI Times】生成AIやLLMの最新情報・ニュース

Google、オンデバイスAI開発コンペの受賞者を発表

2025年12月10日 Google アシスタントデザイナーオンデバイスウェアラブルクラウドプライバシー画像音声ロボット

障害者支援とオフライン活用

視覚障害者向けウェアラブルAIが優勝

胸部カメラ映像をリアルタイム解析

認知障害者支援の完全オフライン動作

個人の発話特徴をローカル学習

警備・教育へのエッジ実装

警備カメラ映像の文脈的脅威判定

通信遮断地域での教育ハブ構築

ロボットやJetson上での実装

詳細を見る

Googleは12月10日、オンデバイスAIモデル「Gemma 3n」を活用した開発コンペ「Impact Challenge」の受賞者を発表しました。600以上の応募から選出されたプロジェクトは、クラウドに依存しないエッジAIが、低遅延かつ高プライバシーで社会課題を解決する可能性を実証しています。

最優秀賞の「Gemma Vision」は、視覚障害者が胸部に装着したカメラ映像をAIが解析し、周囲の状況を伝えるウェアラブル・アシスタントです。白杖を持つ手が塞がらないよう音声や小型コントローラーで操作でき、すべての処理をデバイス上で完結させることで、実用的な応答速度を実現しています。

2位の「Vite Vere Offline」は、認知障害者のために画像を音声指示に変換する完全オフラインアプリです。3位の「3VA」は、脳性麻痺を持つデザイナー向けにピクトグラムを豊かな文章へ変換するシステムで、ローカル環境での追加学習により、個人の意図を正確に反映させることに成功しました。

そのほか、警備カメラの映像から脅威のみを文脈的に識別するシステムや、インターネット接続がない地域向けの教育用マイクロサーバーなど、多彩なプロジェクトが入賞しました。これらの事例は、AIが画面の中だけでなく、物理的な制約のある現場でいかに具体的価値を生み出せるかを示唆しています。

出典：Google公式

Google、Pixel WatchのAI操作と応答機能を強化

2025年12月09日 Google オンデバイスウェアラブルクラウドエネルギー音楽

AIによる片手操作の拡充

ダブルピンチ等の新ジェスチャー

画面に触れず通知や音楽を操作

操作可能なタイミングを画面に表示

オンデバイスAIで応答生成

Gemmaベースのモデル搭載

スマホ未接続でも返信を作成可能

処理速度が2倍に高速化

メモリ効率は3倍近く改善

詳細を見る

Googleは12月9日、Pixel Watch向けにAIジェスチャーとスマートリプライのアップデートを発表しました。Pixel Watch 4では片手操作が強化され、Pixel Watch 3以降ではオンデバイスAIによる返信生成が可能になります。

新たなジェスチャーとして「ダブルピンチ」と「手首の回転」が追加されました。画面に触れることなく、アラームのスヌーズや音楽の一時停止、電話への応答などが可能です。両手が塞がっている場面でのUXが大幅に向上します。

スマートリプライ機能には、Googleの軽量LLMであるGemmaベースのモデルが採用されました。これにより、スマートフォンと接続されていない状態でも、時計単体で文脈に沿った返信候補を生成できるようになります。

この新モデルは前世代と比較して2倍の高速化を実現し、メモリ効率も約3倍に改善されています。エッジAIの活用により、通信環境に依存しない安定したパフォーマンスと、ウェアラブル端末に求められる省電力性を両立しました。

今回の更新は、日常生活における「ながら操作」の利便性を高めるものです。ウェアラブルデバイスにおいて、クラウドに頼らないエッジAI処理の実用性が高まっており、今後のアプリ開発やサービス設計にも影響を与えるでしょう。

出典：Google公式

Google、Android XR拡大　Galaxy新機能とXreal製グラス公開

2025年12月08日 Google Meta Apple サムスン Gemini Android iOS Windows 生産性エコシステムエンジニアハードウェアオンデバイスウェアラブル提携

Galaxy XRの機能拡張

Galaxy XRがWindows PCと連携、作業空間を拡張

移動中も画面が安定するトラベルモードを搭載

表情をリアルに再現するLikenessで自然な対話

軽量グラス「Project Aura」

Xrealと協業、軽量な有線XRグラスProject Aura

70度の視野角を持ち、現実とデジタル情報を融合

サングラスのような形状でAndroidアプリが動作

エコシステムの開放戦略

既存アプリが修正なしで動作、開発コストを抑制

AIグラスはiPhoneにも対応、囲い込みを打破

詳細を見る

Googleは8日、Android XRの大型アップデートと新デバイス計画を発表しました。Samsung製ヘッドセット「Galaxy XR」の機能強化に加え、Xrealと共同開発した軽量グラス「Project Aura」を初公開。AppleやMetaが先行するXR市場に対し、オープンなエコシステムで攻勢を強めます。

Galaxy XR向けには、生産性を高める新機能が追加されました。Windows PCと接続して仮想空間に画面を表示する「PC Connect」や、飛行機内でも安定した映像を楽しめる「トラベルモード」が登場。自身のリアルな表情をアバター化する「Likeness」により、ビデオ会議の質も向上します。

注目は、Xrealと提携した有線XRグラス「Project Aura」です。従来のヘッドセットとは異なり、サングラスのような軽量な形状を実現。スマホ等と有線接続し、70度の視野角で現実世界にデジタル情報を重ねて表示できます。2026年の発売を目指し、日常使いできるXRデバイスとして期待されます。

Android XRの最大の強みは、既存のAndroidアプリ資産を活用できる点です。UberやYouTube Musicなどのアプリが、開発者の追加作業なしでXRデバイス上で動作します。これにより、競合他社が苦戦するアプリ不足の問題を解消し、ユーザーにとっての実用性を即座に提供します。

さらにGoogleは、AIグラスにおけるiOS対応も明言しました。iPhoneユーザーでもGemini機能をフルに利用可能にする方針で、OSの壁を超えた普及を狙います。特定のハードウェアに縛られない柔軟な戦略は、ウェアラブル市場におけるGoogleの優位性を高める一手となるでしょう。

出典：Google公式 | The Verge

スマホNPU進化も恩恵不明確、主要AIはクラウド依存

2025年12月04日専門家半導体ハードウェアオンデバイスクラウドデータセンターセキュリティプライバシー

性能向上と用途の乖離

NPU性能は数ヶ月で4割向上

具体的な実用メリットの説明不足

メーカーによるスペック競争が先行

オンデバイスAIの現在地

理想は高セキュリティな個人AI

現実はクラウド処理が主流

ハード進化に見合うアプリ不在

詳細を見る

スマートフォンに搭載されるNPUの性能が飛躍的に向上しているにもかかわらず、ユーザーが享受するAI体験の質は変わっていないと米Ars Technicaが報じました。チップメーカーが誇るハードウェアの進化と、実際のアプリ利用におけるクラウド依存の現状に大きな乖離が生じています。

NPUは数ヶ月ごとに30〜40％の高速化を実現していますが、その処理能力を活かす具体的な用途は提示されていません。消費者は「なぜAI用のハードウェアが必要なのか」という疑問に対する明確な答えを得られず、メーカーによるスペック競争の恩恵を実感できていないのが実情です。

専門家は、プライバシー保護に優れたオンデバイスAIの普及を期待していますが、主要な生成AIツールは依然としてデータセンター上の巨大サーバーで稼働しています。スマホ単体で完結する高度なAI処理が実現しない限り、手元の高性能チップは有効活用されません。

出典：Ars Technica

Liquid AI、エッジAI開発の「設計図」を全公開

2025年12月01日 Llama 推論 GPU ハードウェアオンデバイスクラウドデータセンターエネルギーセキュリティプライバシー画像音声スタートアップ MIT

企業向け小規模モデルの革新

51ページの技術レポートを公開

独自のLFM2アーキテクチャ詳解

CPU環境での推論効率を最大化

競合を凌ぐ処理速度と品質

実践的なハイブリッド戦略

自社データでのオンプレミス運用

画像・音声対応のマルチモーダル

クラウド不要のローカル処理実現

エッジとクラウドの協調動作へ

詳細を見る

MIT発のスタートアップLiquid AIは2025年12月1日、最新AIモデル「LFM2」の技術レポートを公開しました。これは単なるモデル提供にとどまらず、企業が独自のハードウェア制約に合わせて高性能な小規模モデルを構築するための「設計図」を提供するものです。巨大なGPUクラスターを前提としないこのアプローチは、コストやプライバシーを重視する企業のAI戦略に、オンデバイスでの実用化という新たな選択肢をもたらします。

LFM2の最大の特徴は、一般的なCPUやモバイルSoC上での動作に最適化されている点です。独自開発されたハイブリッドアーキテクチャにより、同規模の競合モデルであるLlama 3.2やGemma 3と比較して、推論速度と品質の両面で高いパフォーマンスを発揮します。これにより、スマートフォンやノートPC、産業機器など、通信環境や電力に制約のあるエッジ環境でも、遅延の少ない高度なAI処理が可能になります。

今回公開された51ページのレポートでは、アーキテクチャ探索プロセスやトレーニングデータの混合比率、知識蒸留の手法など、モデル開発の詳細なレシピが明かされました。企業はこの情報を参照することで、ブラックボックス化した外部APIに依存することなく、自社のデータセンターやデバイス上で完結するAIシステムを構築・運用できるようになります。これは、セキュリティ要件の厳しい産業分野において大きなアドバンテージです。

さらにLFM2は、テキストだけでなく画像や音声にも対応するマルチモーダル機能を、トークン効率を極限まで高めた形で実装しています。現場でのドキュメント理解や音声操作といったタスクを、データを外部に送信することなくローカルで完結させることが現実的になります。Liquid AIの提示するこのモデルは、エッジとクラウドが適材適所で連携する「ハイブリッドAI」時代の標準的な構成要素となるでしょう。

出典：VentureBeat

Hugging Faceがv5発表、PyTorch特化と相互運用性強化

2025年12月01日 OpenAI Flow 生産性エコシステム Llama エンジニア推論事前学習オンデバイスインフラトランスフォーマー

開発効率を高める構造改革

モデル定義をモジュール化し保守性向上

開発基盤をPyTorchへ完全一本化

実用性を極めた学習・推論

大規模な事前学習への対応を強化

OpenAI互換の推論サーバー機能導入

低精度の量子化を標準機能として統合

エコシステムをつなぐハブへ

外部推論エンジンとの連携を円滑化

ローカル実行やオンデバイス対応

詳細を見る

Hugging Faceは、AI開発のデファクトスタンダードであるライブラリの最新版「Transformers v5」を発表しました。本バージョンでは「相互運用性」と「シンプルさ」を最優先し、コード構造のモジュール化やPyTorchへのバックエンド一本化を断行。急速に拡大するAIエコシステムにおいて、エンジニアがより効率的に学習・推論を行えるよう、量子化の標準サポートや外部ツールとの連携を強化した大型アップデートです。

前バージョンのリリースから5年、Transformersは爆発的な成長を遂げました。1日あたりのインストール数は2万回から300万回へと急増し、累計ダウンロード数は12億回を突破。サポートするモデルアーキテクチャも40種類から400種類以上へと拡大しており、AI技術の民主化と普及を支える重要なインフラとしての地位を確立しています。

v5の最大の焦点は「シンプルさ」の追求です。開発チームは「コードこそが製品である」という哲学のもと、モデル定義のモジュール化を推進。複雑化していたコードベースを整理し、新しいモデルの追加や保守を容易にしました。これにより、コミュニティによる貢献プロセスが簡素化され、最新モデルへの対応速度がさらに向上します。

技術的な大きな転換点として、バックエンドをPyTorchに一本化します。TensorFlowやFlaxのサポートを縮小し、PyTorch財団との連携を深めることで、パフォーマンスと安定性を最大化します。同時に、JAXエコシステムとの互換性は維持し、多様な開発環境やニーズに応える柔軟性も確保しています。

実用面では、推論機能と量子化が大幅に強化されました。新たにOpenAI互換のAPIを持つ「transformers serve」を導入し、手軽な推論サーバー構築が可能に。また、8-bitや4-bitといった低精度モデルの量子化を「第一級市民」として扱い、リソース制約のある環境でも高性能なモデルを効率的に扱えるようになります。

最終的な目標は、あらゆるAIツールとのシームレスな連携です。UnslothやAxolotlでの学習から、vLLMやllama.cppを用いた推論・ローカル実行まで、Transformers v5はエコシステムのハブとして機能します。この高い相互運用性により、開発者は最適なツールを自由に組み合わせ、生産性を最大化できるでしょう。

出典：Hugging Face

MSのPC操作AI「Fara-7B」　端末完結でGPT-4o凌駕

2025年11月24日マイクロソフト Copilot Windows Qwen GPT-4 推論リスクオンデバイスクラウドセキュリティプライバシー MIT エージェントベンチマーク

端末完結でGPT-4o超え

70億パラメータの軽量モデルでPC動作

WebVoyagerで勝率73.5%を達成

視覚情報のみでマウス・キー操作

高度なプライバシーと安全設計

データが外部に出ないピクセル主権

重要操作前に停止する安全機構

革新的な学習手法と入手性

合成データによる効率的な学習

MITライセンスで商用利用も可能

詳細を見る

マイクロソフトは2025年11月24日、PC操作に特化した新しい小規模言語モデル（SLM）「Fara-7B」を発表しました。わずか70億パラメーターながら、GPT-4oベースのエージェントを凌駕する性能を記録。データが外部に出ないオンデバイス実行を実現し、プライバシー保護と低遅延を両立させています。

最大の特徴は、人間と同じように画面の視覚情報だけを頼りに操作を行う点です。HTMLコード等の裏側情報を必要とせず、スクリーンショットからボタン位置などを認識してマウスやキーボードを操作します。Web操作のベンチマーク「WebVoyager」では、GPT-4o（65.1%）を上回る73.5%のタスク成功率を達成しました。

ビジネス利用で重要なのがセキュリティです。Fara-7Bはローカル環境で動作するため、機密情報がクラウドに送信されるリスクを排除する「ピクセル主権」を確立しています。また、送金やメール送信などの不可逆的な操作の直前には、必ずユーザーの同意を求める「クリティカルポイント」機能が組み込まれています。

開発には「知識の蒸留」という高度な手法が用いられました。マルチエージェントシステム「Magentic-One」が生成した14万件以上の高品質な合成データを学習させることで、小型モデルながら複雑な推論能力を獲得しています。ベースモデルには視覚処理に優れたQwen2.5-VL-7Bが採用されました。

本モデルは現在、Hugging Face等を通じてMITライセンスで公開されており、商用利用を含む試験運用が可能です。Windows 11搭載のCopilot+ PCでも動作確認済みで、企業は自社のセキュリティ要件に合わせたPC操作自動化エージェントの開発を、低コストかつ安全に開始できます。

出典：Microsoft公式 | VentureBeat

PowerToysのAI貼り付け、ローカル処理で無料・安全化

2025年11月20日 OpenAI マイクロソフト Gemini Windows AI活用業務効率 Llama オンデバイスクラウド

ローカルAI活用でコスト削減

NPU活用でAPI課金不要

データを守るオンデバイス処理

オフラインでも翻訳・要約が可能

多様なモデルへの対応拡大

GeminiやMistralも選択可能

オープンソースのOllamaと連携

UI改善で操作性向上

詳細を見る

MicrosoftはWindows 11向けユーティリティ「PowerToys」を更新し、Advanced Paste機能を強化しました。ユーザーはクラウドを経由せず、デバイス上のAIモデルを利用して高度な貼り付けが可能になります。

特筆すべきは、NPU（ニューラル処理装置）を活用した完全ローカル処理です。これによりAPI利用料が不要になるほか、データが外部に送信されないため、機密情報を含むテキストも安心して扱えます。

具体的には、Microsoft Foundry LocalやOllamaを介してローカルモデルを実行します。クリップボードの内容を瞬時に翻訳・要約するなど、業務効率を飛躍的に高める機能が手軽に利用可能です。

さらに、連携可能な外部モデルも拡充されました。従来のOpenAIに加え、Azure OpenAIやGemini、Mistralに対応。用途や契約状況に応じて最適なAIモデルを柔軟に選択できる設計へと進化しています。

出典：The Verge

Google、インドでAI詐欺対策強化も機種と言語に課題

2025年11月20日 Google Gemini Android エコシステムオンデバイスインド

AIによる通話詐欺検知

Gemini Nanoで解析

Pixel 9以降かつ英語のみ

画面共有の悪用防止

金融アプリ利用時に警告

ワンタップで共有停止

普及への高いハードル

Pixelシェア1%未満

偽アプリ根絶に至らず

詳細を見る

Googleは20日、インドにおけるデジタル詐欺対策として、AIを活用した新たな保護機能を発表しました。Pixel 9シリーズ向けのリアルタイム詐欺検出や、主要な金融アプリでの画面共有警告などが導入されます。インドではデジタル決済の普及に伴い詐欺被害が急増しており、2025年だけで数億ドル規模の損失が発生している深刻な状況に対応する狙いです。

目玉となるのは、同社の軽量AIモデルGemini Nanoを活用した通話分析機能です。デバイス上で処理が完結するため、通話内容がGoogleのサーバーに送信されることはありません。未知の番号からの通話中に詐欺の兆候を検知すると、ユーザーに警告音と通知で知らせる仕組みですが、現状は英語のみの対応となっています。

この機能の普及には大きな壁が存在します。インドのスマートフォン市場でAndroidは96%を占めますが、対応するPixel端末のシェアは1%未満に過ぎません。また、多言語国家であるインドにおいて、英語話者のみを対象とした機能展開では、最も脆弱な層を保護しきれないという指摘もあります。

一方で、より広範なユーザーに向けた対策も講じられています。PaytmやGoogle Payなどの金融アプリと連携し、通話中に画面共有を求められた際に警告を表示する機能を試験導入しました。詐欺師がワンタイムパスワード等を盗み見る手口を防ぐもので、こちらは将来的にインドの現地言語にも対応する予定です。

Googleは他にも、サイドローディングによる危険なアプリのインストールを1億回以上ブロックするなど対策を強化しています。しかし、公式ストアであるGoogle Play上でも依然として偽アプリが散見されるなど、巨大なエコシステムの健全化には依然として課題が残されています。

出典：TechCrunch

Google、企業向けPixelでRCS全記録機能を導入

2025年11月18日 Google Android オンデバイスセキュリティコンプライアンス

コンプライアンス対応の課題

暗号化による記録困難な状況を解決

訴訟や規制対応で完全なログが不可欠

デバイス上での直接記録

アプリ連携で送受信・編集・削除を捕捉

エンドツーエンド暗号化を維持し記録

Pixel等の管理対象端末で利用可能

管理性と拡張性

IT管理者が一元的に設定可能

主要なサードパーティと連携済み

詳細を見る

Googleは2025年11月18日、企業向けAndroid端末において、RCSメッセージのアーカイブ機能を導入しました。これにより、Pixelなどの管理対象デバイスを利用する組織は、高度なセキュリティと法的な記録義務の両立が可能になります。

企業通信が暗号化プラットフォームへ移行する中、従来の通信キャリア依存のログ取得ではコンプライアンス維持が困難でした。新機能は、訴訟時の証拠開示や情報公開請求への確実な対応を実現する重要なソリューションです。

本機能はサードパーティ製アプリがGoogle Messagesと直接連携し、デバイス上でデータを取得します。メッセージの送受信に加え、編集や削除も記録されるため、IT部門は完全かつ正確なログを確保できます。

特筆すべきは、アーカイブ処理が端末内で行われるため、通信経路のエンドツーエンド暗号化が維持される点です。従業員には機能が有効であることが通知され、SMSやMMSとの後方互換性も担保されています。

IT管理者は設定画面から容易に機能を展開でき、CelltrustやSmarshといった主要ベンダーがすでに対応を表明しています。Googleは、2026年に向けてさらなる対応アプリの拡充を予定しています。

出典：Google公式

Pixel大型更新、AIが通知要約し生産性を劇的改善

2025年11月11日 Google Gemini 生産性業務効率オンデバイスエネルギーセキュリティ画像イギリス日本

AIで業務効率を最大化

長文会話をAIが自動で要約

通話内容を自動で文字起こし・要約

AIが詐欺の可能性をチャットで警告

重要連絡先(VIP)の通知を自動で優先

Geminiで創造性を解放

メッセージ内で写真をAIが再構成

集合写真の表情や装飾をAIが修正

利便性と安全性の向上

詐欺電話検知を多国で展開

マップに省電力モードを追加

詳細を見る

Googleは2025年11月、同社のスマートフォン「Pixel」シリーズ向けに、AI機能を大幅に強化するソフトウェアアップデート「Pixel Drop」を発表しました。AIモデルGeminiを活用し、通知の自動要約や高度な詐欺検知、写真編集など多岐にわたる新機能を提供。ビジネスユーザーの生産性向上とセキュリティ強化を両立させるアップデートとなっています。

今回のアップデートの目玉は、AIによる通知の自動要約機能です。長文のメッセージや活発なグループチャットの内容を通知画面で簡潔にまとめてくれるため、重要な情報を素早く把握できます。情報過多になりがちな現代において、ビジネスパーソンが集中力を維持し、効率的にコミュニケーションを取る上で強力なツールとなるでしょう。

セキュリティ面も大幅に強化されました。チャットメッセージの通知段階で、AIが詐欺の可能性を検知し「Likely scam」と警告を表示する新機能を追加。従来の通話中の詐欺検知機能も、イギリスやカナダなど提供地域を拡大し、巧妙化するオンライン詐欺からユーザーを保護する体制をグローバルに広げています。

Googleの最新AIモデルGemini Nanoがオンデバイスで活用される点も注目です。メッセージアプリ内で写真を再構成する「Remix」機能や、通話内容を文字起こし・要約する「Call Notes」機能（日本でも利用可能に）が実装され、創造性と業務効率の両面でAIの力をより身近に体感できるようになりました。

Googleフォトでは、AIによる写真編集機能がさらに進化。「Help me edit」機能を使えば、「サングラスを外して」「笑顔にして」といった自然言語の指示で、集合写真の細部を簡単に修正できます。個人の写真ライブラリから最適な画像を基に編集するため、極めて自然な仕上がりが特徴です。

このほか、重要な連絡先からの通知を優先するVIP機能の強化や、Googleマップ運転中のバッテリー消費を抑える省電力モードも追加されました。今回のアップデートは、AIをあらゆる場面で活用し、ユーザー体験を向上させるGoogleの強い意志を示すものと言えます。

出典：Google公式

Google、新AI基盤でプライバシーと高性能を両立

2025年11月11日 Google Apple Gemini 検索 AI活用半導体オンデバイス TPU クラウドセキュリティプライバシー

プライバシーとAI性能の両立

高度なAI処理をクラウドで実現

オンデバイス並みのプライバシー保護

AppleのPCCに類似した仕組み

堅牢なセキュリティ技術

専用チップTPUで処理を高速化

技術TEEでデータを隔離・暗号化

Googleさえアクセス不可能な設計

身近な機能の高度化

Pixel 10の新機能「Magic Cue」強化

Recorderアプリの多言語要約

詳細を見る

Googleは11日、ユーザーデータのプライバシーを保護しながら、クラウド上で高度なAIモデル「Gemini」を実行できる新基盤「Private AI Compute」を発表しました。オンデバイス処理と同等のセキュリティを保ちつつ、より複雑なAIタスクを可能にします。これはAppleの「Private Cloud Compute」に追随する動きです。

AI機能が高度化するにつれ、スマートフォンなどのデバイス上での処理には計算能力の限界が見えてきました。そこでGoogleは、プライバシーを保護したままクラウドの膨大な計算資源を活用するハイブリッドなアプローチとして、この新基盤を開発しました。利便性と安全性の両立を目指します。

新基盤の中核は、Google独自のAIチップTPU（Tensor Processing Units）と、データを隔離・暗号化するTEE（信頼できる実行環境）です。これにより、ユーザーデータはクラウド上で処理される際にも保護され、Google自身でさえ内容を閲覧することは不可能だと説明しています。

この動きは、Appleが先に発表した「Private Cloud Compute」と酷似しており、大手IT企業間でAIのプライバシー保護が重要な競争軸となっていることを示しています。ユーザーは、利便性とプライバシーの両方を高いレベルで享受できる時代を迎えつつあるのではないでしょうか。

具体的な応用例として、次期スマートフォン「Pixel 10」に搭載されるAI機能「Magic Cue」の提案精度が向上するほか、録音アプリ「Recorder」での文字起こし要約がより多くの言語で利用可能になります。身近な機能がより賢く、便利になることが期待されます。

Googleは、このシステムの安全性を客観的に示すため、セキュリティ企業NCC Groupによる独立した分析を受けたことも公表しています。厳格なプライバシーガイドラインを満たしていることが確認されており、技術的な透明性の確保に努める姿勢を見せています。

今回の発表は始まりに過ぎないとGoogleは述べています。今後、オンデバイスとクラウドの長所を融合させたプライベートAI技術が、検索やGmailなど、より広範なサービスに展開される可能性があります。企業のAI活用においても重要な選択肢となるでしょう。

出典：The Verge | Ars Technica | Google公式

家庭用AI『Gemini』、米国で先行提供開始

2025年10月29日 Google Gemini 検索アシスタント AI活用オンデバイス米国

Gemini搭載の新アシスタント

既存アシスタントを刷新

Nestデバイス上で動作

より複雑なタスクと自然な会話

基盤はGemini LLM

早期アクセスの注意点

旧アシスタントには戻れない

一部機能は有料プラン限定

参加にはアプリからの申請が必要

対象は米国ユーザーから

詳細を見る

Googleは2025年10月29日、米国のスマートホームユーザー向けに、新しいAIアシスタント「Gemini for Home」の早期アクセス提供を開始しました。これは、同社のNestデバイスに搭載されている既存のGoogle アシスタントを置き換えるもので、スマートホーム体験を根本から刷新する重要なアップデートとなります。

「Gemini for Home」の最大の特徴は、基盤となる大規模言語モデル（LLM）「Gemini」です。これにより、従来のGoogle アシスタントと比較して、より複雑な指示を理解し、実行できるようになります。また、人間と話しているかのような、より自然で文脈に沿った会話が可能になる点も大きな進化と言えるでしょう。

早期アクセスに参加するには、Google Homeアプリの設定メニューから申請が必要です。承認されると、利用者が持つ全ての対応デバイスでGemini for Homeが有効になります。ただし、一度切り替えると元のGoogle アシスタントに戻すことはできないため、注意が必要です。

また、一部の高度な機能は有料サブスクリプション「Google Home Premium」の加入者限定となります。リアルタイムで対話できる「Gemini Live」や、カメラの録画履歴をAIで検索する機能などがこれに該当します。今回の動きは、家庭におけるAI活用を本格化させるGoogleの強い意志の表れと言えます。

出典：The Verge

AI開発の生産性向上、ソフトウェアの断片化解消が鍵

2025年10月22日 Flow 生産性エコシステムエンジニア推論 GPU 半導体ハードウェアオンデバイスクラウドエネルギーベンチマーク

AI開発を阻む「複雑性の壁」

断片化したソフトウェアスタック

ハードウェア毎のモデル再構築

6割超のプロジェクトが本番前に頓挫

エッジ特有の性能・電力制約

生産性向上への道筋

クロスプラットフォームの抽象化レイヤー

最適化済みライブラリの統合

オープン標準による互換性向上

ハードとソフトの協調設計

詳細を見る

ArmをはじめとするAI業界が、クラウドからエッジまで一貫した開発を可能にするため、ソフトウェアスタックの簡素化を急いでいます。現在、断片化したツールやハードウェア毎の再開発がAIプロジェクトの大きな障壁となっており、この課題解決が開発の生産性と市場投入の速度を左右する鍵を握っています。

AI開発の現場では、GPUやNPUなど多様なハードウェアと、TensorFlowやPyTorchといった異なるフレームワークが乱立。この断片化が非効率な再開発を招き、製品化までの時間を浪費させています。調査会社ガートナーによれば、統合の複雑さを理由にAIプロジェクトの6割以上が本番前に頓挫しているのが実情です。

このボトルネックを解消するため、業界は協調した動きを見せています。ハードウェアの違いを吸収する抽象化レイヤーの導入、主要フレームワークへの最適化済みライブラリの統合、ONNXのようなオープン標準の採用などが進んでいます。これにより、開発者はプラットフォーム間の移植コストを大幅に削減できるのです。

簡素化を後押しするのが、クラウドを介さずデバイス上でAIを処理する「エッジ推論」の急速な普及です。スマートフォンや自動車など、電力や処理能力に制約のある環境で高性能なAIを動かすには、無駄のないソフトウェアが不可欠です。この需要が、業界全体のハードウェアとソフトウェアの協調設計を加速させています。

この潮流を主導するのが半導体設計大手のArmです。同社はCPUにAI専用の命令を追加し、PyTorchなどの主要ツールとの連携を強化。これにより開発者は使い慣れた環境でハードウェア性能を最大限に引き出せます。実際に、大手クラウド事業者へのArmアーキテクチャ採用が急増しており、その電力効率の高さが評価されています。

AIの次なる競争軸は、個別のハードウェア性能だけでなく、多様な環境でスムーズに動作する「ソフトウェアの移植性」に移っています。エコシステム全体で標準化を進め、オープンなベンチマークで性能を競う。こうした協調的な簡素化こそが、AIの真の価値を引き出し、市場の勝者を決めることになるでしょう。

出典：VentureBeat

MITとIBM、小型・効率AIで産業応用を加速

2025年10月21日 AI活用推論オンデバイス画像医療 MIT 基盤モデル

産学連携が生む圧倒的成果

特許54件、引用12万件超

産業ユースケース50件以上を創出

医療や化学など多分野へ応用

「巨大」から「小型・効率」へ

巨大モデルからタスク特化型へ転換

性能を維持しモデルを小型化

エッジデバイスでの高速処理実現

少ないデータで賢く学習

自己修正で推論精度を高める新手法

PoCで終わらせない実用化を推進

詳細を見る

マサチューセッツ工科大学（MIT）とIBMが共同で運営する「MIT-IBM Watson AI Lab」は、AI開発の新たな方向性を示しています。設立8周年を迎えた同ラボは、巨大な基盤モデルから、より小さく効率的でタスクに特化したモデルの開発に注力。研究と実用化のギャップを埋め、産業界でのAI活用を加速させることを目指します。これは、AIプロジェクトの多くが概念実証（PoC）で頓挫する現状への明確な回答と言えるでしょう。

この産学連携は目覚ましい成果を上げています。これまでに特許54件を出願し、論文の引用数は12万8000件を超えました。さらに、ヘルスケアや金融、化学など多岐にわたる分野で50件以上の産業ユースケースを創出。AI画像技術によるステント留置の改善や、計算コストの大幅な削減など、具体的なイノベーションを生み出し続けています。

なぜ今、「小型・効率化」が重要なのでしょうか。調査会社ガートナーによると、生成AIプロジェクトの少なくとも30%が2025年末までに概念実証（PoC）の段階で中止されると予測されています。多くの企業がAIへの期待を抱きつつも、価値ある成果に繋げられていないのです。同ラボは、この研究と実用の間の「死の谷」を埋める役割を担っています。

小型化の鍵を握るのが、`once-for-all`や`AWQ`といった革新的な技術です。これらの手法は、モデルのアーキテクチャを最適化し、性能を維持したままサイズを圧縮します。これにより、スマートフォンなどのエッジデバイス上でもAIを高速に実行できるようになります。遅延を減らし、リアルタイムでの応用範囲を大きく広げる可能性を秘めています。

さらに、少ないデータで賢く学習する技術も進化しています。例えば`COAT`（Chain-of-Action-Thought）と呼ばれる手法は、AIが自らの推論プロセスを反復的に自己修正することで、より正確な答えを導き出します。これは、限られた計算資源とデータで、現実世界の複雑な課題を解決するための重要なアプローチです。

これらの研究成果は、IBMのプラットフォーム`watsonx`などを通じて実用化されています。一例が、コンパクトながら高精度な文書理解能力を持つ`Granite Vision`モデルです。企業が保有する膨大な文書から、信頼性の高い情報を抽出し、要約するニーズに応えます。

MIT-IBM Watson AI Labが目指すのは「有用で効率的な知能」の創出です。巨大モデルの開発競争から一歩進み、目的に合わせて最適化されたAIこそが、真の経済的・社会的価値を生み出すと彼らは考えています。この産学連携の取り組みは、AIの実用化を目指す全ての企業にとって、重要な指針となるでしょう。

出典：MIT News

AI PCが再定義する生産性、鍵は「創造性」

2025年10月21日生産性デザインクリエイティブオンデバイスエネルギーセキュリティ動画 MIT

AI PCがもたらす価値

ローカルAI処理による高速化

機密データを保護するセキュリティ

オフラインでも作業可能

低遅延と省エネルギーの実現

創造性が生む事業成果

市場投入までの時間短縮

外部委託費の削減

顧客エンゲージメントの向上

従業員の満足度と定着率向上

詳細を見る

AI PCの登場が、ビジネスにおける「生産性」の定義を根底から変えようとしています。マサチューセッツ工科大学（MIT）の研究で生成AIが人間の創造性を高めることが示される中、NPU（Neural Processing Unit）を搭載した次世代PCがその能力を最大限に引き出します。デバイス上でAI処理を完結させることで、低遅延、高セキュリティ、省エネを実現し、単なる効率化ツールを超えた価値を提供し始めています。

企業のIT意思決定者の45%が、すでにAI PCを創造的な業務支援に活用しています。しかし、一般の知識労働者における同目的での利用率は29%にとどまり、組織内で「クリエイティブ格差」が生じているのが現状です。この格差を埋めることが、AI PCのポテンシャルを全社的に引き出す鍵となります。

AI PCは、従業員が創造的な作業に集中できる環境を整えます。専用のNPUがAI関連の負荷を担うため、ユーザーは思考を中断されることなく、アイデア創出に没頭できます。これにより、バッテリー寿命が延び、待ち時間が減少。デザイン、動画制作、資料作成など、あらゆる業務でリアルタイムの試行錯誤が可能になります。

この創造性の向上は、具体的な事業成果に直結します。マーケティング部門では、数週間かかっていたキャンペーン素材を数時間で生成。技術部門では、設計や試作品開発のサイクルを大幅に短縮しています。営業担当者は、オフラインの顧客先でもパーソナライズされた提案書を即座に作成でき、案件化のスピードを高めています。

最終的に、AI PCは従業員の働きがいをも向上させます。HPの調査では、従業員が仕事に健全な関係を築く上で最も重要な要素は「充実感」であることが示されています。単なるタスク処理ではなく、創造性を発揮できるツールを与えることは、生産性、満足度、定着率の向上につながるのです。

CIO（最高情報責任者）にとって、AI PCの導入は単なる機器の高速化ではありません。その真価は、従業員の創造性を解放し、新たなアイデアや協業、競争力を生み出す企業文化を醸成することにあります。AI PCをいかに活用し、組織全体の創造性を高めるかが、今後の成長を左右するでしょう。

出典：VentureBeat

Acer、50TOPSのAI搭載Chromebookを投入

2025年10月14日 Google Gemini Chrome 生産性 AI活用画像編集ハードウェアオンデバイスクラウドセキュリティ画像

強力なオンデバイスAI

MediaTek製CPUを搭載

50TOPSのAI処理能力

高速・安全なオフラインAI

AIによる自動整理や画像編集

ビジネス仕様の高性能

360度回転する2-in-1設計

最大17時間の長時間バッテリー

最新規格Wi-Fi 7に対応

Gemini 2.5 Proが1年間無料

詳細を見る

Googleは、Acer製の新型ノートPC「Acer Chromebook Plus Spin 514」を発表しました。最大の特徴は、MediaTek Kompanio Ultraプロセッサが実現する強力なオンデバイスAI機能です。オフラインでも高速に動作するAIが、ビジネスパーソンの生産性を飛躍的に高める可能性を秘めています。

新モデルは、50TOPSという驚異的なAI処理能力を備えています。これにより、タブやアプリを自動で整理する「スマートグルーピング」や、AIによる高度な画像編集がデバイス上で直接、高速かつ安全に実行できます。機密情報をクラウドに送る必要がないため、セキュリティ面でも安心です。

ハードウェアもビジネス利用を強く意識しています。360度回転するヒンジでノートPCとタブレットの1台2役をこなし、14インチの2.8K高解像度タッチスクリーン、最大17時間持続するバッテリー、最新のWi-Fi 7規格への対応など、外出先でも快適に作業できる仕様です。

購入者特典として、Googleの最先端AIモデル「Gemini 2.5 Pro」や2TBのクラウドストレージを含む「Google AI Proプラン」が12ヶ月間無料で提供されます。これにより、文書作成やデータ分析といった日常業務がさらに効率化されるでしょう。

今回、デスクトップ型の「Acer Chromebox CXI6」と超小型の「Acer Chromebox Mini CXM2」も同時に発表されました。オフィスでの固定利用から省スペース環境まで、多様なビジネスシーンに対応する製品群で、AI活用を推進する姿勢がうかがえます。

出典：Google公式

AI21が25万トークン対応の小型LLMを発表、エッジAIの経済性を一変

2025年10月08日推論 GPU オンデバイスインフラクラウドデータセンタープライバシーポリシースタートアップベンチマークコンテキストトランスフォーマー

小型モデルの定義変更

30億パラメータのオープンソースLLM

エッジデバイスで25万トークン超を処理

推論速度は従来比2〜4倍高速化

分散型AIの経済性

MambaとTransformerのハイブリッド構造採用

データセンター負荷を減らしコスト構造を改善

高度な推論タスクをデバイスで実行

企業利用の具体例

関数呼び出しやツールルーティングに最適

ローカル処理による高いプライバシー確保

詳細を見る

イスラエルのAIスタートアップAI21 Labsは、30億パラメータの小型オープンソースLLM「Jamba Reasoning 3B」を発表しました。このモデルは、ノートPCやスマートフォンなどのエッジデバイス上で、25万トークン以上という異例の長大なコンテキストウィンドウを処理可能であり、AIインフラストラクチャのコスト構造を根本的に変える可能性を秘めています。

Jamba Reasoning 3Bは、従来のTransformerに加え、メモリ効率に優れたMambaアーキテクチャを組み合わせたハイブリッド構造を採用しています。これにより、小型モデルながら高度な推論能力と長文処理を両立。推論速度は従来のモデルに比べて2〜4倍高速であり、MacBook Pro上でのテストでは毎秒35トークンを処理できることが確認されています。

AI21の共同CEOであるオリ・ゴーシェン氏は、データセンターへの過度な依存が経済的な課題となっていると指摘します。Jamba Reasoning 3Bのような小型モデルをデバイス上で動作させることで、高価なGPUクラスターへの負荷を大幅に軽減し、AIインフラストラクチャのコスト削減に貢献し、分散型AIの未来を推進します。

このモデルは、特に企業が関心を持つユースケースに最適化されています。具体的には、関数呼び出し、ポリシーに基づいた生成、そしてツールルーティングなどのタスクで真価を発揮します。シンプルな業務指示や議事録作成などはデバイス上で完結し、プライバシーの確保にも役立ちます。

Jamba Reasoning 3Bは、同規模の他の小型モデルと比較したベンチマークテストでも優位性を示しました。特に長文理解を伴うIFBenchやHumanity’s Last Examといったテストで最高スコアを獲得。これは、同モデルがサイズを犠牲にすることなく、高度な推論能力を維持していることを示しています。

企業は今後、複雑で重い処理はクラウド上のGPUクラスターに任せ、日常的かつシンプルな処理はエッジデバイスでローカルに実行する「ハイブリッド運用」に移行すると見られています。Jamba Reasoning 3Bは、このハイブリッド戦略の中核となる効率的なローカル処理能力を提供します。

出典：VentureBeat | spectrum.ieee.org

iOS 26、オンデバイスAIでアプリ体験を刷新

2025年10月03日 OpenAI Apple iOS 生産性エンジニア推論オンデバイスプライバシー動画音声

オンデバイスAIの利点

推論コスト不要でAI機能実装

プライバシーに配慮した設計

ネット接続不要のオフライン動作

主な活用パターン

テキストの要約・生成・分類

ユーザー入力に基づく自動提案機能

音声からのタスク分解・文字起こし

パーソナライズされた助言・フィードバック

詳細を見る

Appleが2025年の世界開発者会議（WWDC）で発表した「Foundation Models framework」が、最新OS「iOS 26」の公開に伴い、サードパーティ製アプリへの実装が本格化しています。開発者は、デバイス上で動作するこのローカルAIモデルを利用し、推論コストをかけずにアプリの機能を向上させることが可能です。これにより、ユーザーのプライバシーを保護しながら、より便利な体験を提供できるようになりました。

AppleのローカルAIモデルは、OpenAIなどの大規模言語モデルと比較すると小規模です。そのため、アプリの根幹を覆すような劇的な変化ではなく、日常的な使い勝手を向上させる「生活の質（QoL）」の改善が主な役割となります。推論コストが不要でオフラインでも動作する点が、開発者にとって大きな利点と言えるでしょう。

具体的な活用例として、生産性向上機能が挙げられます。タスク管理アプリ「Tasks」では音声からタスクを自動分割し、日記アプリ「Day One」はエントリーの要約やタイトルを提案します。また、レシピアプリ「Crouton」では、長文から調理手順を自動で抽出するなど、手作業を削減する機能が実装されています。

学習や創造性の分野でも活用が進んでいます。単語学習アプリ「LookUp」は、AIが単語の例文を生成し、学習をサポートします。子供向けアプリ「Lil Artist」では、キャラクターとテーマを選ぶだけでAIが物語を生成。ユーザーの創造性を刺激する新たな体験を提供しています。

個人の趣味や健康管理といった専門分野でも応用は多彩です。フィットネスアプリ「SmartGym」はワークアウトの要約を生成し、テニス練習アプリ「SwingVision」は動画から具体的なフォーム改善案を提示します。このように、AIがパーソナライズされた助言を行う事例が増えています。

今回の動きは、AI機能の導入がより身近になることを示唆しています。開発者は、サーバーコストやプライバシー問題を気にすることなく、高度な機能をアプリに組み込めるようになりました。iOS 26を皮切りに、オンデバイスAIを活用したアプリのイノベーションは、今後さらに加速していくとみられます。

出典：TechCrunch

Pixel 10、AIが不在着信を文字起こし・要約

2025年10月02日 Google オンデバイスプライバシー音声

新AI機能「Take a Message」

不在着信・拒否通話のスマートな処理

会話型AIによるリアルタイム文字起こし

通話後のAIによるアクション提案

2つの人気機能を統合

通話スクリーニングのスパム検出活用

通話メモの要約・ネクストステップ生成

高度なオンデバイスAI

プライバシーに配慮した端末内処理

最新のPixel 10シリーズに搭載

詳細を見る

Googleは2025年10月2日、最新スマートフォン「Pixel 10」シリーズ向けに、新たなAI通話支援機能「Take a Message」を発表しました。この機能は、不在着信や応答を拒否した通話の内容をAIがリアルタイムで文字起こしし、通話後には次のアクションを提案するものです。多忙なビジネスパーソンが重要な連絡を逃さず、効率的に対応できるよう支援することを目的としています。

「Take a Message」の最大の特徴は、Googleの高度な会話型AIを駆使している点です。相手が残したボイスメッセージをリアルタイムで画面にテキスト表示するため、音声を聞けない状況でも内容を即座に確認できます。これにより、会議中や移動中でも重要な用件を逃す心配がありません。

さらに、通話が終了するとAIがメッセージ内容を分析し、要約と推奨される次のアクションを自動生成します。「明日15時に折り返し電話」といった具体的なタスクを提示し、迅速な対応を支援。これは既存の人気機能「Call Notes」の進化形と言えます。

この新機能は、既存の「Call Screen」と「Call Notes」の長所を統合したものです。迷惑電話をブロックする強力なスパム検出機能も継承し、安全性と利便性を両立。処理はすべて端末内で完結するオンデバイスAIのため、プライバシーの観点でも安心できます。

「Take a Message」は、まず最新の「Pixel 10」シリーズで利用可能となります。Googleは、AIを用いてスマートフォンの原点である「通話」体験の再発明を目指しています。今回の新機能は、AIが日常業務を効率化する可能性を示す好例と言えるでしょう。

出典：Google公式

Pixel 10 Pro、AIで100倍ズームを実現

2025年10月02日 Google 半導体オンデバイスクラウド画像

Pro Res Zoomとは

Pixel 10 Pro搭載の新ズーム技術

AIで100倍ズームを実現

Tensor G5チップで高速処理

AIによる画質向上

単なるデジタルズームではない

生成AIが欠落情報を補完

ノイズ除去とシャープ化を両立

デバイス上で数秒で完結

詳細を見る

Googleが、次期スマートフォン「Pixel 10 Pro」に搭載される新たなAIカメラ技術「Pro Res Zoom」を発表しました。この技術は、生成AIを活用して最大100倍のズーム撮影でも鮮明な画質を実現するものです。遠くの被写体を、これまでにないほど詳細に捉えることが可能になります。

Pro Res Zoomの核心は、単なる画像の切り出しと拡大（デジタルズーム）ではない点にあります。撮影データから色や形といった僅かな手がかりを基に、AIが欠落したディテールを生成・補完します。これにより、従来のズーム機能ではぼやけてしまっていた被写体も、驚くほど鮮明な一枚の写真として仕上がります。

この高度な処理は、最新の「Tensor G5」チップによってデバイス上で直接実行されます。最先端の拡散モデル（diffusion model）を数秒で動作させ、ノイズ除去とシャープ化を同時に行います。クラウドにデータを送ることなく、手元で高速に処理が完結するのが大きな特徴です。

この新技術は、ユーザーにどのような価値をもたらすのでしょうか。例えば、遠くにいる野生動物や、スポーツ観戦中の選手の表情など、これまで諦めていたシーンの撮影が可能になります。Pixel 9 Proの「Super Res Zoom」が最大30倍だったのに対し、100倍という圧倒的なズーム性能は、スマートフォンの写真撮影の常識を覆す可能性を秘めています。

Googleの取り組みは、生成AIがクラウド上のサービスから、スマートフォンという日常的なデバイスへと活躍の場を広げていることを示しています。カメラ機能の進化は、AIがもたらすユーザー体験向上の好例と言えるでしょう。

出典：Google公式

Hance、KB級AI音声処理でエッジ市場に革新

2025年09月30日エンジニア創業者半導体オンデバイスクラウドエネルギー音声スタートアップ

驚異の超小型・高速AI

モデルサイズは僅か242KB

クラウド不要のオンデバイス処理

遅延10ミリ秒のリアルタイム性

省電力で多様なデバイスに対応

F1からインテルまで

F1公式無線サプライヤーが採用

Intelの最新チップNPUへ最適化

防衛・法執行分野への応用

大手スマホメーカーとも協議中

詳細を見る

ノルウェーのスタートアップHanceが、キロバイト級の超小型AI音声処理ソフトウェアを開発しました。クラウドを介さずデバイス上で動作し、わずか10ミリ秒の低遅延でノイズ除去や音声の明瞭化を実現。すでにF1の公式無線サプライヤーやIntelといった大企業を顧客に持ち、10月27日から開催されるTechCrunch Disrupt 2025でデモを披露します。

この技術の核心は、わずか242KBという驚異的なモデルサイズにあります。これにより、スマートフォンや無線機など、リソースが限られたエッジデバイス上でのリアルタイム処理が可能になりました。従来のクラウドベースのAIと異なり、通信遅延や消費電力を大幅に削減できる点が大きな強みです。

HanceのAIモデルは、共同創業者が運営する高品質なサウンドライブラリ「Soundly」の音源を用いてトレーニングされました。F1マシンの轟音から火山の噴火音まで、多種多様なデータを学習させることで、過酷な環境下でも特定の音声を分離し、ノイズやエコー、反響を除去する高い性能を達成しています。

その実用性はすでに証明されています。F1チームが使用する無線システムを手がけるRiedel Communicationsは、高速走行中のドライバーとエンジニア間の極めて重要な通信をクリアにするため、Hanceの技術を採用。他にも、防衛や法執行機関といった、リアルタイム性と信頼性が求められる分野からの関心も高まっています。

Hanceは事業拡大を加速させています。半導体大手Intelとは、同社の最新チップ「NPU（ニューラル・プロセッシング・ユニット）」向けにモデルを最適化するパートナーシップを締結。他のチップメーカーや、非公開のスマートフォンメーカーとも協議を進めており、競争優位を保つため、研究開発に注力し続ける方針です。

出典：TechCrunch

Pixel 10、AI通話機能でビジネスを加速

2025年09月29日 Google Gemini Android 生産性検索アシスタントオンデバイス

AIが変えるビジネス通話

グローバル化と利便性向上

オンデバイスAIでリアルタイム翻訳

AIによる自動応答・フィルタリング

カスタマイズ可能な通話画面

車内でのAIアシスタント連携

詳細を見る

Googleが2025年9月29日、最新スマートフォン「Pixel 10」向けに、AIを活用した9つの新しい通話機能を発表しました。これらの機能は、最新AIモデル「Gemini Nano」と独自プロセッサ「Tensor G5」を搭載し、通話中の情報検索やリアルタイム翻訳、議事録作成などを自動化。ビジネスパーソンの生産性向上と、より円滑なコミュニケーションの実現を目指します。

中でも注目すべきは「Magic Cue」機能です。これは、ユーザーの許可のもとGmailやメッセージの内容をAIが解析し、通話中に必要な情報を先回りして提示するものです。例えば、顧客との通話中に注文番号を自動で表示するなど、情報検索の手間を大幅に削減し、ビジネスの機会損失を防ぎます。

グローバルなビジネス展開を加速させるのが「Voice Translate」です。デバイス上で完結するAIが、通話内容をリアルタイムで翻訳します。話者の声質を保ったまま自然な翻訳が可能なため、言語の壁を越えた円滑なコミュニケーションを実現。海外の取引先やチームとの連携を強力にサポートするでしょう。

「Call Notes」機能も大幅に進化しました。通話内容を記録するだけでなく、そこからカレンダーの予定やタスクをAIが提案し、ワンタップで作成可能になります。これにより、通話後のフォローアップ作業が劇的に効率化され、重要なアクションの抜け漏れを防ぐことが期待できます。

このほかにも、迷惑電話をAIが自動で判別・対応する「Call Screen」や「Scam Detection」の対象国拡大、不在着信をテキスト化して要約する「Take a Message」、車内で安全に通話機能を活用できるAndroid Auto連携など、日々の業務を効率化する機能が多数盛り込まれています。

これらの革新的な機能は、Pixel 10に搭載される強力なオンデバイスAI基盤によって実現されています。AIアシスタントが単なるツールから真の「ビジネスパートナー」へと進化する可能性を示しており、今後のスマートフォンがもたらす生産性革命に大きな期待が寄せられます。

出典：Google公式

Hugging Face、Apple向けAIライブラリv1.0を公開

2025年09月26日 Apple エコシステムエンジニア推論機械学習オンデバイス音声エージェントトランスフォーマー

Apple開発者向けAIツール

ローカルLLMのアプリ統合を簡素化

Tokenizer, Hubなど必須機能を提供

Core MLやMLXを補完する設計

v1.0の進化点

パッケージの安定性向上とAPI整理

モジュール分割による依存性削減

最新Core ML APIとSwift 6に対応

今後のロードマップ

MLXフレームワークとの連携深化

エージェント型ユースケースの探求

詳細を見る

AIプラットフォームのHugging Faceが、Apple製品開発者向けライブラリ「swift-transformers」のバージョン1.0を公開しました。本ライブラリは、iPhoneなどのデバイス上でローカルにAIモデルを動作させる際の技術的ハードルを下げ、アプリへの組み込みを容易にすることを目的としています。

swift-transformersは、AppleのCore MLやMLXといった機械学習フレームワークを補完する重要な機能群を提供します。具体的には、複雑なテキスト入力を処理する「Tokenizers」、Hugging Face Hubからモデルを管理する「Hub」、Core ML形式モデルの推論を簡素化する「Models」と「Generation」が中核をなします。

すでに、Apple自身のサンプル集「mlx-swift-examples」や、高性能な音声認識フレームワーク「WhisperKit」など、多くのプロジェクトで採用されています。これにより、Apple エコシステムにおけるオンデバイスAI開発の基盤技術としての地位を確立しつつあると言えるでしょう。

今回のv1.0リリースは、ライブラリの安定性を公式に保証する初のメジャーアップデートです。主要な変更点には、必要な機能だけを導入できるモジュール分割や、最新のCore ML APIへの対応、そしてSwift 6への完全準拠が含まれます。開発者はより安心して長期的なプロジェクトに採用できます。

Hugging Faceは今後の展望として、Appleの機械学習フレームワーク「MLX」との連携強化を掲げています。さらに、自律的にタスクを処理する「エージェント」のような、より高度なユースケースの実現も視野に入れており、オンデバイスAIの新たな可能性を切り拓くことが期待されます。

出典：Hugging Face

Google、次期チップ「Tensor G5」でPixel 10のAI機能を大幅強化

2025年09月24日 Google 生産性エンジニア経営者半導体オンデバイスクラウドプライバシー音声エージェント

詳細を見る

Googleは9月24日、公式ポッドキャストで、次期スマートフォン「Pixel 10」シリーズに搭載する最新チップ「Tensor G5」の詳細を明らかにしました。同社のシリコンチーム担当者が解説し、Tensor G5がGoogle史上最大のアップグレードであり、デバイス上のAI機能を飛躍的に進化させることを強調しました。これにより、スマートフォンの利便性が新たな段階に入ることが期待されます。 Tensor G5は、AI処理能力の向上に特化した設計が特徴です。Googleのシリコンチーム担当者によれば、このチップは技術的なブレークスルーであり、これまでのチップから大幅な性能向上を実現したとのことです。スマートフォンの「頭脳」が進化することで、複雑なAIタスクをデバイス上で高速に処理できるようになります。新機能で特に注目されるのが、自分の声でリアルタイム翻訳を行う「Live Translate」です。従来の翻訳機能と異なり、まるで自分がその言語を話しているかのような自然なコミュニケーションを可能にします。Tensor G5の高度な音声処理能力が可能にするこの機能は、海外とのビジネスなどで大きな変革をもたらす可能性があります。さらに、ユーザーの意図を先読みしてアシストするエージェント機能「Magic Cue」や、Pixel 10 Proに搭載される「100x ProRes Zoom」もTensor G5の性能によって実現されます。これらの機能は、単なる操作の補助にとどまらず、ユーザーの生産性を高めるパートナーとしてのスマートフォンの役割を強化することを示唆しています。今回の発表は、AI処理がクラウドから個人のデバイス（エッジ）へ移行する流れを象徴します。デバイス上でAIが完結すれば、プライバシーと応答速度の向上が両立します。経営者やエンジニアにとって、この「エッジAI」の進化がもたらす新たなビジネスチャンスや生産性向上の可能性は、注視すべき重要なトレンドと言えるでしょう。

出典：Google公式

AppleのオンデバイスAI、iOS 26アプリで実用化進む

2025年09月19日 OpenAI Apple iOS 生産性エコシステムクリエイティブエンジニア推論オンデバイスプライバシー音声プロンプト

詳細を見る

サードパーティの開発者らが、Appleの最新OS「iOS 26」の公開に伴い、同社のオンデバイスAIモデルを自社アプリに組み込み始めています。この動きは、Appleが開発者向け会議（WWDC）で発表したAIフレームワーク「Foundation Models」を活用したものです。開発者は推論コストを気にすることなく、支出分析やタスク管理の自動化といった機能を実装できます。これにより、ユーザー体験の向上が期待されます。 Appleの「Foundation Models」は、デバイス上でAI処理を完結させるのが特徴です。これにより開発者は推論コストを負担せず、ユーザーのプライバシーも保護できます。OpenAIなどの大規模モデルとは異なり、既存アプリの利便性を高める「生活の質（QoL）」向上に主眼が置かれています。生産性向上アプリでの活用が目立ちます。タスク管理アプリ「Tasks」は、入力内容からタグを自動提案したり、音声内容を個別のタスクに分解したりします。日記アプリ「Day One」では、エントリーの要約やタイトルをAIが提案し、より深い記述を促すプロンプトを生成します。専門分野や学習アプリでも導入が進んでいます。家計簿アプリ「MoneyCoach」は、支出が平均より多いかを分析して提示します。単語学習アプリ「LookUp」では、単語を使った例文をAIが自動生成したり、その語源を地図上に表示したりするユニークな機能が追加されました。活用範囲は多岐にわたります。子供向けアプリ「Lil Artist」では、キャラクターとテーマを選ぶとAIが物語を創作。レシピアプリ「Crouton」はテキストから調理手順を自動分割します。電子署名アプリ「SignEasy」は契約書の要点を抽出し、利用者に要約を提示します。これらの事例は、AppleのオンデバイスAIが大規模生成AIとは異なる形でユーザー体験を向上させる可能性を示します。プライバシーとコストの課題をクリアしたことで、今後多くの開発者が追随するでしょう。身近なアプリがより賢くなることで、iPhoneエコシステム全体の魅力が一層高まりそうです。

出典：TechCrunch

Google Chrome、AI統合で大刷新 Geminiで生産性向上へ

2025年09月18日 Google Gemini Android iOS Chrome Windows 生産性検索アシスタントデータ漏洩オンデバイスセキュリティ動画米国エージェント

詳細を見る

Googleは9月18日、Webブラウザ「Chrome」に自社のAIモデル「Gemini」を統合する、史上最大級のアップデートを発表しました。これにより、複数タブ情報の要約やアドレスバーからのAI検索が可能になります。将来的には面倒な作業を自動化するエージェント機能も導入し、ユーザーの生産性を飛躍的に高めることを目指します。新たに搭載される「Gemini in Chrome」は、ブラウザの強力なAIアシスタントとして機能します。例えば、調査のために開いた多数のタブの内容を横断的に比較・要約させ、旅行の旅程作成や商品の比較検討といった作業を効率化します。これにより、情報収集にかかる時間を大幅に短縮できるでしょう。アドレスバー（オムニボックス）もAIで強化されます。Google 検索の「AIモード」が統合され、より長く複雑な質問を直接入力できるようになります。また、閲覧中のページ内容に基づいた関連質問が提案され、ページを離れることなく、サイドパネルでAIによる回答を確認できます。最も注目されるのが、数ヶ月以内に導入予定の「エージェント機能」です。これは、ユーザーの指示に基づき、食料品の注文や散髪の予約といった複数ステップのタスクをChromeが自律的に実行する機能です。面倒な日常業務をAIに任せる未来が近づいています。 Geminiは、カレンダーやYouTube、マップといった他のGoogleアプリとも深く連携します。これにより、閲覧中のページから離れることなく会議の予定調整や動画内の特定場面の検索が可能になります。また、過去に閲覧したページを曖昧な記憶から探し出す機能も追加される予定です。 AIはセキュリティ強化にも活用されます。オンデバイスAIモデル「Gemini Nano」を用いて、巧妙化するフィッシング詐欺や偽のウイルス警告を検知・ブロックします。さらに、パスワードが漏洩した際には、対応サイトでワンクリックでパスワードを自動変更する機能も近日中に追加されます。これらの新機能は、まず米国のMacおよびWindowsユーザー（言語設定が英語）向けに提供が開始されます。その後、モバイル版（Android/iOS）や他の国・言語へも順次展開される計画です。企業向けにはGoogle Workspaceを通じて提供されます。

出典：Google公式 | Google公式 | Ars Technica | TechCrunch | The Verge

Google、Pixel 10とWatch 4を発表、Gemini AI機能を大幅強化

2025年09月16日 Google Gemini 生産性エコシステムデザインエンジニアオンデバイス

最先端AIと機能強化

Pixel向けGeminiの新機能5種

最新Google AIによる利便性向上

Watch 4に緊急衛星通信搭載

Pixel開発10周年記念のモデル

詳細を見る

Googleは2025年9月16日の「Made by Google 2025」において、スマートフォン「Pixel 10」シリーズや「Pixel Watch 4」を含む新製品ラインナップを発表しました。この最新ポートフォリオは、Pixel開発10周年という節目を記念し、最先端のGoogle AIを深く統合しています。特に、デバイス上で動作する生成AI「Gemini」の機能が大幅に強化され、ユーザー体験の劇的な向上を目指します。

今回発表されたPixel 10シリーズには、通常モデルに加え、Pro、Pro XL、そして折りたたみ式のPro Foldが揃い、フルラインナップとなりました。デザインも一新され、発売10周年を飾るにふさわしいアップグレードが施されています。企業や開発者は、これらの多様なフォームファクターで、AIを活用した新しいモバイルソリューションの可能性を探ることが可能です。

新しいPixel製品群の核となるのは、高度に統合されたAI機能です。Googleは、Pixel上でGeminiの5つの新たな機能を提供することを明らかにしました。この最新のGoogle AIは、これまで以上にユーザーのパーソナライゼーションを可能にし、日常的なタスクをよりスムーズに実行できるよう設計されています。AIによる生産性向上は、ビジネス利用における最大の関心事となるでしょう。

また、同時に発表された「Pixel Watch 4」にも注目が集まります。Watch 4は、緊急時に備えた衛星通信機能（Emergency Satellite Communications）を搭載しており、ユーザーの安全確保を最優先しています。さらに「Pixel Buds A Series 2」やアクセサリー群「Pixelsnap」も投入され、Googleのエコシステム全体が強化されています。

出典：Google公式

AT&T、AI秘書で迷惑電話を遮断ネットワーク履歴活用し精度向上

2025年09月16日 Google Apple 生産性アシスタントネットワークスケジュール調整オンデバイス

機能と動作原理

ネットワークベースのAIアシスタント

未登録番号からの着信を自動で一次応答

通話履歴に基づき人間関係を分析

声や緊急性から発信者が人間か判定

優位性とユーザー体験

特定のデバイス依存なしで利用可能

GoogleやAppleとの差別化要素

リアルタイムで文字起こしを確認可能

AIによる要約やメッセージ取得

詳細を見る

AT&T;は、迷惑電話やロボコールを自動で選別するAIアシスタント機能「デジタルレセプショニスト」のテストを一部顧客向けに開始しました。これは個人の通話履歴データを活用し、キャリアのネットワーク側で自動的に通話をスクリーニングするものです。未知の番号からの着信に対し、AIが発信者と用件を確認することで、多忙なビジネスパーソンの生産性向上に貢献します。

この機能の最大の特徴は、AIが個々の端末ではなく、AT&T;のネットワーク全体に組み込まれている点です。GoogleやAppleの既存機能がデバイス上の連絡先リストに依存するのに対し、AT&T;のAIはネットワークから得るユーザーのコールパターンを分析します。これにより、頻繁なやり取りを把握し、信頼できる発信者を正確に判断することで、より高い精度での通話フィルタリングを実現しています。

未知の番号から着信があった場合、AIアシスタントが自動で応答し、発信者が人間であるか、または緊急性があるかを声のトーンなどから判定します。基準を満たした通話のみを本人に転送するか、メッセージを残すかを選択できます。

また、ユーザーは専用アプリを通じてAIによる通話のリアルタイム文字起こしを確認し、いつでも会話に加わることも可能です。AT&T;の最高データ責任者によると、このAIアシスタントは単なるスクリーニングに留まらず、将来的に予約やスケジュール調整といった複雑なタスクの代行へと進化する可能性を秘めています。

出典：The Verge

オンデバイス（ハードウェア）に関するニュース一覧

オンデバイス（ハードウェア）に関するニュース一覧

障害者支援とオフライン活用

警備・教育へのエッジ実装

AIによる片手操作の拡充

オンデバイスAIで応答生成

Galaxy XRの機能拡張

軽量グラス「Project Aura」

エコシステムの開放戦略

性能向上と用途の乖離

オンデバイスAIの現在地

企業向け小規模モデルの革新

実践的なハイブリッド戦略

開発効率を高める構造改革

実用性を極めた学習・推論

エコシステムをつなぐハブへ

端末完結でGPT-4o超え

高度なプライバシーと安全設計

革新的な学習手法と入手性

ローカルAI活用でコスト削減

多様なモデルへの対応拡大

AIによる通話詐欺検知

画面共有の悪用防止

普及への高いハードル

コンプライアンス対応の課題

デバイス上での直接記録

管理性と拡張性

AIで業務効率を最大化

Geminiで創造性を解放

利便性と安全性の向上

プライバシーとAI性能の両立

堅牢なセキュリティ技術

身近な機能の高度化

Gemini搭載の新アシスタント

早期アクセスの注意点

AI開発を阻む「複雑性の壁」

生産性向上への道筋

産学連携が生む圧倒的成果

「巨大」から「小型・効率」へ

少ないデータで賢く学習

AI PCがもたらす価値

創造性が生む事業成果

強力なオンデバイスAI

ビジネス仕様の高性能

小型モデルの定義変更

分散型AIの経済性

企業利用の具体例

オンデバイスAIの利点

主な活用パターン

新AI機能「Take a Message」

2つの人気機能を統合

高度なオンデバイスAI

Pro Res Zoomとは

AIによる画質向上

驚異の超小型・高速AI

F1からインテルまで

AIが変えるビジネス通話

グローバル化と利便性向上

Apple開発者向けAIツール

v1.0の進化点

今後のロードマップ

最新Pixel製品群

最先端AIと機能強化

機能と動作原理

優位性とユーザー体験

関連キーワード

同じカテゴリ

他カテゴリ