オンデバイス(ハードウェア)に関するニュース一覧

家庭用AI『Gemini』、米国で先行提供開始

Gemini搭載の新アシスタント

既存アシスタント刷新
Nestデバイス上動作
より複雑なタスクと自然な会話
基盤はGemini LLM

早期アクセスの注意点

アシスタントには戻れない
一部機能は有料プラン限定
参加にはアプリからの申請が必要
対象は米国ユーザーから

Googleは2025年10月29日、米国のスマートホームユーザー向けに、新しいAIアシスタントGemini for Home」の早期アクセス提供を開始しました。これは、同社のNestデバイスに搭載されている既存のGoogleアシスタントを置き換えるもので、スマートホーム体験を根本から刷新する重要なアップデートとなります。

Gemini for Home」の最大の特徴は、基盤となる大規模言語モデル(LLM)Geminiです。これにより、従来のGoogleアシスタントと比較して、より複雑な指示を理解し、実行できるようになります。また、人間と話しているかのような、より自然で文脈に沿った会話が可能になる点も大きな進化と言えるでしょう。

早期アクセスに参加するには、Google Homeアプリの設定メニューから申請が必要です。承認されると、利用者が持つ全ての対応デバイスでGemini for Homeが有効になります。ただし、一度切り替えると元のGoogleアシスタントに戻すことはできないため、注意が必要です。

また、一部の高度な機能は有料サブスクリプション「Google Home Premium」の加入者限定となります。リアルタイムで対話できる「Gemini Live」や、カメラの録画履歴をAIで検索する機能などがこれに該当します。今回の動きは、家庭におけるAI活用を本格化させるGoogleの強い意志の表れと言えます。

AI開発の生産性向上、ソフトウェアの断片化解消が鍵

AI開発を阻む「複雑性の壁」

断片化したソフトウェアスタック
ハードウェア毎のモデル再構築
6割超のプロジェクトが本番前に頓挫
エッジ特有の性能・電力制約

生産性向上への道筋

クロスプラットフォームの抽象化レイヤー
最適化済みライブラリの統合
オープン標準による互換性向上
ハードとソフトの協調設計

ArmをはじめとするAI業界が、クラウドからエッジまで一貫した開発を可能にするため、ソフトウェアスタックの簡素化を急いでいます。現在、断片化したツールやハードウェア毎の再開発がAIプロジェクトの大きな障壁となっており、この課題解決が開発の生産性と市場投入の速度を左右する鍵を握っています。

AI開発の現場では、GPUやNPUなど多様なハードウェアと、TensorFlowやPyTorchといった異なるフレームワークが乱立。この断片化が非効率な再開発を招き、製品化までの時間を浪費させています。調査会社ガートナーによれば、統合の複雑さを理由にAIプロジェクトの6割以上が本番前に頓挫しているのが実情です。

このボトルネックを解消するため、業界は協調した動きを見せています。ハードウェアの違いを吸収する抽象化レイヤーの導入、主要フレームワークへの最適化済みライブラリの統合、ONNXのようなオープン標準の採用などが進んでいます。これにより、開発者はプラットフォーム間の移植コストを大幅に削減できるのです。

簡素化を後押しするのが、クラウドを介さずデバイス上でAIを処理する「エッジ推論」の急速な普及です。スマートフォンや自動車など、電力や処理能力に制約のある環境で高性能なAIを動かすには、無駄のないソフトウェアが不可欠です。この需要が、業界全体のハードウェアとソフトウェアの協調設計を加速させています。

この潮流を主導するのが半導体設計大手のArmです。同社はCPUにAI専用の命令を追加し、PyTorchなどの主要ツールとの連携を強化。これにより開発者は使い慣れた環境でハードウェア性能を最大限に引き出せます。実際に、大手クラウド事業者へのArmアーキテクチャ採用が急増しており、その電力効率の高さが評価されています。

AIの次なる競争軸は、個別のハードウェア性能だけでなく、多様な環境でスムーズに動作する「ソフトウェアの移植性」に移っています。エコシステム全体で標準化を進め、オープンなベンチマークで性能を競う。こうした協調的な簡素化こそが、AIの真の価値を引き出し、市場の勝者を決めることになるでしょう。

MITとIBM、小型・効率AIで産業応用を加速

産学連携が生む圧倒的成果

特許54件、引用12万件超
産業ユースケース50件以上を創出
医療や化学など多分野へ応用

「巨大」から「小型・効率」へ

巨大モデルからタスク特化型へ転換
性能を維持しモデルを小型化
エッジデバイスでの高速処理実現

少ないデータで賢く学習

自己修正で推論精度を高める新手法
PoCで終わらせない実用化を推進

マサチューセッツ工科大学(MIT)とIBMが共同で運営する「MIT-IBM Watson AI Lab」は、AI開発の新たな方向性を示しています。設立8周年を迎えた同ラボは、巨大な基盤モデルから、より小さく効率的でタスクに特化したモデルの開発に注力。研究と実用化のギャップを埋め、産業界でのAI活用を加速させることを目指します。これは、AIプロジェクトの多くが概念実証(PoC)で頓挫する現状への明確な回答と言えるでしょう。

この産学連携は目覚ましい成果を上げています。これまでに特許54件を出願し、論文の引用数は12万8000件を超えました。さらに、ヘルスケアや金融、化学など多岐にわたる分野で50件以上の産業ユースケースを創出。AI画像技術によるステント留置の改善や、計算コストの大幅な削減など、具体的なイノベーションを生み出し続けています。

なぜ今、「小型・効率化」が重要なのでしょうか。調査会社ガートナーによると、生成AIプロジェクトの少なくとも30%が2025年末までに概念実証(PoC)の段階で中止されると予測されています。多くの企業がAIへの期待を抱きつつも、価値ある成果に繋げられていないのです。同ラボは、この研究と実用の間の「死の谷」を埋める役割を担っています。

小型化の鍵を握るのが、`once-for-all`や`AWQ`といった革新的な技術です。これらの手法は、モデルのアーキテクチャを最適化し、性能を維持したままサイズを圧縮します。これにより、スマートフォンなどのエッジデバイス上でもAIを高速に実行できるようになります。遅延を減らし、リアルタイムでの応用範囲を大きく広げる可能性を秘めています。

さらに、少ないデータで賢く学習する技術も進化しています。例えば`COAT`(Chain-of-Action-Thought)と呼ばれる手法は、AIが自らの推論プロセスを反復的に自己修正することで、より正確な答えを導き出します。これは、限られた計算資源とデータで、現実世界の複雑な課題を解決するための重要なアプローチです。

これらの研究成果は、IBMのプラットフォーム`watsonx`などを通じて実用化されています。一例が、コンパクトながら高精度な文書理解能力を持つ`Granite Vision`モデルです。企業が保有する膨大な文書から、信頼性の高い情報を抽出し、要約するニーズに応えます。

MIT-IBM Watson AI Labが目指すのは「有用で効率的な知能」の創出です。巨大モデルの開発競争から一歩進み、目的に合わせて最適化されたAIこそが、真の経済的・社会的価値を生み出すと彼らは考えています。この産学連携の取り組みは、AIの実用化を目指す全ての企業にとって、重要な指針となるでしょう。

AI PCが再定義する生産性、鍵は「創造性」

AI PCがもたらす価値

ローカルAI処理による高速化
機密データを保護するセキュリティ
オフラインでも作業可能
低遅延と省エネルギーの実現

創造性が生む事業成果

市場投入までの時間短縮
外部委託費の削減
顧客エンゲージメントの向上
従業員の満足度と定着率向上

AI PCの登場が、ビジネスにおける「生産性」の定義を根底から変えようとしています。マサチューセッツ工科大学(MIT)の研究で生成AIが人間の創造性を高めることが示される中、NPU(Neural Processing Unit)を搭載した次世代PCがその能力を最大限に引き出します。デバイス上でAI処理を完結させることで、低遅延、高セキュリティ、省エネを実現し、単なる効率化ツールを超えた価値を提供し始めています。

企業のIT意思決定者の45%が、すでにAI PCを創造的な業務支援に活用しています。しかし、一般の知識労働者における同目的での利用率は29%にとどまり、組織内で「クリエイティブ格差」が生じているのが現状です。この格差を埋めることが、AI PCのポテンシャルを全社的に引き出す鍵となります。

AI PCは、従業員が創造的な作業に集中できる環境を整えます。専用のNPUがAI関連の負荷を担うため、ユーザーは思考を中断されることなく、アイデア創出に没頭できます。これにより、バッテリー寿命が延び、待ち時間が減少。デザイン動画制作、資料作成など、あらゆる業務でリアルタイムの試行錯誤が可能になります。

この創造性の向上は、具体的な事業成果に直結します。マーケティング部門では、数週間かかっていたキャンペーン素材を数時間で生成。技術部門では、設計や試作品開発のサイクルを大幅に短縮しています。営業担当者は、オフラインの顧客先でもパーソナライズされた提案書を即座に作成でき、案件化のスピードを高めています。

最終的に、AI PCは従業員の働きがいをも向上させます。HPの調査では、従業員が仕事に健全な関係を築く上で最も重要な要素は「充実感」であることが示されています。単なるタスク処理ではなく、創造性を発揮できるツールを与えることは、生産性、満足度、定着率の向上につながるのです。

CIO(最高情報責任者)にとって、AI PCの導入は単なる機器の高速化ではありません。その真価は、従業員の創造性を解放し、新たなアイデアや協業、競争力を生み出す企業文化を醸成することにあります。AI PCをいかに活用し、組織全体の創造性を高めるかが、今後の成長を左右するでしょう。

Acer、50TOPSのAI搭載Chromebookを投入

強力なオンデバイスAI

MediaTek製CPUを搭載
50TOPSのAI処理能力
高速・安全なオフラインAI
AIによる自動整理や画像編集

ビジネス仕様の高性能

360度回転する2-in-1設計
最大17時間の長時間バッテリー
最新規格Wi-Fi 7に対応
Gemini 2.5 Proが1年間無料

Googleは、Acer製の新型ノートPC「Acer Chromebook Plus Spin 514」を発表しました。最大の特徴は、MediaTek Kompanio Ultraプロセッサが実現する強力なオンデバイスAI機能です。オフラインでも高速に動作するAIが、ビジネスパーソンの生産性を飛躍的に高める可能性を秘めています。

新モデルは、50TOPSという驚異的なAI処理能力を備えています。これにより、タブやアプリを自動で整理する「スマートグルーピング」や、AIによる高度な画像編集デバイス上で直接、高速かつ安全に実行できます。機密情報をクラウドに送る必要がないため、セキュリティ面でも安心です。

ハードウェアもビジネス利用を強く意識しています。360度回転するヒンジでノートPCとタブレットの1台2役をこなし、14インチの2.8K高解像度タッチスクリーン、最大17時間持続するバッテリー、最新のWi-Fi 7規格への対応など、外出先でも快適に作業できる仕様です。

購入者特典として、Googleの最先端AIモデル「Gemini 2.5 Pro」や2TBのクラウドストレージを含む「Google AI Proプラン」が12ヶ月間無料で提供されます。これにより、文書作成やデータ分析といった日常業務がさらに効率化されるでしょう。

今回、デスクトップ型の「Acer Chromebox CXI6」と超小型の「Acer Chromebox Mini CXM2」も同時に発表されました。オフィスでの固定利用から省スペース環境まで、多様なビジネスシーンに対応する製品群で、AI活用を推進する姿勢がうかがえます。

AI21が25万トークン対応の小型LLMを発表、エッジAIの経済性を一変

小型モデルの定義変更

30億パラメータのオープンソースLLM
エッジデバイスで25万トークン超を処理
推論速度は従来比2〜4倍高速化

分散型AIの経済性

MambaとTransformerハイブリッド構造採用
データセンター負荷を減らしコスト構造を改善
高度な推論タスクをデバイスで実行

企業利用の具体例

関数呼び出しやツールルーティングに最適
ローカル処理による高いプライバシー確保

イスラエルのAIスタートアップAI21 Labsは、30億パラメータの小型オープンソースLLM「Jamba Reasoning 3B」を発表しました。このモデルは、ノートPCやスマートフォンなどのエッジデバイス上で、25万トークン以上という異例の長大なコンテキストウィンドウを処理可能であり、AIインフラストラクチャのコスト構造を根本的に変える可能性を秘めています。

Jamba Reasoning 3Bは、従来のTransformerに加え、メモリ効率に優れたMambaアーキテクチャを組み合わせたハイブリッド構造を採用しています。これにより、小型モデルながら高度な推論能力と長文処理を両立。推論速度は従来のモデルに比べて2〜4倍高速であり、MacBook Pro上でのテストでは毎秒35トークンを処理できることが確認されています。

AI21の共同CEOであるオリ・ゴーシェン氏は、データセンターへの過度な依存が経済的な課題となっていると指摘します。Jamba Reasoning 3Bのような小型モデルをデバイス上で動作させることで、高価なGPUクラスターへの負荷を大幅に軽減し、AIインフラストラクチャのコスト削減に貢献し、分散型AIの未来を推進します。

このモデルは、特に企業が関心を持つユースケースに最適化されています。具体的には、関数呼び出し、ポリシーに基づいた生成、そしてツールルーティングなどのタスクで真価を発揮します。シンプルな業務指示や議事録作成などはデバイス上で完結し、プライバシーの確保にも役立ちます。

Jamba Reasoning 3Bは、同規模の他の小型モデルと比較したベンチマークテストでも優位性を示しました。特に長文理解を伴うIFBenchやHumanity’s Last Examといったテストで最高スコアを獲得。これは、同モデルがサイズを犠牲にすることなく、高度な推論能力を維持していることを示しています。

企業は今後、複雑で重い処理はクラウド上のGPUクラスターに任せ、日常的かつシンプルな処理はエッジデバイスでローカルに実行する「ハイブリッド運用」に移行すると見られています。Jamba Reasoning 3Bは、このハイブリッド戦略の中核となる効率的なローカル処理能力を提供します。

iOS 26、オンデバイスAIでアプリ体験を刷新

オンデバイスAIの利点

推論コスト不要でAI機能実装
プライバシーに配慮した設計
ネット接続不要のオフライン動作

主な活用パターン

テキストの要約・生成・分類
ユーザー入力に基づく自動提案機能
音声からのタスク分解・文字起こし
パーソナライズされた助言・フィードバック

Appleが2025年の世界開発者会議(WWDC)で発表した「Foundation Models framework」が、最新OS「iOS 26」の公開に伴い、サードパーティ製アプリへの実装が本格化しています。開発者は、デバイス上で動作するこのローカルAIモデルを利用し、推論コストをかけずにアプリの機能を向上させることが可能です。これにより、ユーザーのプライバシーを保護しながら、より便利な体験を提供できるようになりました。

AppleのローカルAIモデルは、OpenAIなどの大規模言語モデルと比較すると小規模です。そのため、アプリの根幹を覆すような劇的な変化ではなく、日常的な使い勝手を向上させる「生活の質(QoL)」の改善が主な役割となります。推論コストが不要でオフラインでも動作する点が、開発者にとって大きな利点と言えるでしょう。

具体的な活用例として、生産性向上機能が挙げられます。タスク管理アプリ「Tasks」では音声からタスクを自動分割し、日記アプリ「Day One」はエントリーの要約やタイトルを提案します。また、レシピアプリ「Crouton」では、長文から調理手順を自動で抽出するなど、手作業を削減する機能が実装されています。

学習や創造性の分野でも活用が進んでいます。単語学習アプリ「LookUp」は、AIが単語の例文を生成し、学習をサポートします。子供向けアプリ「Lil Artist」では、キャラクターとテーマを選ぶだけでAIが物語を生成。ユーザーの創造性を刺激する新たな体験を提供しています。

個人の趣味や健康管理といった専門分野でも応用は多彩です。フィットネスアプリ「SmartGym」はワークアウトの要約を生成し、テニス練習アプリ「SwingVision」は動画から具体的なフォーム改善案を提示します。このように、AIがパーソナライズされた助言を行う事例が増えています。

今回の動きは、AI機能の導入がより身近になることを示唆しています。開発者は、サーバーコストやプライバシー問題を気にすることなく、高度な機能をアプリに組み込めるようになりました。iOS 26を皮切りに、オンデバイスAIを活用したアプリのイノベーションは、今後さらに加速していくとみられます。

Pixel 10、AIが不在着信を文字起こし・要約

新AI機能「Take a Message」

不在着信・拒否通話のスマートな処理
会話型AIによるリアルタイム文字起こし
通話後のAIによるアクション提案

2つの人気機能を統合

通話スクリーニングのスパム検出活用
通話メモの要約・ネクストステップ生成

高度なオンデバイスAI

プライバシーに配慮した端末内処理
最新のPixel 10シリーズに搭載

Googleは2025年10月2日、最新スマートフォン「Pixel 10」シリーズ向けに、新たなAI通話支援機能「Take a Message」を発表しました。この機能は、不在着信や応答を拒否した通話の内容をAIがリアルタイムで文字起こしし、通話後には次のアクションを提案するものです。多忙なビジネスパーソンが重要な連絡を逃さず、効率的に対応できるよう支援することを目的としています。

「Take a Message」の最大の特徴は、Google高度な会話型AIを駆使している点です。相手が残したボイスメッセージをリアルタイムで画面にテキスト表示するため、音声を聞けない状況でも内容を即座に確認できます。これにより、会議中や移動中でも重要な用件を逃す心配がありません。

さらに、通話が終了するとAIがメッセージ内容を分析し、要約と推奨される次のアクションを自動生成します。「明日15時に折り返し電話」といった具体的なタスクを提示し、迅速な対応を支援。これは既存の人気機能「Call Notes」の進化形と言えます。

この新機能は、既存の「Call Screen」と「Call Notes」の長所を統合したものです。迷惑電話をブロックする強力なスパム検出機能も継承し、安全性と利便性を両立。処理はすべて端末内で完結するオンデバイスAIのため、プライバシーの観点でも安心できます。

「Take a Message」は、まず最新の「Pixel 10」シリーズで利用可能となります。Googleは、AIを用いてスマートフォンの原点である「通話」体験の再発明を目指しています。今回の新機能は、AIが日常業務を効率化する可能性を示す好例と言えるでしょう。

Pixel 10 Pro、AIで100倍ズームを実現

Pro Res Zoomとは

Pixel 10 Pro搭載の新ズーム技術
AIで100倍ズームを実現
Tensor G5チップ高速処理

AIによる画質向上

単なるデジタルズームではない
生成AIが欠落情報を補完
ノイズ除去とシャープ化を両立
デバイス上数秒で完結

Googleが、次期スマートフォン「Pixel 10 Pro」に搭載される新たなAIカメラ技術「Pro Res Zoom」を発表しました。この技術は、生成AIを活用して最大100倍のズーム撮影でも鮮明な画質を実現するものです。遠くの被写体を、これまでにないほど詳細に捉えることが可能になります。

Pro Res Zoomの核心は、単なる画像の切り出しと拡大(デジタルズーム)ではない点にあります。撮影データから色や形といった僅かな手がかりを基に、AIが欠落したディテールを生成・補完します。これにより、従来のズーム機能ではぼやけてしまっていた被写体も、驚くほど鮮明な一枚の写真として仕上がります。

この高度な処理は、最新の「Tensor G5」チップによってデバイス上で直接実行されます。最先端の拡散モデル(diffusion model)を数秒で動作させ、ノイズ除去とシャープ化を同時に行います。クラウドにデータを送ることなく、手元で高速に処理が完結するのが大きな特徴です。

この新技術は、ユーザーにどのような価値をもたらすのでしょうか。例えば、遠くにいる野生動物や、スポーツ観戦中の選手の表情など、これまで諦めていたシーンの撮影が可能になります。Pixel 9 Proの「Super Res Zoom」が最大30倍だったのに対し、100倍という圧倒的なズーム性能は、スマートフォンの写真撮影の常識を覆す可能性を秘めています。

Googleの取り組みは、生成AIがクラウド上のサービスから、スマートフォンという日常的なデバイスへと活躍の場を広げていることを示しています。カメラ機能の進化は、AIがもたらすユーザー体験向上の好例と言えるでしょう。

Hance、KB級AI音声処理でエッジ市場に革新

驚異の超小型・高速AI

モデルサイズは僅か242KB
遅延10ミリ秒のリアルタイム性
電力で多様なデバイスに対応

F1からインテルまで

F1公式無線サプライヤーが採用
Intelの最新チップNPUへ最適化
防衛・法執行分野への応用
大手スマホメーカーとも協議中

ノルウェーのスタートアップHanceが、キロバイト級の超小型AI音声処理ソフトウェアを開発しました。クラウドを介さずデバイス上で動作し、わずか10ミリ秒の低遅延でノイズ除去や音声の明瞭化を実現。すでにF1の公式無線サプライヤーやIntelといった大企業を顧客に持ち、10月27日から開催されるTechCrunch Disrupt 2025でデモを披露します。

この技術の核心は、わずか242KBという驚異的なモデルサイズにあります。これにより、スマートフォンや無線機など、リソースが限られたエッジデバイス上でのリアルタイム処理が可能になりました。従来のクラウドベースのAIと異なり、通信遅延や消費電力を大幅に削減できる点が大きな強みです。

HanceのAIモデルは、共同創業者が運営する高品質なサウンドライブラリ「Soundly」の音源を用いてトレーニングされました。F1マシンの轟音から火山の噴火音まで、多種多様なデータを学習させることで、過酷な環境下でも特定の音声を分離し、ノイズやエコー、反響を除去する高い性能を達成しています。

その実用性はすでに証明されています。F1チームが使用する無線システムを手がけるRiedel Communicationsは、高速走行中のドライバーとエンジニア間の極めて重要な通信をクリアにするため、Hanceの技術を採用。他にも、防衛や法執行機関といった、リアルタイム性と信頼性が求められる分野からの関心も高まっています。

Hanceは事業拡大を加速させています。半導体大手Intelとは、同社の最新チップ「NPU(ニューラル・プロセッシング・ユニット)」向けにモデルを最適化するパートナーシップを締結。他のチップメーカーや、非公開のスマートフォンメーカーとも協議を進めており、競争優位を保つため、研究開発に注力し続ける方針です。

Pixel 10、AI通話機能でビジネスを加速

AIが変えるビジネス通話

関連情報をAIが自動提示
通話内容からタスクを自動生成
不在着信をAIが要約・分類
迷惑電話をAIが自動で判別

グローバル化と利便性向上

オンデバイスAIでリアルタイム翻訳
AIによる自動応答・フィルタリング
カスタマイズ可能な通話画面
車内でのAIアシスタント連携

Googleが2025年9月29日、最新スマートフォン「Pixel 10」向けに、AIを活用した9つの新しい通話機能を発表しました。これらの機能は、最新AIモデル「Gemini Nano」と独自プロセッサ「Tensor G5」を搭載し、通話中の情報検索やリアルタイム翻訳、議事録作成などを自動化。ビジネスパーソンの生産性向上と、より円滑なコミュニケーションの実現を目指します。

中でも注目すべきは「Magic Cue」機能です。これは、ユーザーの許可のもとGmailやメッセージの内容をAIが解析し、通話中に必要な情報を先回りして提示するものです。例えば、顧客との通話中に注文番号を自動で表示するなど、情報検索の手間を大幅に削減し、ビジネスの機会損失を防ぎます。

グローバルなビジネス展開を加速させるのが「Voice Translate」です。デバイス上で完結するAIが、通話内容をリアルタイムで翻訳します。話者の声質を保ったまま自然な翻訳が可能なため、言語の壁を越えた円滑なコミュニケーションを実現。海外の取引先やチームとの連携を強力にサポートするでしょう。

「Call Notes」機能も大幅に進化しました。通話内容を記録するだけでなく、そこからカレンダーの予定やタスクをAIが提案し、ワンタップで作成可能になります。これにより、通話後のフォローアップ作業が劇的に効率化され、重要なアクションの抜け漏れを防ぐことが期待できます。

このほかにも、迷惑電話をAIが自動で判別・対応する「Call Screen」や「Scam Detection」の対象国拡大、不在着信をテキスト化して要約する「Take a Message」、車内で安全に通話機能を活用できるAndroid Auto連携など、日々の業務を効率化する機能が多数盛り込まれています。

これらの革新的な機能は、Pixel 10に搭載される強力なオンデバイスAI基盤によって実現されています。AIアシスタントが単なるツールから真の「ビジネスパートナー」へと進化する可能性を示しており、今後のスマートフォンがもたらす生産性革命に大きな期待が寄せられます。

Hugging Face、Apple向けAIライブラリv1.0を公開

Apple開発者向けAIツール

ローカルLLMのアプリ統合を簡素化
Tokenizer, Hubなど必須機能を提供
Core MLやMLXを補完する設計

v1.0の進化点

パッケージの安定性向上とAPI整理
モジュール分割による依存性削減
最新Core ML APIとSwift 6に対応

今後のロードマップ

MLXフレームワークとの連携深化
エージェント型ユースケースの探求

AIプラットフォームのHugging Faceが、Apple製品開発者向けライブラリ「swift-transformers」のバージョン1.0を公開しました。本ライブラリは、iPhoneなどのデバイス上でローカルにAIモデルを動作させる際の技術的ハードルを下げ、アプリへの組み込みを容易にすることを目的としています。

swift-transformersは、AppleのCore MLやMLXといった機械学習フレームワークを補完する重要な機能群を提供します。具体的には、複雑なテキスト入力を処理する「Tokenizers」、Hugging Face Hubからモデルを管理する「Hub」、Core ML形式モデルの推論を簡素化する「Models」と「Generation」が中核をなします。

すでに、Apple自身のサンプル集「mlx-swift-examples」や、高性能な音声認識フレームワーク「WhisperKit」など、多くのプロジェクトで採用されています。これにより、AppleエコシステムにおけるオンデバイスAI開発の基盤技術としての地位を確立しつつあると言えるでしょう。

今回のv1.0リリースは、ライブラリの安定性を公式に保証する初のメジャーアップデートです。主要な変更点には、必要な機能だけを導入できるモジュール分割や、最新のCore ML APIへの対応、そしてSwift 6への完全準拠が含まれます。開発者はより安心して長期的なプロジェクトに採用できます。

Hugging Faceは今後の展望として、Apple機械学習フレームワーク「MLX」との連携強化を掲げています。さらに、自律的にタスクを処理する「エージェント」のような、より高度なユースケースの実現も視野に入れており、オンデバイスAIの新たな可能性を切り拓くことが期待されます。

Google、次期チップ「Tensor G5」でPixel 10のAI機能を大幅強化

Googleは9月24日、公式ポッドキャストで、次期スマートフォン「Pixel 10」シリーズに搭載する最新チップ「Tensor G5」の詳細を明らかにしました。同社のシリコンチーム担当者が解説し、Tensor G5がGoogle史上最大のアップグレードであり、デバイス上のAI機能を飛躍的に進化させることを強調しました。これにより、スマートフォンの利便性が新たな段階に入ることが期待されます。 Tensor G5は、AI処理能力の向上に特化した設計が特徴です。Googleのシリコンチーム担当者によれば、このチップは技術的なブレークスルーであり、これまでのチップから大幅な性能向上を実現したとのことです。スマートフォンの「頭脳」が進化することで、複雑なAIタスクをデバイス上で高速に処理できるようになります。 新機能で特に注目されるのが、自分の声でリアルタイム翻訳を行う「Live Translate」です。従来の翻訳機能と異なり、まるで自分がその言語を話しているかのような自然なコミュニケーションを可能にします。Tensor G5の高度な音声処理能力が可能にするこの機能は、海外とのビジネスなどで大きな変革をもたらす可能性があります。 さらに、ユーザーの意図を先読みしてアシストするエージェント機能「Magic Cue」や、Pixel 10 Proに搭載される「100x ProRes Zoom」もTensor G5の性能によって実現されます。これらの機能は、単なる操作の補助にとどまらず、ユーザーの生産性を高めるパートナーとしてのスマートフォンの役割を強化することを示唆しています。 今回の発表は、AI処理がクラウドから個人のデバイス(エッジ)へ移行する流れを象徴します。デバイス上でAIが完結すれば、プライバシーと応答速度の向上が両立します。経営者エンジニアにとって、この「エッジAI」の進化がもたらす新たなビジネスチャンスや生産性向上の可能性は、注視すべき重要なトレンドと言えるでしょう。

AppleのオンデバイスAI、iOS 26アプリで実用化進む

サードパーティの開発者らが、Appleの最新OS「iOS 26」の公開に伴い、同社のオンデバイスAIモデルを自社アプリに組み込み始めています。この動きは、Apple開発者向け会議(WWDC)で発表したAIフレームワーク「Foundation Models」を活用したものです。開発者推論コストを気にすることなく、支出分析やタスク管理の自動化といった機能を実装できます。これにより、ユーザー体験の向上が期待されます。 Appleの「Foundation Models」は、デバイス上でAI処理を完結させるのが特徴です。これにより開発者推論コストを負担せず、ユーザーのプライバシーも保護できます。OpenAIなどの大規模モデルとは異なり、既存アプリの利便性を高める「生活の質(QoL)」向上に主眼が置かれています。 生産性向上アプリでの活用が目立ちます。タスク管理アプリ「Tasks」は、入力内容からタグを自動提案したり、音声内容を個別のタスクに分解したりします。日記アプリ「Day One」では、エントリーの要約やタイトルをAIが提案し、より深い記述を促すプロンプトを生成します。 専門分野や学習アプリでも導入が進んでいます。家計簿アプリ「MoneyCoach」は、支出が平均より多いかを分析して提示します。単語学習アプリ「LookUp」では、単語を使った例文をAIが自動生成したり、その語源を地図上に表示したりするユニークな機能が追加されました。 活用範囲は多岐にわたります。子供向けアプリ「Lil Artist」では、キャラクターとテーマを選ぶとAIが物語を創作。レシピアプリ「Crouton」はテキストから調理手順を自動分割します。電子署名アプリ「SignEasy」は契約書の要点を抽出し、利用者に要約を提示します。 これらの事例は、AppleオンデバイスAIが大規模生成AIとは異なる形でユーザー体験を向上させる可能性を示します。プライバシーとコストの課題をクリアしたことで、今後多くの開発者が追随するでしょう。身近なアプリがより賢くなることで、iPhoneエコシステム全体の魅力が一層高まりそうです。

Google Chrome、AI統合で大刷新 Geminiで生産性向上へ

Googleは9月18日、Webブラウザ「Chrome」に自社のAIモデル「Gemini」を統合する、史上最大級のアップデートを発表しました。これにより、複数タブ情報の要約やアドレスバーからのAI検索が可能になります。将来的には面倒な作業を自動化するエージェント機能も導入し、ユーザーの生産性を飛躍的に高めることを目指します。 新たに搭載される「Gemini in Chrome」は、ブラウザの強力なAIアシスタントとして機能します。例えば、調査のために開いた多数のタブの内容を横断的に比較・要約させ、旅行の旅程作成や商品の比較検討といった作業を効率化します。これにより、情報収集にかかる時間を大幅に短縮できるでしょう。 アドレスバー(オムニボックス)もAIで強化されます。Google検索の「AIモード」が統合され、より長く複雑な質問を直接入力できるようになります。また、閲覧中のページ内容に基づいた関連質問が提案され、ページを離れることなく、サイドパネルでAIによる回答を確認できます。 最も注目されるのが、数ヶ月以内に導入予定の「エージェント機能」です。これは、ユーザーの指示に基づき、食料品の注文や散髪の予約といった複数ステップのタスクをChromeが自律的に実行する機能です。面倒な日常業務をAIに任せる未来が近づいています。 Geminiは、カレンダーやYouTube、マップといった他のGoogleアプリとも深く連携します。これにより、閲覧中のページから離れることなく会議の予定調整や動画内の特定場面の検索が可能になります。また、過去に閲覧したページを曖昧な記憶から探し出す機能も追加される予定です。 AIはセキュリティ強化にも活用されます。オンデバイスAIモデル「Gemini Nano」を用いて、巧妙化するフィッシング詐欺や偽のウイルス警告を検知・ブロックします。さらに、パスワードが漏洩した際には、対応サイトでワンクリックでパスワードを自動変更する機能も近日中に追加されます。 これらの新機能は、まず米国のMacおよびWindowsユーザー(言語設定が英語)向けに提供が開始されます。その後、モバイル版(Android/iOS)や他の国・言語へも順次展開される計画です。企業向けにはGoogle Workspaceを通じて提供されます。

Google、Pixel 10とWatch 4を発表、Gemini AI機能を大幅強化

最新Pixel製品群

Pixel 10シリーズをフル展開
Pixel Watch 4を同時発表
Pixel Buds A Series 2も投入
アクセサリー「Pixelsnap」も展開

最先端AIと機能強化

Pixel向けGemini新機能5種
最新Google AIによる利便性向上
Watch 4に緊急衛星通信搭載
Pixel開発10周年記念のモデル

Googleは2025年9月16日の「Made by Google 2025」において、スマートフォン「Pixel 10」シリーズや「Pixel Watch 4」を含む新製品ラインナップを発表しました。この最新ポートフォリオは、Pixel開発10周年という節目を記念し、最先端のGoogle AIを深く統合しています。特に、デバイス上で動作する生成AI「Gemini」の機能が大幅に強化され、ユーザー体験の劇的な向上を目指します。

今回発表されたPixel 10シリーズには、通常モデルに加え、Pro、Pro XL、そして折りたたみ式のPro Foldが揃い、フルラインナップとなりました。デザインも一新され、発売10周年を飾るにふさわしいアップグレードが施されています。企業や開発者は、これらの多様なフォームファクターで、AIを活用した新しいモバイルソリューションの可能性を探ることが可能です。

新しいPixel製品群の核となるのは、高度に統合されたAI機能です。Googleは、Pixel上でGemini5つの新たな機能を提供することを明らかにしました。この最新のGoogle AIは、これまで以上にユーザーのパーソナライゼーションを可能にし、日常的なタスクをよりスムーズに実行できるよう設計されています。AIによる生産性向上は、ビジネス利用における最大の関心事となるでしょう。

また、同時に発表された「Pixel Watch 4」にも注目が集まります。Watch 4は、緊急時に備えた衛星通信機能(Emergency Satellite Communications)を搭載しており、ユーザーの安全確保を最優先しています。さらに「Pixel Buds A Series 2」やアクセサリー群「Pixelsnap」も投入され、Googleエコシステム全体が強化されています。

AT&T、AI秘書で迷惑電話を遮断 ネットワーク履歴活用し精度向上

機能と動作原理

未登録番号からの着信を自動で一次応答
通話履歴に基づき人間関係を分析
声や緊急性から発信者が人間か判定

優位性とユーザー体験

特定のデバイス依存なしで利用可能
GoogleAppleとの差別化要素
リアルタイムで文字起こしを確認可能
AIによる要約やメッセージ取得

AT&T;は、迷惑電話やロボコールを自動で選別するAIアシスタント機能「デジタルレセプショニスト」のテストを一部顧客向けに開始しました。これは個人の通話履歴データを活用し、キャリアのネットワーク側で自動的に通話をスクリーニングするものです。未知の番号からの着信に対し、AIが発信者と用件を確認することで、多忙なビジネスパーソンの生産性向上に貢献します。

この機能の最大の特徴は、AIが個々の端末ではなく、AT&T;のネットワーク全体に組み込まれている点です。GoogleAppleの既存機能がデバイス上の連絡先リストに依存するのに対し、AT&T;のAIはネットワークから得るユーザーのコールパターンを分析します。これにより、頻繁なやり取りを把握し、信頼できる発信者を正確に判断することで、より高い精度での通話フィルタリングを実現しています。

未知の番号から着信があった場合、AIアシスタントが自動で応答し、発信者が人間であるか、または緊急性があるかを声のトーンなどから判定します。基準を満たした通話のみを本人に転送するか、メッセージを残すかを選択できます。

また、ユーザーは専用アプリを通じてAIによる通話のリアルタイム文字起こしを確認し、いつでも会話に加わることも可能です。AT&T;の最高データ責任者によると、このAIアシスタントは単なるスクリーニングに留まらず、将来的に予約やスケジュール調整といった複雑なタスクの代行へと進化する可能性を秘めています。