【要約】Say hi to “Siri AI"—Apple announces new, more “conversational” voice assistant [Ars_Technica] | Summary by TechDistill
> Source: Ars_Technica
Execute Primary Source
// Problem
従来の音声アシスタントは、ユーザーの複雑な要求に柔軟に応えられなかった。単発のタスク実行に限定され、文脈の維持やアプリを跨ぐ操作が困難であった。また、高度な処理のためにデータをクラウドへ送る際のプライバシー保護も課題であった。
- ・文脈の断絶:一問一答形式の対話による、継続的な会話の困難さ。
- ・情報の断片化:アプリ間で情報を横断的に扱う操作の難しさ。
- ・プライバシーリスク:クラウド利用時における個人データの安全性確保。
// Approach
Appleは、デバイス内のデータとAIを密結合させる手法を採用した。個人のコンテキストを理解し、高度な推論を行う仕組みを構築した。
- ・パーソナルコンテキストの活用:メッセージやメール等の情報を検索・利用。
- ・2層のAIモデル構造:チップ性能に応じたモデルの使い分け。
- ・Private Cloud Compute:プライバシーを担保したクラウド処理。
- ・ビジュアルインテリジェンス:カメラや画面情報の直接解析。
// Result
新機能の導入により、ユーザーの操作体験は劇的に変化する。自然な対話を通じて、複雑なマルチステップのタスクが完結する。
- ・マルチステップ対話:レシピ検索から共有までを会話で完結。
- ・デバイス間同期:iCloud経由で会話を継続可能。
- ・ハードウェア価値の向上:M4/M3チップ搭載機への強力な付加価値。
Senior Engineer Insight
> エッジとクラウドのハイブリッド構成は、実用的な設計である。メモリ12GB以上の制約は、大規模モデルの動作条件として妥当だ。開発者は、OSレベルの統合により、強力なコンテキストを利用できる可能性がある。ただし、デバイス性能による機能差を考慮した設計が求められる。また、クラウド依存機能には利用制限がある点に注意が必要だ。