生成AI技術は、私たちがオンラインでコミュニケーションを取り、コンテンツを作成する方法を変えつつあります。多くの人が、記事の要約、メールの校正、メッセージの書き直しといったタスクを、Google GeminiのようなAIチャットボットに依頼しています。しかし、特に非常に個人的または機密性の高い情報が関わるタスクの場合、これらのAIチャットボットの使用を懸念する人もいます。これらのプライバシーに関する懸念に対処するため、Googleはクラウドサーバーではなくデバイス上で直接動作する、より小さく最適化されたAIモデルであるGemini Nanoを提供しています。Gemini Nanoへのアクセスはこれまで特定のデバイスラインとテキスト入力のみに限定されていましたが、Googleはまもなくその利用範囲を大幅に拡大し、画像入力のサポートを導入する予定です。
先月後半、GoogleはI/O 2025のセッションリストを発表しましたが、そこには「AndroidにおけるGemini Nano:デバイス上生成AIを用いた開発」というタイトルのセッションが含まれていました。セッションの説明には、「Gemini Nanoの力を活用する新しい生成AI APIセットを紹介する。これらの新しいAPIにより、テキストの要約、校正、書き直し、画像説明の生成といったユースケースを容易に実装できるようになる」と記載されています。
10月、GoogleはAI Edge SDKを通じてGemini Nanoへの実験的アクセスを公開し、サードパーティの開発者がPixel 9シリーズでテキストからテキストへのプロンプトを試せるようにしました。AI Edge SDKは、言い換え、スマートリプライ、校正、要約などのテキストベースの機能を可能にします。
Googleが次回のI/Oセッションで強調している画像説明生成機能は、AI Edge SDKには含まれていない点が注目に値します。そのため、セッションの説明で言及されている「新しい生成AI APIセット」は、AI Edge SDKとは全く異なるもの、もしくはそれの新しいバージョンを指している可能性が高いです。幸いにも、来週まで待つ必要はありません。
今週初頭、GoogleはML Kitの新しいGenAI APIに関するドキュメントを静かに公開しました。ML Kitは、開発者が基盤となるモデルの仕組みを理解する必要なく、アプリで機械学習機能を活用できるSDKです。「簡素化された高レベルインターフェースを通じて、一般的なタスクにすぐに使えるパフォーマンスを提供するためにGemini Nanoの能力を活用できるようにする」新しいGenAI APIは、開発者にそれを可能にします。AI Edge SDKと同様に、「AICore上に構築」されており、「Gemini NanoのようなAI基盤モデルのデバイス上での実行」を可能にし、データ処理をローカルに保持することでアプリの機能とユーザーのプライバシーを向上させます。
言い換えれば、ML KitのGenAI APIは、開発者が様々な機能をアプリに、プライバシーを保ち、高性能でGemini Nanoを利用することを容易にします。これらの機能には現在、テキストの要約、校正、書き換えに加え、画像説明の生成が含まれています。これら4つの機能全てがI/Oセッションの説明で言及されている内容と一致しており、Googleが来週、ML KitのGenAI APIを正式に発表する意図であることを示唆しています。
ML KitのGenAI APIによるGemini Nanoの提供について:
既存のAI Edge SDKと比較して、ML KitのGenAI APIは「実験的アクセス」ではなく「ベータ版」として提供されます。この「ベータ版」指定は、Googleがアプリでの本番環境でのGenAI APIの使用を許可することを意味する可能性があります。現在、開発者はAI Edge SDKを使用したアプリをリリースすることはできないため、サードパーティアプリがGemini Nanoを利用することはできません。もう1つの違いは、AI Edge SDKはテキスト入力のみに限定されているのに対し、ML KitのGenAI APIは画像をサポートしている点です。この画像サポートにより、画像説明機能が有効になり、アプリは任意の画像の短い説明を生成できます。
しかし、現在のAI Edge SDKとML KitのGenAI APIの最大の相違点は、デバイスのサポートです。AI Edge SDKはGoogle Pixel 9シリーズのみに対応しているのに対し、ML KitのGenAI APIは、マルチモーダルGemini NanoモデルをサポートするあらゆるAndroidスマートフォンで使用できます。これには、HONOR Magic 7、Motorola Razr 60 Ultra、OnePlus 13、Samsung Galaxy S25、Xiaomi 15など多くの機種が含まれます。
アプリでGemini Nanoを試してみたい開発者は、ML Kit GenAI APIの公開ドキュメントを参照して開始できます。
出典: https://www.androidauthority.com/gemini-nano-ml-kit-genai-api-3558292/


コメント