Googleは新しいGoogle AI SDKを発表し、これまでで最高のパフォーマンスを誇るGemini ProをAndroidアプリに簡単に統合できるようにした。このSDKを使うことで、開発者は独自のバックエンドインフラを構築・管理する必要がなくなる。
Googleによると、Gemini Proは、テキストや画像の推論タスクに幅広く対応する機能を備えた最高のモデルだという。Gemini Proは、Googleのデータセンターでオフデバイスで実行され、Gemini APIを通じてアクセスできる。Googleによれば、Geminiを使用するもっとも簡単な方法は、Google AI Studioを使用することである。Google AI Studioは、ブラウザ上でプロトタイプを作成し、プロンプトを実行できるウェブベースのツールである。結果が満足のいくものであれば、モデルをコードにエクスポートし、バックエンドで実行するPythonなど、好みの言語で使用できる。
Androidアプリのために、グーグルはGoogle AI client SDK for Androidを提供しており、これはGemini REST APIを慣用的なKotlin APIにラップしている。これを使えば、開発者はAndroidアプリでGeminiモデルにアクセスするために、REST APIを直接操作したり、サーバーサイドのサービスを実装したりする必要がなくなる。
以下のスニペットは、Google AI SDKを使用して、テキストのみのプロンプトからテキストを生成する方法を示している。
val generativeModel = GenerativeModel(
modelName = "gemini-pro"
apiKey = BuildConfig.apiKey
)
val prompt = "Write a story about a magic backpack."
val response = generativeModel.generateContent (prompt)
print(response.text)
テキストのみのモデルに加えて、Geminiは、テキストと画像の入力からテキストを生成できるマルチモーダルモデルも提供しており(gemini-pro-vision)
、より高速なインタラクションのためのストリーミングをサポートしている。この場合、以下のようにgenerateContent
の代わりにgenerateContentStream
を使用する。
var fullResponse = ""
generativeModel.generateContentStream(inputContent).collect{ chunk->
print(chunk.text)
fullResponse += chunk.text
}
開発者のワークフローをさらに簡素化するために、Android Studioの最新プレビューでは、Google AI StudioでAPIキーを生成することから始まり、Gemini Proを使用するために必要な手順を開発者にガイドする新しいプロジェクトテンプレートが導入されている。
Gemini Proの他に、Googleはデバイス上で実行可能なGemini Nanoという小型モデルも提供している。これは、データがデバイスから離れることのないアプリケーションを可能にし、ネットワークが利用できない場合でも予測可能なレイテンシーを保証する。Gemini Nanoは、モデル管理、ランタイム、安全性などを管理することで、AndroidアプリへのAIの組み込みを簡素化することを目的としたAndroid 14向けの新しいシステムサービスであるAICoreを通じて、一部の端末で利用できる。