Googleは2024年4月9日から11日にかけてラスベガスで開催されている
「Google Cloud Next ’24」Googleは2024年4月9日から11日にかけてラスベガスで開催されている「Gemini 1.5 Pro」のパブリックプレビューを開始したことを発表しました。
Gemini 1.5 Proは、2024年2月15日に発表されたモデルで、最大で1時間のムービーや70万語のテキストを扱えるとされています。デモンストレーションの様子は下記の記事で確認できます。
GoogleがGemini 1.5をリリース、最大100万トークンを処理できて1時間のムービーや70万語のテキストを扱うことが可能
これまでGemini 1.5 Proは限られた人のみが使用できる「限定テスト」が行われていましたが、2024年4月9日に180カ国以上でパブリックプレビューの開始が発表され、Gemini API経由で誰でも使用できるようになりました。
Gemini 1.5 Proのパブリックプレビューでは、発表時の機能に加えて以下の新機能が搭載されています:
- 音声理解機能: 音声を理解する能力が追加されました。
- ファイルAPI: ファイルの処理を容易にするための新しいAPIが導入されました。
- システム命令とJSONモード: 開発者がモデルの出力をより詳細に制御できるようになりました。
これらの新機能により、Gemini 1.5 Proはさらに高度なタスクに対応できるようになりましたね!
パブリックプレビューの開始と同時に、Gemini APIを通じて次世代のテキスト埋め込みモデルもリリースされました。下図の「gecko」は新たなテキスト埋め込みモデルで、MTEBベンチマークで同等のディメンションを持つ既存のモデルを上回るより強力な検索パフォーマンスを実現しています。
この高性能なモデルは、テキスト処理のさまざまなタスクにおいて革新的な成果をもたらすことでしょう!