GoogleがGemini 1.5 Proの一般プレビューを開始、音声理解・システム命令・JSONモードなどの新機能を搭載

GoogleがGemini 1.5 Proの一般プレビューを開始、音声理解・システム命令・JSONモードなどの新機能を搭載 Google

Googleは2024年4月9日から11日にかけてラスベガスで開催されている
Google Cloud Next ’24」Googleは2024年4月9日から11日にかけてラスベガスで開催されている「Gemini 1.5 Pro」のパブリックプレビューを開始したことを発表しました。

Gemini 1.5 Pro Now Available in 180+ Countries; With Native Audio Understanding, System Instructions, JSON Mode and More – Google for Developers

Gemini 1.5 Proは、2024年2月15日に発表されたモデルで、最大で1時間のムービー70万語のテキストを扱えるとされています。デモンストレーションの様子は下記の記事で確認できます。

GoogleがGemini 1.5をリリース、最大100万トークンを処理できて1時間のムービーや70万語のテキストを扱うことが可能


これまでGemini 1.5 Proは限られた人のみが使用できる「限定テスト」が行われていましたが、2024年4月9日に180カ国以上でパブリックプレビューの開始が発表され、Gemini API経由で誰でも使用できるようになりました。

Gemini 1.5 Proのパブリックプレビューでは、発表時の機能に加えて以下の新機能が搭載されています:

  1. 音声理解機能: 音声を理解する能力が追加されました。
  2. ファイルAPI: ファイルの処理を容易にするための新しいAPIが導入されました。
  3. システム命令とJSONモード: 開発者がモデルの出力をより詳細に制御できるようになりました。

これらの新機能により、Gemini 1.5 Proはさらに高度なタスクに対応できるようになりましたね!

パブリックプレビューの開始と同時に、Gemini APIを通じて次世代のテキスト埋め込みモデルもリリースされました。下図の「gecko」は新たなテキスト埋め込みモデルで、MTEBベンチマークで同等のディメンションを持つ既存のモデルを上回るより強力な検索パフォーマンスを実現しています。

この高性能なモデルは、テキスト処理のさまざまなタスクにおいて革新的な成果をもたらすことでしょう!

タイトルとURLをコピーしました