OpenAIは、最新の生成モデルGPT-4 Turbo with VisionをAPIで一般提供し始めました。そして、ChatGPTにも展開が始まったことを言及しています。
現在、モデルgpt-4-turboにはバージョンgpt-4-turbo-2024-04-09が使用されています。
GPT-4 Turboは、画像を理解できるマルチモーダルなモデルであり、そのことを指してGPT-4 Turbo with Visionと名付けられています。
コンテキストウィンドウで最大128Kトークン(テキスト300ページに相当)を利用でき、トレーニングデータは2023年12月までのものが使われています。また、VisionリクエストにはJSONモードやFunction callingが利用できます。
なお、GPT-4 Turboの価格は、入力が**$10/1Mトークン**、出力が**$30/1Mトークンであり、GPT-4と比較すると入力が3倍**、出力が2倍安く利用できるようになっています。
今回の一般提供にあたって、いくつかの応用事例を示しています。