【生成AIニュースメモ】OpenAIがAssistants APIの新バージョンをリリース(2024/4/18)

・OpenAIがAssistants APIの新バージョンをリリースし、以下の機能が追加・改善されました。
・大規模ファイル検索、ベクトルストアオブジェクト、トークン使用量の制御などが可能に。
・ツールの強制使用、カスタム会話履歴の作成、ファインチューンモデルの使用がサポートされた。
・ストリーミングがサポートされ、Node と Python の SDK にヘルパー機能が追加された。

OpenAIは、Assistants APIに新機能と改善を加え、新しいAPIバージョン「OpenAI-Beta: assistants=v2」へとベータ版を移行すると発表しました。主な更新内容は以下の通りです。

機能	詳細
大規模なファイル検索	新しい検索ツール「file_search」の導入により、アシスタントあたり最大1万ファイルまで取り込み可能（以前の500倍）。高速化、マルチスレッドによる並列検索、ランキングやクエリの書き換え機能も強化。
ベクトルストアオブジェクトの追加	file_searchと併せて、APIに「vector_store」オブジェクトが導入。ファイルをベクトルストアに追加すると、自動的に解析、分割、埋め込みが行われ、検索可能な状態に。複数のアシスタントやスレッドで使用可能で、ファイル管理と課金が簡素化。
トークン使用量の制御	Assistants APIで、1回の実行に使用するトークンの最大数を制御可能。トークン使用コストを管理できる。各実行で使用する過去のメッセージ数にも上限設定可能。
ツールの強制使用	特定の実行で、file_search、code_interpreter、functionなどの特定のツールを強制的に使用するための「tool_choice」パラメータが追加。
カスタム会話履歴の作成	スレッドで、「assistant」ロールのメッセージを作成し、カスタムの会話履歴を作成可能。
モデル設定パラメータのサポート	Assistant と Run オブジェクトで、temperature、response_format (JSONモード)、top_pなどの一般的なモデル設定パラメータがサポート。
ファインチューンモデルの使用	Assistants APIでファインチューンモデルを使用可能。現在はgpt-3.5-turbo-0125のファインチューンバージョンのみサポート。
ストリーミングのサポート	Assistants APIがストリーミングをサポート。Node と Python の SDK にストリーミングとポーリングのヘルパー機能が追加。