・OpenAIがAssistants APIの新バージョンをリリースし、以下の機能が追加・改善されました。
・大規模ファイル検索、ベクトルストアオブジェクト、トークン使用量の制御などが可能に。
・ツールの強制使用、カスタム会話履歴の作成、ファインチューンモデルの使用がサポートされた。
・ストリーミングがサポートされ、Node と Python の SDK にヘルパー機能が追加された。
OpenAIは、Assistants APIに新機能と改善を加え、新しいAPIバージョン「OpenAI-Beta: assistants=v2」へとベータ版を移行すると発表しました。主な更新内容は以下の通りです。
機能 | 詳細 |
---|---|
大規模なファイル検索 | 新しい検索ツール「file_search」の導入により、アシスタントあたり最大1万ファイルまで取り込み可能(以前の500倍)。高速化、マルチスレッドによる並列検索、ランキングやクエリの書き換え機能も強化。 |
ベクトルストアオブジェクトの追加 | file_searchと併せて、APIに「vector_store」オブジェクトが導入。ファイルをベクトルストアに追加すると、自動的に解析、分割、埋め込みが行われ、検索可能な状態に。複数のアシスタントやスレッドで使用可能で、ファイル管理と課金が簡素化。 |
トークン使用量の制御 | Assistants APIで、1回の実行に使用するトークンの最大数を制御可能。トークン使用コストを管理できる。各実行で使用する過去のメッセージ数にも上限設定可能。 |
ツールの強制使用 | 特定の実行で、file_search、code_interpreter、functionなどの特定のツールを強制的に使用するための「tool_choice」パラメータが追加。 |
カスタム会話履歴の作成 | スレッドで、「assistant」ロールのメッセージを作成し、カスタムの会話履歴を作成可能。 |
モデル設定パラメータのサポート | Assistant と Run オブジェクトで、temperature、response_format (JSONモード)、top_pなどの一般的なモデル設定パラメータがサポート。 |
ファインチューンモデルの使用 | Assistants APIでファインチューンモデルを使用可能。現在はgpt-3.5-turbo-0125のファインチューンバージョンのみサポート。 |
ストリーミングのサポート | Assistants APIがストリーミングをサポート。Node と Python の SDK にストリーミングとポーリングのヘルパー機能が追加。 |