・OpenAIは、AIモデルの望ましい振る舞いを示す「Model Spec」を公開した。
・Model Specは、目的、ルール、デフォルトの振る舞いの3要素で構成され、研究者やAIトレーナーのガイドラインとして活用される。
・OpenAIは、Model Specに関する取り組みを継続的に公開し、幅広いステークホルダーからのフィードバックを求めていく方針である。
OpenAIは「Model Spec」と呼ばれる新しいドキュメントを公開しました。このドキュメントは、OpenAI APIやChatGPTにおいて、AIモデルがどのように振る舞うべきかを示すものです。
Model Specの目的と内容
OpenAIによると、Model Specは以下の3つの要素で構成されています。
- 目的(Objectives): 望ましい振る舞いの方向性を示す広範な一般原則
- ルール(Rules): 安全性と合法性を確保するために、複雑さに対処する指示
- デフォルトの振る舞い(Default behaviors): 目的とルールに沿ったガイドライン
OpenAIは、「Model Specは、AIモデルの振る舞いを形作ることについての実践的な選択肢を理解し、議論するために重要だと考えています」と述べています。
Model Specの活用方法
OpenAIは、Model Specを人間のフィードバックから強化学習を行う研究者やAIトレーナーのためのガイドラインとして使用する予定です。また、AIモデルがModel Specから直接学習できる可能性についても探求するとのことです。
今後の展開
OpenAIは、Model Specに関する取り組みを継続的に公開し、グローバルなステークホルダーからのフィードバックを求めていく方針です。また、一般の人々からのフィードバックも2週間受け付けるとしています。
OpenAIは今後1年間で、Model Specの変更点、フィードバックへの対応、AIモデルの振る舞いを形作る研究の進捗状況などを共有していく予定です。