OpenAIは、同社が提供しているChatGPTなどのAIモデルがどのように動作しているか、そして将来的にどのように振る舞うべきかを定義する、「Model Spec」と呼ばれるフレームワークの初稿を公開した。同社はこれを公開することで、人々にこれについて話し合う機会を設けることで透明性を醸成し、将来的なAI開発に繋げたいと考えている。
OpenAIが提案しているModel Specでは、モデルの動作を設計するための目的、ルール、標準的な動作が定義されている。OpenAIによると、モデルの振る舞い、つまりモデルがユーザーの入力にどのように反応するかは、人々がAIとどのように対話するかという点で、極めて重要だという。しかし、モデルは明示的にプログラムされるのではなく、様々なデータから学習されるため、この振る舞いを設計することはまだ研究が始まったばかりの段階だと言える。
Model Specは、「OpenAIのドキュメント、研究、モデルの動作を形成するための経験、および将来のモデルの開発に影響を与える進行中の作業を反映している」と、同社は述べている。
OpenAIはマルチレベルのアプローチを追求する
Model Specは、研究者や“AIトレーナー”が、人間のフィードバックからの強化学習(RLHF)のためのデータを生成するためのガイドラインとして機能する。長期的には、OpenAIはAIモデルがModel Specから直接学習できるかどうかを調査したいと考えているとのことだ。
Model Specでは、目的、ルール、標準動作を区別する:
- 目的は、望ましい行動の一般的な方向性を示すが、具体的な指示を与えるには広すぎることが多い。
- ルールは、目的間の矛盾を解決し、安全性と合法性を保証する。これらのルールは、開発者やユーザーが上書きすることはできない。
- 標準的な振る舞いは、原則に沿った振る舞いの概要を示すものですが、最終的には開発者や利用者にコントロールを委ねます。また、相反する目標に優先順位をつける方法も示している。
目標には、開発者とエンドユーザをサポートすること、人類に利益をもたらすこと、OpenAIをよく代表することが含まれる。ルールには、優先的に指示に従うこと、法律を遵守すること、違法または有害なコンテンツを避けること、著作権や人格権を保護することなどが含まれる。
標準的な行動には、善意を前提とすること、明確な質問をすること、客観的であること、意見に影響を与えないこと、不確実性を表現すること、長さの制限を尊重しながら効率的に行うことなどが含まれる。
Model Specは進化し続ける
OpenAIは、今回のリリースを、モデルがどのように振る舞うべきか、望ましいモデルの振る舞いはどのように定義されるのか、そしてこれらの議論に一般の人々がどのように参加するのがベストなのかについて、現在進行中の公開討論の一環であると考えている。OpenAIのプロダクトマネージャーであるJoanne Jang氏は、このアイデアはAIモデルがどのように振る舞うべきかを指示するのに役立つ一般からの意見を得ることだと説明し、このフレームワークは意図的なものとバグとの間に明確な線を引くのに役立つだろうと述べている。同社はこれを公開することで、政策立案者、信頼できる機関、専門家など、世界中の代表的な利害関係者を巻き込むことを目指しているようだ。
今後2週間にわたり、OpenAIはModel Specの目標、ルール、基準に関するフィードバックを一般から募集する。モデルそのものと同様に、Model Specは受け取ったフィードバックに基づいて継続的に開発されるとのことだ。
ただし、OpenAIは、一般からのフィードバックがどの程度採用される可能性があるのか、また誰が何を変更する必要があるかを決定するのかについては明言していない。最終的に、モデルがどのように振る舞うかについての最終決定権は同社にあり、投稿の中で、「私たちは、私たちの使命に向かって責任を持って構築していることを確実にするために、フィードバックを収集し、取り入れるための強固なプロセスを開発する際に、これが私たちに初期の洞察を提供することを願っています」と、述べている。
Source
- OpenAI: Introducing the Model Spec
コメント