SHOUJIKE

OpenAI が強化された微調整研究プロジェクトを開始。CEO の Altman 氏はこれを「今年最大のサプライズ」と呼んでいます。

12月7日、海外メディアの報道によると、AIスタートアップのOpenAIは12日間のライブストリームイベントを開催した。イベント初日には、o1推論モデルのフルバージョンがリリースされ、月額200ドルのChatGPT Proサブスクリプションが新たに追加された。

ライブストリーム2日目、OpenAIは強化されたファインチューニング研究プロジェクトを開始しました。このプロジェクトは、開発者や機械学習エンジニアが細かく調整されたエキスパートモデルを作成できるようにすることを目的としています。

新しいモデルカスタマイズ技術により、開発者は数十から数千の高品質なタスクを用いてモデルをカスタマイズし、提供された参照回答に基づいてモデルの応答を評価することが可能になります。この技術により、類似の問題に対する解を導き出すモデル能力と、特定のタスクにおける精度が向上します。

OpenAI のデモンストレーションでは、細かく調整された o1-mini モデルのスコアが 80% 向上し、公式の o1 バージョンを直接上回りました。

OpenAIによると、ユーザーはO1、ファインチューニング、データを組み合わせることで、より小型のカスタムO1モデル「O1 mini」を作成できます。ユーザーはデータを提供するだけで、強化とファインチューニングのためにデータセットと「スコアラー」を設定し、トレーニングデータセットと検証データセットに基づいてモデルのパフォーマンスを評価します。残りの作業はOpenAIが処理します。

OpenAIのCEO、アルトマン氏はソーシャルメディアに「結果は素晴らしい。私にとって2024年最大の驚きだ。人々が何を作るのか楽しみだ!」と投稿した。

OpenAIは、自社のカスタムモデルプラットフォームが強化学習をサポートすると発表しました。強化学習は、OpenAIがGPT-4oやO1シリーズなどの最先端モデルの学習に社内で使用している技術です。OpenAIの社内テストでは、強化学習による微調整は既に生化学、セキュリティ、法律、ヘルスケアの分野で成功を収めています。

OpenAIの計画によれば、強化・微調整されたバージョンは2025年初頭に一般公開される予定で、現在、企業、大学、研究機関に申請・テストのチャネルが開かれている。