SHOUJIKE

Dark Side of the Moon は、OpenAI の o1 シリーズに対抗することを目指して、k0-math 推論モデルをリリースしました。

Sina Tech News、11月16日(午後) – Kimi Chat の一般公開サービス開始1周年を記念して、Kimi Chat は次世代の数学的推論モデル k0-math のリリースを発表しました。

ベンチマークテストの結果、Kimi k0-mathの数学能力は、公開されているOpenAI o1シリーズの2つのモデル、o1-miniとo1-previewに匹敵することが示されました。中学入試、大学入試、大学院入試、そしてMATH(入門レベルの競技問題を含む)の4つの数学ベンチマークテストにおいて、初期k0-mathモデルはo1-miniとo1-previewモデルを上回る成績を達成しました。さらに難易度の高い競技レベルの数学ベンチマークテストであるOMNI-MATHとAIMEでは、初期k0-mathモデルはそれぞれo1-miniの最高得点の90%と83%を達成しました。

一方、Kimi Explorer Editionは強化学習技術を活用することで検索体験を革新し、意図強化、ソース分析、連鎖推論という3つの主要な推論機能において飛躍的な進歩を遂げました。Kimiの創設者であるヤン・ジーリン博士は、k0-mathモデルとより強力なKimi Explorer Editionが、今後数週間かけてKimiウェブ版とKimiスマートアシスタントアプリに順次展開され、ユーザーがより難解な数学および検索研究タスクを解決できるようになると説明しました。(ウェン・メン)