|
Sina Tech News、11月16日(午後) – Kimi Chat の一般公開サービス開始1周年を記念して、Kimi Chat は次世代の数学的推論モデル k0-math のリリースを発表しました。 ベンチマークテストの結果、Kimi k0-mathの数学能力は、公開されているOpenAI o1シリーズの2つのモデル、o1-miniとo1-previewに匹敵することが示されました。中学入試、大学入試、大学院入試、そしてMATH(入門レベルの競技問題を含む)の4つの数学ベンチマークテストにおいて、初期k0-mathモデルはo1-miniとo1-previewモデルを上回る成績を達成しました。さらに難易度の高い競技レベルの数学ベンチマークテストであるOMNI-MATHとAIMEでは、初期k0-mathモデルはそれぞれo1-miniの最高得点の90%と83%を達成しました。 一方、Kimi Explorer Editionは強化学習技術を活用することで検索体験を革新し、意図強化、ソース分析、連鎖推論という3つの主要な推論機能において飛躍的な進歩を遂げました。Kimiの創設者であるヤン・ジーリン博士は、k0-mathモデルとより強力なKimi Explorer Editionが、今後数週間かけてKimiウェブ版とKimiスマートアシスタントアプリに順次展開され、ユーザーがより難解な数学および検索研究タスクを解決できるようになると説明しました。(ウェン・メン) |
Dark Side of the Moon は、OpenAI の o1 シリーズに対抗することを目指して、k0-math 推論モデルをリリースしました。
関連するおすすめ記事
-
iPhone 13の価格が半額になり、買いだめラッシュが起こり、売上が10倍に急増。
-
JD.comの内部関係者は、「真胡価格」政策に関して吐虎が起こした訴訟に対し、「私たちは非常に無力感を感じています。ダブル11期間中は断固として低価格を維持します」と反応した。
-
OpenAI最高製品責任者:ChatGPTウェブバージョンは今週、高度な音声モードを導入予定
-
我が国の年間宅配便取扱量が初めて1500億個を超え、過去最高を記録しました。
-
ウー・ヨンミンは、6四半期連続で3桁の成長を誇るアリババの最も有望なAIアプリケーションを明らかにしました。
-
小米科技は時価総額で世界上場自動車メーカーのトップ3にランクイン。雷軍は自動車生産能力のさらなる増強を目指す。