|
Sina Tech News、11月16日(午後) – Kimi Chat の一般公開サービス開始1周年を記念して、Kimi Chat は次世代の数学的推論モデル k0-math のリリースを発表しました。 ベンチマークテストの結果、Kimi k0-mathの数学能力は、公開されているOpenAI o1シリーズの2つのモデル、o1-miniとo1-previewに匹敵することが示されました。中学入試、大学入試、大学院入試、そしてMATH(入門レベルの競技問題を含む)の4つの数学ベンチマークテストにおいて、初期k0-mathモデルはo1-miniとo1-previewモデルを上回る成績を達成しました。さらに難易度の高い競技レベルの数学ベンチマークテストであるOMNI-MATHとAIMEでは、初期k0-mathモデルはそれぞれo1-miniの最高得点の90%と83%を達成しました。 一方、Kimi Explorer Editionは強化学習技術を活用することで検索体験を革新し、意図強化、ソース分析、連鎖推論という3つの主要な推論機能において飛躍的な進歩を遂げました。Kimiの創設者であるヤン・ジーリン博士は、k0-mathモデルとより強力なKimi Explorer Editionが、今後数週間かけてKimiウェブ版とKimiスマートアシスタントアプリに順次展開され、ユーザーがより難解な数学および検索研究タスクを解決できるようになると説明しました。(ウェン・メン) |
Dark Side of the Moon は、OpenAI の o1 シリーズに対抗することを目指して、k0-math 推論モデルをリリースしました。
関連するおすすめ記事
-
テスラのイーロン・マスクCEOは、2025年前半に発売予定の手頃な価格の電気自動車を発売する計画を改めて表明した。
-
Nvidia従業員の80%が1億ドル以上の収入!Nvidiaの富の創造神話の裏側:いくら高額な報酬を提示されても、そこで働きたくないと言う従業員もいる。
-
報道によれば、Appleは早ければ来週にも新型iPhone SEをリリースし、販売は今月から始まる見込みだという。
-
アマゾンが正式にオンライン自動車販売事業に参入
-
宗木科技の関係者は、従業員の給与は短期的に調整されたものの停止されておらず、同社は通常通り運営されていると述べた。
-
中国の航空宇宙企業、大航躍進社が開発した、スペースXが使用するのと同じタイプのロケット発射装置が、箸を使ってロケット発射装置を保持するテストを完了した。