SHOUJIKE

Kimi は、複数の STEM テストで OpenAI o1 を上回る視覚思考モデル k1 をリリースしました。

12月16日、WeChatアカウント「Dark Side of the Moon」は、Kimiによる視覚思考モデルk1のリリースを発表しました。強化学習技術を基盤とするk1モデルは、エンドツーエンドの画像理解と思考連鎖技術をネイティブにサポートし、数学の枠を超えてより基礎的な科学分野にもその機能を拡張しています。数学、物理学、化学などの基礎科学分野におけるベンチマークテストにおいて、初期のk1モデルは、世界的なベンチマークモデルであるOpenAI o1、GPT-4o、Claude 3.5 Sonnetを凌駕する性能を示しました。

報道によると、K1モデルは真にエンドツーエンドの画像理解・推論機能を実現しています。K1モデルは、外部OCRや追加の視覚モデルに頼ることなく、ユーザーが入力した画像情報を直接処理し、推論によって回答を導き出すことができるため、新たなレベルのユーザーエクスペリエンスと有効性を実現します。

K1ビジュアル思考モデルは、「Kimi Smart Assistant」のAndroidおよびiPhoneモバイルアプリの最新バージョン、およびウェブサイトkimi.comでご利用いただけます。ユーザーは、最新のモバイルアプリまたはKimi+ウェブサイトで「Kimi Visual Thinking Edition」を見つけ、写真を撮影したり、画像をアップロードしたりして体験できます。(イー・ユエ)