|
2月18日のニュース: 本日、イーロン・マスク氏の人工知能企業 xAI が大型モデル Grok 3 をリリースしました。 大規模モデル機能の点では、Grok-3 は、数学的推論、科学的論理的推論、コード作成における複数のベンチマーク テストで DeepSeek-v3、GPT-4o、Gemini-2 pro よりも優れたパフォーマンスを発揮しました。 AIME'24 数学テストでは、Grok-3 は 52 ポイントを獲得し、DeepSeek-V3 の 39 ポイントを大幅に上回りました。 GPQA 科学知識評価では、Grok-3 は 75 ポイントを獲得し、DeepSeek-V3 の 65 ポイントを上回りました。 さらに、LCB 10月〜2月のプログラミング能力テストでも、Grok-3はDeepSeek-V3の36ポイントを上回る57ポイントを獲得しました。 xAIの公式発表によると、Grok 3はトレーニング中に10万個のNvidia H100チップを活用しており、前身のGrok 2で使用された1万5000個のGPUと比較して大幅な進歩を遂げている。(Yu Feng) |
マスク氏のxAIはGrok 3をリリースし、GPT-4oとDeepSeek-v3を上回ると主張した。
関連するおすすめ記事
-
Alipay: アジア冬季競技大会の期間中、訪日観光客による Alipay の支出は 6 倍近く増加しました。
-
Appleは、充電ポートを再設計した新しいMagic Mouse 3をリリースする予定です。
-
ZTE は、MWC 2025 で AI for All イニシアチブを紹介し、AI エコシステムのイノベーションを加速します。
-
NIOの李斌氏:中国の自動車輸出の潜在力は非常に大きい
-
TechWebウィークリーハイライト:Huawei Mate 70の発売日は11月26日に決定、ByteDanceは年末インセンティブを増額
-
中国汽車工業協会(CAAM):11月の新エネルギー車販売台数は151万2000台に達し、前年同月比47.4%増加した。