マスク氏のxAIはGrok 3をリリースし、GPT-4oとDeepSeek-v3を上回ると主張した。

2月18日のニュース: 本日、イーロン・マスク氏の人工知能企業 xAI が大型モデル Grok 3 をリリースしました。

大規模モデル機能の点では、Grok-3 は、数学的推論、科学的論理的推論、コード作成における複数のベンチマークテストで DeepSeek-v3、GPT-4o、Gemini-2 pro よりも優れたパフォーマンスを発揮しました。

AIME'24 数学テストでは、Grok-3 は 52 ポイントを獲得し、DeepSeek-V3 の 39 ポイントを大幅に上回りました。

GPQA 科学知識評価では、Grok-3 は 75 ポイントを獲得し、DeepSeek-V3 の 65 ポイントを上回りました。

さらに、LCB 10月〜2月のプログラミング能力テストでも、Grok-3はDeepSeek-V3の36ポイントを上回る57ポイントを獲得しました。

xAIの公式発表によると、Grok 3はトレーニング中に10万個のNvidia H100チップを活用しており、前身のGrok 2で使用された1万5000個のGPUと比較して大幅な進歩を遂げている。(Yu Feng)

SHOUJIKE