|
DeepSeekは3月1日、知乎に公式アカウントを開設し、「DeepSeek-V3/R1推論システムの概要」と題する技術記事を独占公開し、モデル推論システムの最適化の詳細を初めて明らかにし、コストと利益率に関する重要な情報を公開しました。 DeepSeeKの論文では、「DeepSeek-V3/R1推論システムの最適化目標は、スループットの向上とレイテンシの低減である」と述べられています。この2つの目標を達成するために、DeepSeekは大規模なマルチノードエキスパート並列処理(EP)を採用していますが、これはシステムの複雑さを増大させます。この論文では主に、EPを用いてバッチサイズを拡大し、転送時間を隠蔽し、負荷分散を行う方法について議論しています。 この記事でDeepSeekのコストと利益率に関する重要な情報も明らかにされている点は注目に値します。「GPUのレンタル費用を1時間あたり2ドルと仮定すると、総コストは1日あたり87,072ドルとなります。…すべてのトークンの価格がDeepSeek R1に基づいて設定された場合、理論上の1日あたり総収益は562,027ドルとなり、コスト利益率は545%となります。」 「DeepSeekオープンソースウィーク」は2月24日から28日まで開催され、オープンソースを通じた最新の技術革新が紹介されたようです。FlashMLA、DeepEP、DeepGEMM、3FSという4つのオープンソースプロジェクトに加え、DualPipeやEPLBといったコードリポジトリも紹介されました。 業界関係者の中には、「DeepSeek Open Source Week」の重要性が、最近のOpenAIのローンチイベントを上回っていると考える者もいる。DeepSeekの「豊富で包括的な」オープンソースコンテンツは、DeepSeekが意図的に低いトレーニングコストを重視しているという欧米の主張を力強く反駁し、トレーニングパイプラインに大きな最適化の余地があることを証明している。 |
DeepSeek は、初めて理論上の利益率が 545% であることを明らかにしたレポートで Open Source Week を締めくくりました。
関連するおすすめ記事
-
TechWeb Evening News: 「AIの天才」Luo FuliがDeepSeekを退社、xAIがGrok 3をリリース。
-
アビタの売上が2倍以上に増加!10月の販売台数は過去最高の10,056台を記録。
-
Jiyueの中級管理職が、夏一萍の経営秘訣を明かした。火鍋パーティーに50万元を費やし、1回のライブ配信で700万~800万元を稼いでいたという。
-
ホンダは中国市場での業績不振により、2024年度第2四半期の営業利益が前年同期比15%減の2579億円となった。
-
先進のインテリジェント運転に賭ける!Li Auto幹部が発表:LシリーズSUVにはLIDARが標準装備される。
-
Huawei はメディア業界が新しいタイプの生産性を開発するのをどのように支援できるでしょうか?