SHOUJIKE

DeepSeek は、初めて理論上の利益率が 545% であることを明らかにしたレポートで Open Source Week を締めくくりました。

DeepSeekは3月1日、知乎に公式アカウントを開設し、「DeepSeek-V3/R1推論システムの概要」と題する技術記事を独占公開し、モデル推論システムの最適化の詳細を初めて明らかにし、コストと利益率に関する重要な情報を公開しました。

DeepSeeKの論文では、「DeepSeek-V3/R1推論システムの最適化目標は、スループットの向上とレイテンシの低減である」と述べられています。この2つの目標を達成するために、DeepSeekは大規模なマルチノードエキスパート並列処理(EP)を採用していますが、これはシステムの複雑さを増大させます。この論文では主に、EPを用いてバッチサイズを拡大し、転送時間を隠蔽し、負荷分散を行う方法について議論しています。

この記事でDeepSeekのコストと利益率に関する重要な情報も明らかにされている点は注目に値します。「GPUのレンタル費用を1時間あたり2ドルと仮定すると、総コストは1日あたり87,072ドルとなります。…すべてのトークンの価格がDeepSeek R1に基づいて設定された場合、理論上の1日あたり総収益は562,027ドルとなり、コスト利益率は545%となります。」

「DeepSeekオープンソースウィーク」は2月24日から28日まで開催され、オープンソースを通じた最新の技術革新が紹介されたようです。FlashMLA、DeepEP、DeepGEMM、3FSという4つのオープンソースプロジェクトに加え、DualPipeやEPLBといったコードリポジトリも紹介されました。

業界関係者の中には、「DeepSeek Open Source Week」の重要性が、最近のOpenAIのローンチイベントを上回っていると考える者もいる。DeepSeekの「豊富で包括的な」オープンソースコンテンツは、DeepSeekが意図的に低いトレーニングコストを重視しているという欧米の主張を力強く反駁し、トレーニングパイプラインに大きな最適化の余地があることを証明している。