|
DeepSeekは3月1日、知乎に公式アカウントを開設し、「DeepSeek-V3/R1推論システムの概要」と題する技術記事を独占公開し、モデル推論システムの最適化の詳細を初めて明らかにし、コストと利益率に関する重要な情報を公開しました。 DeepSeeKの論文では、「DeepSeek-V3/R1推論システムの最適化目標は、スループットの向上とレイテンシの低減である」と述べられています。この2つの目標を達成するために、DeepSeekは大規模なマルチノードエキスパート並列処理(EP)を採用していますが、これはシステムの複雑さを増大させます。この論文では主に、EPを用いてバッチサイズを拡大し、転送時間を隠蔽し、負荷分散を行う方法について議論しています。 この記事でDeepSeekのコストと利益率に関する重要な情報も明らかにされている点は注目に値します。「GPUのレンタル費用を1時間あたり2ドルと仮定すると、総コストは1日あたり87,072ドルとなります。…すべてのトークンの価格がDeepSeek R1に基づいて設定された場合、理論上の1日あたり総収益は562,027ドルとなり、コスト利益率は545%となります。」 「DeepSeekオープンソースウィーク」は2月24日から28日まで開催され、オープンソースを通じた最新の技術革新が紹介されたようです。FlashMLA、DeepEP、DeepGEMM、3FSという4つのオープンソースプロジェクトに加え、DualPipeやEPLBといったコードリポジトリも紹介されました。 業界関係者の中には、「DeepSeek Open Source Week」の重要性が、最近のOpenAIのローンチイベントを上回っていると考える者もいる。DeepSeekの「豊富で包括的な」オープンソースコンテンツは、DeepSeekが意図的に低いトレーニングコストを重視しているという欧米の主張を力強く反駁し、トレーニングパイプラインに大きな最適化の余地があることを証明している。 |
DeepSeek は、初めて理論上の利益率が 545% であることを明らかにしたレポートで Open Source Week を締めくくりました。
関連するおすすめ記事
-
Appleは3つの大きなハイライトを特色とするiPad 11を今春発売する予定だ。
-
Ascendは50を超える主流の大規模モデルをサポートしています。Huawei:私たちはオープンソースの原則に引き続き投資し、遵守していきます。
-
HarmonyOS Intelligent Mobilityの2025年製品計画が明らかに:数量は倍増し、20万台から100万台をカバー。
-
春節期間中も通常通り営業いたします! 雷軍:Xiaomiは、故障や事故など、原因を問わず、無料のロードサービスをご提供いたします。
-
Qi An Xin:DeepSeekが米国のIPアドレスからブルートフォース攻撃を受ける
-
Apple は、Apple Intelligence を段階的にリリースする理由として、プライバシーを最優先し、インテリジェント サービスを段階的にアップグレードすると説明しています。