SHOUJIKE

Nvidia の次世代 Blackwell GPU に過熱の問題があり、納品が遅れていると報告されています。

11月18日(現地時間)、The Information on Sundayの報道によると、NVIDIAの新世代Blackwellプロセッサは、大容量サーバーラックにおいて深刻な過熱問題を抱えているという。この問題により設計調整やプロジェクトの遅延が発生し、Google、Meta、Microsoftなどの主要顧客はBlackwellサーバーを計画通りに導入できるかどうか懸念を抱いている。

関係筋によると、AIおよび高性能コンピューティング(HPC)向けに設計されたBlackwell GPUは、72基のプロセッサを搭載したサーバーで過熱問題が発生しており、ラックあたり最大120キロワットの電力を消費する可能性がある。この過熱問題により、NVIDIAはラック設計の度重なる変更を余儀なくされ、GPUの性能が制限され、ハードウェアが損傷する可能性がある。そのため、顧客はこれらの技術的問題により、データセンターへのプロセッサ導入が遅れるのではないかと懸念している。

この課題に対処するため、NVIDIAはサプライヤーにラック設計の調整を求め、パートナーと協力して冷却システムの最適化に取り組みました。このようなエンジニアリングの改善は大規模な技術発表においては標準的な手順ですが、製品の納期をさらに遅らせることになりました。

NVIDIAの広報担当者はロイター通信に対し、同社はクラウドサービスプロバイダーと緊密に連携しており、設計調整は通常の研究開発プロセスの一部であると述べた。NVIDIAは、この協業により、最終製品が性能と信頼性の期待を満たすとともに、技術的なボトルネックの解決を加速できることを期待している。

報道によると、改良版Blackwell GPUは今年10月末にようやく量産に入り、早ければ来年1月末にも出荷される見込みです。Google、Meta、Microsoftといったテクノロジー大手は、最強のAIモデルのトレーニングにNvidia GPUを活用しているため、今回の遅延は必然的に彼らの研究開発計画や製品発売に影響を与えるでしょう。

今年3月、NVIDIAはBlackwellチップを披露し、当時第2四半期に出荷すると発表していた。(清遠)