SHOUJIKE

ロボット技術の未来を読み解く: NVIDIA がインテリジェンスと産業の統合を推進

ChatGPTは、生成型AIの大きな爆発的な発展の始まりを示しています。CES 2025で、NVIDIAの創業者兼CEOであるジェンスン・フアン氏はスピーチの中で、ヒューマノイドロボットの時代が到来すると述べました。

NVIDIA は、世界をリードするコンピューティング パワー プロバイダーとして、ロボット工学分野に多大な投資を行い、「汎用ロボットの ChatGPT モーメント」に備えています。

現在、生成型AIは急速に発展していますが、ヒューマノイドロボット、工場、その他の産業システムにおける具体的な実現はまだブレークスルーに達していません。これは、交通・モビリティ、製造、物流、ロボット工学といった産業の発展を阻害しています。

ロボット技術の需要の源泉となる3つの原動力

関連データによると、ヒューマノイドロボット市場は今後20年間で380億ドル規模に達すると予想されています。特に産業・製造分野におけるこの膨大な需要に応えるため、NVIDIAは次世代ヒューマノイドロボットの開発を加速させるため、一連のロボット基盤モデル、データパイプライン、シミュレーションフレームワークをリリースしました。

2025年の技術革新の波の中で、ロボットは急速に社会と産業のニーズに応える重要なツールになりつつあります。NVIDIAのロボティクスおよびエッジコンピューティング担当バイスプレジデントであるディープ・タラ氏は先日、ロボティクスの推進力、技術革新、そして将来の応用分野に関する洞察を共有し、この分野の計り知れない可能性と課題を明らかにしました。

Deepu Talla 氏は、ロボット技術の急速な発展の背後には 3 つの中核的な原動力があると考えています。

1. 危険な作業: 鉱山などの危険度の高い環境では、ロボットが人間に代わってリスクを負い、作業員の安全を確保することができます。

2. 労働力不足:社会の職業構造の変化により労働力が徐々に減少しており、ロボットがこの不足を補うことができます。

3. 高齢者介護のニーズ:世界的に平均寿命が延びているため、介護ロボットやコンパニオンロボットの需要が高まっており、ロボットは効果的な「社会的な仲間」になることができます。

これら 3 つの要求が相まって、ロボット技術は現代社会に欠かせないものとなりました。

重要なブレークスルー:ロボット技術の発展における転換点

ディープ・タラ氏は、ロボット技術は過去 12 か月間に 2 つの重要な進歩を遂げたことを強調しました。

1. 生成 AI (GenAI) の導入: 2 年前、大規模言語モデル (LLM) がデジタル アプリケーションに革命をもたらしました。現在、これらのテクノロジはロボット工学の分野に適用され、デジタル アプリケーションと物理アプリケーションをうまく接続しています。

2. 成熟したシミュレーション環境: NVIDIA Omniverse に代表されるシミュレーション技術は高精度の仮想環境を提供し、ロボットのテストを現実世界から仮想テストに移行させ、コストと時間の消費を大幅に削減します。

これらの技術革新により、ロボット開発のプロセスが大幅に加速され、より多くの企業がロボットの研究開発に投資する機会が生まれました。

3 台のコンピューターがロボットの課題を解決します。

「ロボット工学の分野における課題を真に解決するには、3台のコンピュータが必要だ」とディープ・タラ氏は語った。

最初のコンピュータはトレーニングに使用されます。これはAIモデルのトレーニングに使用されるシステムです。トレーニングは通常、クラウド、データセンター、またはNVIDIA DGXのような強力なシステムで行われます。これはロボットの「脳」を構築する上で重要なステップです。

2台目のコンピュータはシミュレーションに使用されます。トレーニングが完了したら、テストが必要です。従来の標準的な方法は物理的なテストですが、これは時間がかかり、費用がかかり、リスクも伴います。より良い解決策は、「シミュレーションレイヤー」または「デジタルツイン」を導入し、仮想環境でテストを実行することです。シミュレーションにより、現実世界の時間やコストの制限を受けることなく、数千ものシナリオテストを大規模かつ迅速かつ安全に実行できます。

3台目のコンピューターは展開に使用されます。ロボット内部に搭載され、ロボット本体を操作する「頭脳」として機能します。NVIDIAの場合、これはJetsonやAGXなどのシステムを使用して実現できます。

トレーニング、シミュレーション、そして展開という循環的なプロセスを導入することで、ロボット技術の進歩に必要な時間は50年から5年に短縮され、ロボット開発サイクルが大幅に短縮されました。ディープ・タラ氏は、ロボットを実世界に展開する前にシミュレーションシステムを用いて数千ものテストを実施することで、開発プロセス全体を効果的に加速できると説明しました。設計が実世界でのアプリケーションでうまく機能しない場合は、シミュレーション環境に戻してモデルを最適化してから再度テストすることができます。

この開発アプローチは、ロボット工学が自動運転よりも難しい理由も説明しています。自動運転は主に障害物回避と運転安全性の確保に重点を置いており、物理的な物体との直接的な相互作用を必要としません。一方、ロボット工学は物体との接触、衝突、そして複雑な物理的相互作用を伴い、これらはすべてテストと最適化が非常に困難です。

シミュレーションは新しい概念ではありません。チップ業界では、チップ設計のミスが数ヶ月のプロジェクト遅延や数百万ドル、場合によっては数十億ドルの損失につながる可能性があるため、シミュレーションは長年にわたり量産段階に組み込まれてきました。したがって、この観点から、ロボットのシミュレーションも実現可能です。

しかし、ロボット工学分野におけるシミュレーションの主な課題は、「シミュレーションと現実のギャップ」、つまりシミュレーション結果と実際の性能の乖離にあります。これまで、シミュレーション技術の精度には限界があったため、広く活用されていませんでした。しかし、Omniverseなどの技術の登場により、このギャップは大幅に縮小しました。このギャップが完全に解消されたわけではありませんが、技術の進歩により、シミュレーションはロボット開発において実現可能かつ効果的なツールとなっています。

NVIDIAはロボット製造プロセスに直接関与するのではなく、ロボット製造およびロボットソリューション開発に携わる専門家と連携することを選択していると理解されています。現在、NVIDIAは、トレーニング、シミュレーション、デプロイメントコンピューティングシステム、および関連するソフトウェアツールとワークフローを含む包括的なプラットフォームを構築しています。その目的は、ロボット工学の専門家、研究者、機械エンジニア、そしてテスターがロボットソリューションをより容易に開発できるように支援し、プロセスの簡素化と効率性の向上を通じてロボット技術の研究開発を加速させることです。

ロボティクスにおけるもう一つの重要な課題は、データの取得と生成です。Deepu氏は、既存の車両を利用して膨大なデータを生成する自動運転車とは異なり、現状のロボットの数は訓練のニーズを満たすには到底足りないと指摘しています。この問題に対処するため、NVIDIAは以下のソリューションを採用しました。

1. 合成データ生成: NVIDIA Cosmos などのツールを使用してリアルな仮想環境を作成し、多様なロボット相互作用データを生成します。

2. 実際のデータと合成データの組み合わせ: 少量の実際のデータと大量の合成データを統合して、トレーニングとテストのニーズを満たす効率的なデータ ワークフローを形成します。

3. シミュレーションと現実の統合の最適化:「シミュレーションと現実のギャップ」を克服し、高精度のシミュレーションを通じて現実世界のアプリケーションの精度を向上させます。

このデータ生成および統合ソリューションは、データ不足の問題を解決するだけでなく、ロボット技術の開発を大幅に加速します。

共有セッションでは、Galaxy Generalの創業者兼CTOである王賀氏が、NVIDIAとの協業における進捗状況を共有しました。王氏は、NVIDIA Isaacシリーズ、そして新たにOmniverseを活用し、シミュレータを用いて大量のロボット操作データを合成し、ロボットモデルに変換することを積極的に検討していると述べました。同社は、様々な3Dソリッドアセット、環境、そして様々なマテリアルやテクスチャを統合することで、ロボット操作シナリオをシミュレートし、ロボットが物体をどのように操作するかを探求しています。

Galaxy Generalは、自社の大型ヒューマノイドモデルを活用し、小売、ホスピタリティ、高齢者介護、工業製造など、数多くの業界への参入に成功しています。北京ベンツ工場では、Galaxy Generalのヒューマノイドロボットがサンルーフガラスの手作業による積み込みと搬送で重要な役割を果たしているのを見ることができます。この工程では、サンルーフガラスは上げ下げの際に位置がずれやすい傾向があります。以前は、搬送を停止して修正するために手動介入が必要でした。現在では、シミュレーションから学んだ視覚的な閉ループ処理と操作スキルに基づき、適切なトレーニングを受けたヒューマノイドロボットは、エラーを迅速に特定し、的確な修正を行うことができます。こちらのビデオをご覧ください。このヒューマノイドロボットは、ハンドリングシナリオで非常に優れたパフォーマンスを発揮し、3×3×327個の機器ボックスが密集して効率的に移動しています。