|
10月20日のメディア報道によると、NVIDIAの最新の研究はAIの未来に革命を起こす可能性があり、同社の研究チームはNormalized Transformer (nGPT)と呼ばれる新しいニューラルネットワークアーキテクチャを提案している。 このアーキテクチャは、超球面上で表現学習を実行し、モデルの精度を維持しながら、大規模言語モデル (LLM) のトレーニング速度を最大 20 倍まで大幅に向上させることができます。 nGPT アーキテクチャの中核は、埋め込み、多層パーセプトロン (MLP)、注意行列、隠れ状態を含むすべてのベクトルを単位ノルムに正規化することにあります。 この正規化プロセスにより、入力トークンは超球面上を移動し、モデルの各レイヤーが変位を通じて最終的な出力予測に貢献します。 実験結果によると、nGPT ではトレーニング中に必要なステップ数が標準の Transformer モデルより 4 ~ 20 倍少なく、具体的な高速化はシーケンスの長さによって異なります。 たとえば、トレーニング速度は、1k コンテキストでは 4 倍、4k コンテキストでは 10 倍、8k コンテキストでは 20 倍向上します。 研究者らは、nGPT の最適化パスは超球面上の点から始まり、MLP と注意モジュールによって定義される変位を通じて最終出力予測に貢献すると指摘しています。 この方法は、トレーニング速度を向上させるだけでなく、モデルの安定性も向上させます。 |
AI の未来を書き換える可能性!NVIDIA の新しい nGPT はトレーニング速度を 20 倍向上させます。
関連するおすすめ記事
-
ジェンセン・ホアンの中国ツアーが成功裏に終了:協力を深め、チームに新年の挨拶を送る。
-
BYDは「Intelligent Driving for All」戦略を発表し、全モデルに「God's Eye」先進インテリジェント運転システムを搭載しました。
-
ネタオート創業者ファン・ユンジョウ氏の保有する1986万元相当の株式が凍結された。
-
XPeng Motorsの自動運転責任者がテスラのFSDを体験:中国と米国の道路状況は大きく異なり、XPengは中国の複雑な道路状況により適している。
-
シリーズ第1弾!Huawei nova 12 UltraがHarmonyOS NEXTのパブリックベータ版をリリース。
-
NASAはエウロパ・クリッパー宇宙船の打ち上げに成功し、2030年に木星の軌道に入ると予想されている。