IT之家の読者「仿达」さんからの情報提供に感謝します!

IT之家 6 月 1 日のニュースによると、NVIDIA は本日、320 億パラメータを備え、推論能力に基づく視覚・言語・行動(VLA)モデル「Alpamayo 2 Super」を正式に発表した。これにより、NVIDIA の Alpamayo シリーズのオープンソース人工知能モデル、シミュレーションフレームワーク、物理 AI データセットがさらに拡充され、企業による安全な L4 自動運転タクシーの研究開発を支援する。

IT之家が確認したところ、このモデルの発表に伴い、NVIDIA は複数の新ツール、モデル、エージェントスキルも発表し、実環境データ収集からクローズドループ訓練、車載展開までの全プロセスをつなげた。その中には NVIDIA AlpaGym、NVIDIA OmniDreams、そして新しい NVIDIA Omniverse NuRec モデルが含まれる。

公式説明によると、Alpamayo 2 Super は、企業が自動運転の中核インフラをゼロから構築する工程を不要にし、自動運転車の研究開発プロセスを大幅に加速できる。同モデルは人間のような知覚、推論、行動能力を備えると同時に、説明可能性も有しており、安全検証やコンプライアンス規制に関する要件を満たすことができる。

実道路での車載展開に適したモデル訓練ニーズに対応するため、AlpaGym はクローズドループ強化学習プラットフォームを提供する。一方、NVIDIA OmniDreams はリアルなシーンを生成できるワールドモデルとして、各種のまれなロングテール運転シーンを大規模にシミュレーションできる。

開発者の効率向上に向け、NVIDIA は同社のすべての自動運転開発ツールに物理 AI エージェント能力を組み合わせた。例えば、NVIDIA Omniverse NuRec を基盤に構築されたニューラル再構成能力により、実際の車両群の走行シーンに基づくシミュレーションを行い、合成訓練データを一括生成できる。

NVIDIA の創業者兼 CEO であるジェンスン・フアン氏は次のように述べた。「Alpamayo は、自動車が単に走行するだけでなく、自律的な推論能力を持ち始めたことを示しています。オープンソースモデル、シミュレーションツール、実環境データ、エージェント能力を同時に提供できるのは NVIDIA だけです。これにより、世界の自動運転タクシーエコシステムがレベル 4 自動運転能力を構築し、車両が極端なシーンを認識し、意思決定ロジックを説明し、安全への信頼を確立し、数百万台の自動車へ円滑に大規模展開できるよう支援します。」

Alpamayo 2 Super により、NVIDIA Alpamayo シリーズのモデルパラメータ規模は 100 億から 320 億へ拡大した。同モデルはもはや軌道生成にとどまらず、運転システム全体の中で推論、計画、実行を完了できる。論理推論、自動アノテーション、シーン理解、モデル評価、大規模モデルの知識を軽量モデルへ蒸留することなど、多様なタスクをサポートし、スケーラブルに実用化可能なレベル 4 自動運転の研究開発と展開の基盤を築く。

主な特徴:

1. パラメータ規模を 3 倍に拡大:同モデルは NVIDIA Cosmos を基盤に構築されており、前世代の 100 億パラメータ版から 320 億パラメータへアップグレードされた。ロングテールシーンにおける論理推論、三次元空間認識、軌道予測能力が全面的に強化されている。

2. 車両全周囲の環境認識:従来の前方カメラによる認識から、360 度の全景環境認識へアップグレードし、車両の前方、側方、後方の視野をカバーする。車線変更、合流、交差点通行などの操作に完全な環境情報を提供し、走行安全性を高める。

3. メタアクション出力:メタアクション出力能力を新たに追加し、譲り合い、車線変更、停車などの高レベル運転行動の予測をサポートする。走行軌道や因果チェーンの追跡情報に加え、モデルは高次の運転判断を出力でき、後続の計画モジュールに根拠を提供する。

4. 推論型自動アノテーションと二次元物体位置特定:二次元物体位置特定を組み合わせた推論型自動アノテーション機能を搭載する。この 320 億パラメータの基盤大規模モデルは、高品質な推論アノテーションデータを生成でき、アノテーション期間を数カ月から数日に短縮し、自動運転データチェーンのコストと効率を大幅に最適化する。

5. 因果チェーンと軌道出力の最適化:従来の模倣学習型自動運転システムでは対応が難しい、まれで複雑なロングテールシーンに対し、モデルの因果チェーン追跡能力と軌道生成品質はいずれも大幅に向上している。

以上のアップグレードにより、Alpamayo 2 Super は NVIDIA が現在提供する中で最も高機能なオープンソース運転基盤大規模モデルとなった。同モデルは教師モデルとして位置付けられており、知識蒸留によって軽量モデルへ圧縮し、NVIDIA DRIVE Hyperion 傘下の車載自動運転メイン制御チップ DRIVE AGX Thor 上に展開して動作させることができる。

NVIDIA Alpamayo 1 Nano や NVIDIA Alpamayo 1.5 Nano のような 100 億パラメータ級モデルから、現在の 320 億パラメータの Alpamayo 2 Super まで、教師モデル全体が反復的にアップグレードされた。このシリーズのモデルを基に構築された自動運転システムは、高水準の推論能力と認識能力を直接継承でき、各自動車メーカーはゼロからの開発を繰り返す必要がない。

Alpamayoシリーズは最近、台北国際コンピュータ見本市(COMPUTEX)のBest Choice Awardを受賞し、車載技術・スマートコックピット部門の賞を獲得した。発表以来、同シリーズのモデルダウンロード数はすでに40万回に迫っている。そのオープンソースプラットフォームには後処理トレーニング用スクリプトも付属しており、研究者や開発者が自前のデータセット、走行シーン、運転戦略と組み合わせてモデルを二次適応させやすくしている。

Alpamayo 2 Superの推論コードは今年夏にGitHubで公開される予定で、モデルの重みも同時にHugging Faceプラットフォームで公開される。

NVIDIAは同時に、オープンソースで高い計算スループットを備えた閉ループ強化学習フレームワーク「NVIDIA AlpaGym」も発表した。開ループ学習は過去に記録されたデータのみに基づいてモデルを評価し、1回の動作を出力する。一方、AlpaGymはNVIDIA AlpaSim内で、モデルに「意思決定 - 知覚」のプロセスを継続的に循環させることができ、車両のブレーキ、ステアリング、ナビゲーション操作の一つひとつがリアルタイムでシミュレーション環境を変化させる。

これにより、同プラットフォームは静的データセットでは発見できない累積誤差や極端なシーンでの不具合を露出させ、モデルが実戦的なシミュレーションの中で継続的に学習できるようにする。

AlpaGymはAlpaSim microserviceアーキテクチャとNVIDIA Omniverse NuRecを基盤に構築されており、閉ループ強化学習を効率的かつ大規模に実施し、自動運転性能の上限を継続的に突破できる。物理AI自動運転データセットと組み合わせることで、Alpamayoシリーズのモデルは開ループ事前学習から閉ループの精緻なチューニングまで、完全な学習パイプラインを実現できる。

NVIDIAはさらに、因果チェーンの自動アノテーションプロセスをGitHubでオープンソース化した。このツールは、元の走行動画に基づき、意思決定の根拠と因果関係を備えたアノテーションデータを完全自動で生成でき、人手を必要とせず、大規模な具身推論モデルの学習に中核となる因果学習データを提供する。

推論型自動運転技術の研究開発を支援するため、NVIDIAはNVIDIA Agent Toolkitを基盤に、複数の新しい物理AIエージェント機能を発表した。開発者およびインテリジェントコーディングプログラムが、シミュレーション、データ生成、閉ループ学習など全工程の作業を行うのを支援し、自動運転システムの大規模な研究開発と検証を支える。これには、NVIDIA Omniverse NuRecコンポーネントを活用して構築されたニューラル再構成機能、リアルな運転シーンを生成するOmniDreams機能、閉ループ強化学習向けのAlpaGym機能が含まれる。

NVIDIAによると、BYD、Geely、Zeekr、Xiaomi、小馬智行などを含む中国の主要自動車メーカーおよび自動運転企業は、すでにNVIDIAHyperionプラットフォームを採用しているか、同プラットフォームを基盤にスマートドライビングを開発している。

広告に関する声明:本文に含まれる外部リンク(ハイパーリンク、QRコード、合言葉などの形式を含むがこれらに限らない)は、より多くの情報を伝え、選別時間を節約するためのものであり、結果は参考情報にすぎない。IT之家のすべての記事には本声明が含まれる。

Extracted and lightly reformatted for readability. · AI translated