NEOの認知コアとしての世界モデル 1Xは、NEOヒューマノイドがあらゆる自然言語のプロンプトをロボットの動作に翻訳できるという大規模なAI開発を明らかにしました。この能力は、ロボットデータセットに含まれていない新しいタスク、オブジェクト、環境に対しても実証しています。 - 1Xワールドモデルはインターネット規模の人間インタラクション動画を用いて訓練され、ロボットデータで微調整されて物理学とNEOの具現化に根ざした理解を組み立てています。 - 単純な音声やテキストプロンプトから、ワールドモデルが将来の行動の可視化を生成する - 組み込みの逆動力学モデルがこれらをNEOの精密な運動に変換します
さらに印象的なのは、NEOがトイレの便座を開けたり、シャツにアイロンをかけたり、髪をとかしたりといった全く新しい作業をロボットデータセットに一切の例がなかったことです。 これは、ビデオベースのワールドモデルに収められた幅広い人間の知識によって可能となっています。
汎用ロボティクスは人間主導のロボットデータ収集の速度に制限されています。この新しいアプローチにより、NEOは自律的にデータを収集し学習できるようになりました。 このスケーリングは、新しいロボットデータと、その核となるビデオ世界モデルの継続的な改善の両方から恩恵を受けています
206