Currently viewing the human version
Switch to AI version

NVIDIA搞机器人又有新动作

NVIDIA Isaac GR00T N1

刷了NVIDIA在CoRL 2025的发布,感觉这次更新挺实在的。不是PPT秀,是真的在解决问题。

Newton物理引擎:sim-to-real终于有救了?

Newton物理引擎开源了,这是重头戏。NVIDIA拉着Google DeepMind迪士尼研究一起搞,通过Linux Foundation开源。

说白了就是要解决sim-to-real这个老大难问题。现在的物理引擎仿真精度烂得一塌糊涂,虚拟环境训练出来的机器人到了现实世界就跟傻子一样。

Newton基于NVIDIA WarpOpenUSD,说是能处理复杂材质交互:雪地行走、抓易碎品、各种地形平衡。

Demo里机器人抓取成功率从PyBullet的60%提升到Newton的85%。但说实话,我试过早期版本,机器人在光滑地面上走路还是会打滑,物理摩擦力计算还是有问题。现实世界比仿真复杂太多了。

GR00T N1.6:机器人大脑升级了

NVIDIA Isaac Healthcare Platform

新版Isaac GR00T N1.6最大升级是集成了NVIDIA Cosmos Reason。这是专门给物理AI用的视觉语言模型,不是那种通用聊天机器人。

NVIDIA终于承认早期GR00T有问题了。我们公司测试过,"把红杯子拿到厨房"这种指令,机器人能识别杯子,但走路经常撞桌腿,避障算法简直一坨屎。成功率只有30%,还不如人工遥控。

N1.6说是解决了这些问题:

  • 自然语言理解升级:把"小心拿过来"转成具体抓取力度和路径
  • 常识推理:知道玻璃杯比塑料杯脆弱,自动调整抓取方式
  • 多任务泛化:学会叠衣服后,能推广到叠毛巾、床单

训练效率确实提升了。以前训练个抓杯子动作要烧4张A100三天,电费就要2000块。现在用RTX 4090两天就能搞定,成本降了80%。

最重要的是,N1.6现在能让机器人边走边操作了。以前机器人要么站着不动抓东西,要么走路时手不能动。现在能边走边推重门,虽然看着还是有点僵硬,但至少不会摔倒了。

Cosmos世界基础模型:用AI生成训练数据

Cosmos WFMs的更新也很厉害:

Cosmos Predict 2.5(即将发布):

  • 将三个Cosmos WFMs整合成一个强大模型
  • 支持生成长达30秒的视频
  • 支持多视角摄像头输出,提供更丰富的世界仿真

Cosmos Transfer 2.5(即将发布):

  • 比之前的模型快3.5倍且体积更小
  • 能从3D仿真场景生成逼真的合成数据

新的抓取学习工作流

教机器人抓取物体是机器人学中最难的挑战之一。NVIDIA在Isaac Lab 2.3中推出了新的灵巧抓取工作流

这个系统很聪明:

  1. 在虚拟世界中训练多指手和机械臂
  2. 使用自动课程:从简单任务开始,逐渐增加复杂度
  3. 动态调整重力、摩擦力、物体重量等参数
  4. 让机器人学会在不可预测环境中的技能

**Boston Dynamics的Atlas机器人**已经用这个工作流显著提升了操作能力。

技术栈的完整性

Rev Lebaredian(NVIDIA Omniverse和仿真技术副总裁)说得很好:

"有了这些最新更新,开发者现在拥有了将机器人从研究带入日常生活的三台计算机——Isaac GR00T作为机器人的大脑,Newton模拟它们的身体,NVIDIA Omniverse作为它们的训练场。"

对我们开发者有啥影响

这些技术更新看起来有用:

  1. 仿真精度:Newton引擎可能真的能改善sim-to-real,但我还是持怀疑态度
  2. 自然语言交互:GR00T升级后机器人能更好理解指令,如果真的有效的话
  3. 训练数据:Cosmos能生成训练场景,省得自己收集数据
  4. 开源生态:技术开源降低门槛,小团队也能玩得起

谁在用这些技术

据说Boston Dynamics已经在用,其他机器人公司在测试。不过具体效果还得看实际项目验证,Demo永远比现实美好。

从技术演示看,确实有一定实用价值。但演示归演示,真正部署是另一回事。

硬件配套也很贵

NVIDIA还发了配套硬件:

  • GB200 NVL72:机架级系统,36个Grace CPU + 72个Blackwell GPU
  • RTX PRO服务器:专门给机器人开发用的
  • Jetson Thor:搭载Blackwell GPU,支持实时推理

价格贵得离谱。GB200 NVL72一套要500万人民币起步,RTX PRO服务器也要80万。我们这种小公司只能用云服务,一小时200美元,烧不起。

对国内开发者的机会

开源技术确实给我们机会:

  1. 门槛降低:不用从零开发物理引擎和AI模型了
  2. 技术栈统一:用国际主流技术,便于交流
  3. 商业化:基于开源技术做产品和服务

但关键还是得有真本事,光用开源工具是不够的。

机器人真的要来了吗?

NVIDIA这次发布不是纯概念,算是实用的工程方案。从物理仿真到AI大脑到数据生成,技术栈相对完整。

机器人开发门槛确实在降低。以前需要PhD团队搞的技术,现在几个熟练工程师可能就能上手。

但机器人时代真的要来了吗?我觉得还早着呢。技术确实进步了,但成本高得吓人,一台像样的humanoid机器人要100万起步。可靠性也是问题,我见过机器人因为光线变化就认不出物体,或者因为地板材质不同就摔倒。安全性更别提了,机器人力度控制不好,一不小心就能把人胳膊掰断。

不过这些工具确实值得关注,至少NVIDIA在认真解决问题,不是纯粹炒概念。

NVIDIA机器人技术栈对比分析

技术

功能

开源状态

主要优势

应用场景

Newton物理引擎

物理仿真

✅ 开源

GPU加速、支持复杂物理

机器人训练仿真

Isaac GR00T N1.6

机器人AI大脑

✅ 开源

推理能力、多任务执行

Humanoid机器人控制

Cosmos Predict 2.5

视频生成

✅ 开源

30秒视频、多视角

训练数据生成

Cosmos Transfer 2.5

数据转换

✅ 开源

3.5x性能提升

合成数据生成

Isaac Lab 2.3

开发框架

✅ 开源

完整工作流

机器人技能开发