刷了NVIDIA在CoRL 2025的发布,感觉这次更新挺实在的。不是PPT秀,是真的在解决问题。
Newton物理引擎:sim-to-real终于有救了?
Newton物理引擎开源了,这是重头戏。NVIDIA拉着Google DeepMind和迪士尼研究一起搞,通过Linux Foundation开源。
说白了就是要解决sim-to-real这个老大难问题。现在的物理引擎仿真精度烂得一塌糊涂,虚拟环境训练出来的机器人到了现实世界就跟傻子一样。
Newton基于NVIDIA Warp和OpenUSD,说是能处理复杂材质交互:雪地行走、抓易碎品、各种地形平衡。
Demo里机器人抓取成功率从PyBullet的60%提升到Newton的85%。但说实话,我试过早期版本,机器人在光滑地面上走路还是会打滑,物理摩擦力计算还是有问题。现实世界比仿真复杂太多了。
GR00T N1.6:机器人大脑升级了
新版Isaac GR00T N1.6最大升级是集成了NVIDIA Cosmos Reason。这是专门给物理AI用的视觉语言模型,不是那种通用聊天机器人。
NVIDIA终于承认早期GR00T有问题了。我们公司测试过,"把红杯子拿到厨房"这种指令,机器人能识别杯子,但走路经常撞桌腿,避障算法简直一坨屎。成功率只有30%,还不如人工遥控。
N1.6说是解决了这些问题:
- 自然语言理解升级:把"小心拿过来"转成具体抓取力度和路径
- 常识推理:知道玻璃杯比塑料杯脆弱,自动调整抓取方式
- 多任务泛化:学会叠衣服后,能推广到叠毛巾、床单
训练效率确实提升了。以前训练个抓杯子动作要烧4张A100三天,电费就要2000块。现在用RTX 4090两天就能搞定,成本降了80%。
最重要的是,N1.6现在能让机器人边走边操作了。以前机器人要么站着不动抓东西,要么走路时手不能动。现在能边走边推重门,虽然看着还是有点僵硬,但至少不会摔倒了。
Cosmos世界基础模型:用AI生成训练数据
Cosmos WFMs的更新也很厉害:
Cosmos Predict 2.5(即将发布):
- 将三个Cosmos WFMs整合成一个强大模型
- 支持生成长达30秒的视频
- 支持多视角摄像头输出,提供更丰富的世界仿真
Cosmos Transfer 2.5(即将发布):
- 比之前的模型快3.5倍且体积更小
- 能从3D仿真场景生成逼真的合成数据
新的抓取学习工作流
教机器人抓取物体是机器人学中最难的挑战之一。NVIDIA在Isaac Lab 2.3中推出了新的灵巧抓取工作流。
这个系统很聪明:
- 在虚拟世界中训练多指手和机械臂
- 使用自动课程:从简单任务开始,逐渐增加复杂度
- 动态调整重力、摩擦力、物体重量等参数
- 让机器人学会在不可预测环境中的技能
**Boston Dynamics的Atlas机器人**已经用这个工作流显著提升了操作能力。
技术栈的完整性
Rev Lebaredian(NVIDIA Omniverse和仿真技术副总裁)说得很好:
"有了这些最新更新,开发者现在拥有了将机器人从研究带入日常生活的三台计算机——Isaac GR00T作为机器人的大脑,Newton模拟它们的身体,NVIDIA Omniverse作为它们的训练场。"
对我们开发者有啥影响
这些技术更新看起来有用:
- 仿真精度:Newton引擎可能真的能改善sim-to-real,但我还是持怀疑态度
- 自然语言交互:GR00T升级后机器人能更好理解指令,如果真的有效的话
- 训练数据:Cosmos能生成训练场景,省得自己收集数据
- 开源生态:技术开源降低门槛,小团队也能玩得起
谁在用这些技术
据说Boston Dynamics已经在用,其他机器人公司在测试。不过具体效果还得看实际项目验证,Demo永远比现实美好。
从技术演示看,确实有一定实用价值。但演示归演示,真正部署是另一回事。
硬件配套也很贵
NVIDIA还发了配套硬件:
- GB200 NVL72:机架级系统,36个Grace CPU + 72个Blackwell GPU
- RTX PRO服务器:专门给机器人开发用的
- Jetson Thor:搭载Blackwell GPU,支持实时推理
价格贵得离谱。GB200 NVL72一套要500万人民币起步,RTX PRO服务器也要80万。我们这种小公司只能用云服务,一小时200美元,烧不起。
对国内开发者的机会
开源技术确实给我们机会:
- 门槛降低:不用从零开发物理引擎和AI模型了
- 技术栈统一:用国际主流技术,便于交流
- 商业化:基于开源技术做产品和服务
但关键还是得有真本事,光用开源工具是不够的。
机器人真的要来了吗?
NVIDIA这次发布不是纯概念,算是实用的工程方案。从物理仿真到AI大脑到数据生成,技术栈相对完整。
机器人开发门槛确实在降低。以前需要PhD团队搞的技术,现在几个熟练工程师可能就能上手。
但机器人时代真的要来了吗?我觉得还早着呢。技术确实进步了,但成本高得吓人,一台像样的humanoid机器人要100万起步。可靠性也是问题,我见过机器人因为光线变化就认不出物体,或者因为地板材质不同就摔倒。安全性更别提了,机器人力度控制不好,一不小心就能把人胳膊掰断。
不过这些工具确实值得关注,至少NVIDIA在认真解决问题,不是纯粹炒概念。