新加坡国立大学邵林团队突破性研究揭示机器人VLA任务规划最优范式

[复制链接]
周大 发表于 2025-7-31 13:29:08 | 显示全部楼层 |阅读模式
新加坡国立大学邵林团队发布VLA-OS研究,系统性对比分析了视觉-语言-动作(VLA)模型在任务规划中的不同范式与表征方式。研究构建了统一的模型架构、训练流程和包含约10,000条轨迹的多模态任务数据集,并通过上百次实验得出14项关键发现。结果显示,基于视觉的任务规划表征在性能、效率和策略跟随性方面优于语言表征,而分层式VLA(Hierarchical-VLA)在泛化能力和任务规划能力上表现最佳。研究还指出,在任务规划数据有限的情况下,模型参数控制在1B以内即可获得良好性能。该研究为下一代通用机器人模型的设计提供了理论依据和实践指南,并揭示了未来发展方向,包括更高效架构、解耦训练机制和大规模规划数据集的构建。
来源:https://mp.weixin.qq.com/s/fybwGyyU5ceXgllenI8lAA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 20:17 , Processed in 0.282953 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表