全新模型RoboVLMs解锁VLA无限可能,真实机器人实验交出满分答卷

[复制链接]
周大 发表于 2025-1-2 14:32:52 | 显示全部楼层 |阅读模式
来自清华大学等机构的研究团队提出视觉语言动作模型(VLAs)的新成果——RoboVLMs。该模型不仅在三个模拟任务中取得高分,在真实机器人实验中也表现出色。研究围绕四个关键问题深入探讨VLA设计,发现连续动作空间、历史信息利用等对模型性能提升重要,且KosMos和Paligemma基座模型表现最佳。预训练阶段引入跨本体数据可显著提升模型鲁棒性。未来,VLA有望在更复杂任务中有新突破。
来源:https://mp.weixin.qq.com/s/z0v0mrl_WB0Ie-5yVHc3-g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 06:22 , Processed in 0.276250 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表