北大与港中文联合发布Fast-in-Slow VLA,实现机器人快执行慢思考统一协作

[复制链接]
周大 发表于 2025-7-12 14:24:58 | 显示全部楼层 |阅读模式
北京大学与香港中文大学联合团队提出新型双系统视觉-语言-动作模型 FiS-VLA,通过将快速执行模块嵌入预训练视觉-语言模型,实现高频响应与复杂推理的统一。该模型在仿真与真机测试中表现出色,平均任务成功率达 69%,控制频率最高可达 117.7Hz,远超现有方案。基于 86 万条轨迹数据训练,FiS-VLA 在多模态输入与异步运行机制下展现出高精度操控能力和良好泛化性能,为机器人控制提供了新思路。
来源:https://mp.weixin.qq.com/s/xkPBpjb4zcmNYXHD8vbZTg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 21:36 , Processed in 0.277879 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表