北大与港中文联合发布Fast-in-Slow VLA，实现机器人快执行慢思考统一协作

周大发表于 2025-7-12 14:24:58

北京大学与香港中文大学联合团队提出新型双系统视觉-语言-动作模型 FiS-VLA，通过将快速执行模块嵌入预训练视觉-语言模型，实现高频响应与复杂推理的统一。该模型在仿真与真机测试中表现出色，平均任务成功率达 69%，控制频率最高可达 117.7Hz，远超现有方案。基于 86 万条轨迹数据训练，FiS-VLA 在多模态输入与异步运行机制下展现出高精度操控能力和良好泛化性能，为机器人控制提供了新思路。
来源：https://mp.weixin.qq.com/s/xkPBpjb4zcmNYXHD8vbZTg

页: [1]

靠浦ai课堂's Archiver

北大与港中文联合发布Fast-in-Slow VLA，实现机器人快执行慢思考统一协作