周大 发表于 2025-7-10 14:49:07

香港中大联合团队推出FiS-VLA双系统机器人模型,实现推理操控双提升及强泛化能力

由香港中文大学、北京大学等联合提出的FiS-VLA是一种创新的视觉-语言-动作统一模型,首次在单一架构中实现快慢双系统的协同融合。该模型在AgileX和AlphaBot双臂机器人平台上的任务成功率分别达到68%和74%,在RLBench仿真任务中平均成功率为69%,显著优于CogACT和Pi0等现有方法。FiS-VLA采用异构输入与异步频率设计,并结合协同训练策略,实现高达117.7Hz的控制频率,同时在多种干扰条件下保持50%以上的泛化成功率,展现出优秀的鲁棒性与实用性。
来源:https://mp.weixin.qq.com/s/9sy-lcGjcq-pFoiVPfKT2A
页: [1]
查看完整版本: 香港中大联合团队推出FiS-VLA双系统机器人模型,实现推理操控双提升及强泛化能力