周大 发表于 2025-5-25 15:23:15

只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max

剑桥等机构提出全新“视觉规划”范式,该方法完全基于视觉表示进行推理与规划,避免了传统多模态模型因文本化导致的视觉信息损失。研究团队设计了基于强化学习的视觉规划框架(VPRL),在多个视觉导航任务中超越文本推理模型,特别是在复杂任务中表现更稳健。实验表明,视觉规划范式在精确匹配和进度率指标上显著优于语言驱动方法,展示了其在直观图像推理任务中的巨大潜力。
来源:https://mp.weixin.qq.com/s/KXx1t3jIlhLWu0rlVoQWNA
页: [1]
查看完整版本: 只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max