周大 发表于 2025-5-21 14:13:58

纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究

剑桥等机构联合推出基于强化学习的纯图像推理框架VPRL,实验表明其在多项视觉导航任务中准确率高达80%,性能超越文本推理至少40%。VPRL通过策略初始化与强化学习优化,有效提升复杂任务中的规划效率与稳定性,相比文本模型更具优势。该研究首次验证纯视觉推理可行性,为多模态推理开辟新方向,相关代码已开源。
来源:https://mp.weixin.qq.com/s/FNeGEV7Vccfga53GxC9MMg
页: [1]
查看完整版本: 纯靠“脑补”图像,大模型推理准确率狂飙80%丨剑桥谷歌新研究