周大 发表于 2025-4-9 14:01:00

MAYE框架重塑RL+VLM研究范式

上海交通大学等团队提出MAYE框架,以重塑RL+VLM的研究范式。该框架通过简洁透明的训练架构、标准化评估方案及实证研究,解决当前研究中透明性不足的问题。实验表明,RL在多个主流VLM上的表现优于SFT,且具备更强泛化能力。MAYE为RL for VLM提供了透明、可复现的研究起点。
来源:https://mp.weixin.qq.com/s/SDUbYwWcwJMCZ2hrlnIqVA
页: [1]
查看完整版本: MAYE框架重塑RL+VLM研究范式