MAYE框架重塑RL+VLM研究范式

周大发表于 2025-4-9 14:01:00

上海交通大学等团队提出MAYE框架，以重塑RL+VLM的研究范式。该框架通过简洁透明的训练架构、标准化评估方案及实证研究，解决当前研究中透明性不足的问题。实验表明，RL在多个主流VLM上的表现优于SFT，且具备更强泛化能力。MAYE为RL for VLM提供了透明、可复现的研究起点。
来源：https://mp.weixin.qq.com/s/SDUbYwWcwJMCZ2hrlnIqVA

页: [1]

靠浦ai课堂's Archiver

MAYE框架重塑RL+VLM研究范式