周大 发表于 2025-4-24 13:34:10

7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法

近日,马里兰大学、密歇根大学与微软联合提出ThinkLite-VL模型,通过蒙特卡洛树搜索(MCTS)筛选高难度样本,仅用11k高质量数据进行强化学习训练,显著提升了视觉语言模型的推理能力。相比基线模型Qwen2.5-VL-7B-Instruct,ThinkLite-VL-7B在八个主流任务上的平均性能提升7%,并在MathVista任务中超越GPT-4o等模型,达到75.1%的准确率。研究发现,中等+困难样本组合比单纯使用最难样本更有效,为高效训练提供了新思路。
来源:https://mp.weixin.qq.com/s/9qmNXjMmGrynzbPERRpFng
页: [1]
查看完整版本: 7B超越GPT!1/20数据,无需知识蒸馏,马里兰等推出全新视觉推理方法