7B小模型通过贪吃蛇游戏训练,数学推理能力超越GPT-4o
近日,来自莱斯大学、约翰霍普金斯大学及NVIDIA的研究团队提出了一种革命性的AI训练范式——视觉游戏学习(ViGaL)。通过让7B参数多模态模型玩贪吃蛇和3D旋转等街机游戏,模型不仅掌握了游戏技巧,还发展出强大的跨领域推理能力,在数学和几何任务上超越了GPT-4o等顶级模型。研究表明,游戏训练能够激发AI的通用认知能力,如空间理解和顺序规划,并将其迁移到多模态推理任务中。实验结果表明,结合多种游戏训练可显著提升性能,同时保持模型的通用视觉能力。这一发现为AI训练提供了新思路,展示了合成任务在提升泛化能力方面的巨大潜力。来源:https://mp.weixin.qq.com/s/_gXH6dImQ2o6YU8PHjFJdQ
页:
[1]