7B智能体仅凭9个任务训练即超越R1！上交大打造AI-for-AI新范式

周大发表于 2025-6-21 13:53:26

上海交通大学与上海人工智能实验室联合团队推出ML-Agent，一种基于“经验学习”范式的AI4AI智能体，显著减少人类干预并加速AI开发。ML-Agent由7B参数的Qwen2.5驱动，在仅9个机器学习任务中训练后，性能超越671B参数的Deepseek-R1智能体，并展现出强大的跨任务泛化能力。研究通过探索增强微调、逐步强化学习范式和定制化奖励模块三大创新，解决了传统AI开发效率低下的问题。这一成果标志着AI4AI从“提示工程”到“经验学习”的重要转变，为实现通用人工智能奠定基础。此外，ML-Agent也是MASWorks开源社区的一部分，该社区聚焦多智能体系统的发展，推动全球研究者共同合作。
来源：https://mp.weixin.qq.com/s/SXq5EZo5pGM2gAGzxIzULw

		自动登录	找回密码
密码			立即注册

课程导航

7B智能体仅凭9个任务训练即超越R1！上交大打造AI-for-AI新范式