7B智能体仅凭9个任务训练即超越R1!上交大打造AI-for-AI新范式
上海交通大学与上海人工智能实验室联合团队推出ML-Agent,一种基于“经验学习”范式的AI4AI智能体,显著减少人类干预并加速AI开发。ML-Agent由7B参数的Qwen2.5驱动,在仅9个机器学习任务中训练后,性能超越671B参数的Deepseek-R1智能体,并展现出强大的跨任务泛化能力。研究通过探索增强微调、逐步强化学习范式和定制化奖励模块三大创新,解决了传统AI开发效率低下的问题。这一成果标志着AI4AI从“提示工程”到“经验学习”的重要转变,为实现通用人工智能奠定基础。此外,ML-Agent也是MASWorks开源社区的一部分,该社区聚焦多智能体系统的发展,推动全球研究者共同合作。来源:https://mp.weixin.qq.com/s/SXq5EZo5pGM2gAGzxIzULw
页:
[1]