7B智能体仅凭9个任务训练即超越R1!上交大打造AI-for-AI新范式

[复制链接]
周大 发表于 3 天前 | 显示全部楼层 |阅读模式
上海交通大学与上海人工智能实验室联合团队推出ML-Agent,一种基于“经验学习”范式的AI4AI智能体,显著减少人类干预并加速AI开发。ML-Agent由7B参数的Qwen2.5驱动,在仅9个机器学习任务中训练后,性能超越671B参数的Deepseek-R1智能体,并展现出强大的跨任务泛化能力。研究通过探索增强微调、逐步强化学习范式和定制化奖励模块三大创新,解决了传统AI开发效率低下的问题。这一成果标志着AI4AI从“提示工程”到“经验学习”的重要转变,为实现通用人工智能奠定基础。此外,ML-Agent也是MASWorks开源社区的一部分,该社区聚焦多智能体系统的发展,推动全球研究者共同合作。
来源:https://mp.weixin.qq.com/s/SXq5EZo5pGM2gAGzxIzULw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-24 05:02 , Processed in 0.293486 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表