上海交大AI智能体「ML-Master」登OpenAI MLE-bench榜首,超越微软成全球第一

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
上海交通大学人工智能学院Agents团队研发的AI专家智能体「ML-Master」在OpenAI发布的MLE-bench基准测试中以29.3%的平均奖牌率夺冠,领先微软RD-Agent和OpenAI的AIDE。该测试包含75个Kaggle真实任务,评估AI在机器学习全流程中的能力。ML-Master采用“探索-推理深度融合”架构,通过多轨迹探索、可控推理与自适应记忆机制协同运作,在中等难度任务中奖牌率提升2.2倍,计算效率提高一倍。其有效提交率达93.3%,超越44.9%的人类参赛者,展现全面性能优势。该项目标志着AI自主优化领域的关键进展,未来将拓展至更多AI辅助应用领域。
来源:https://mp.weixin.qq.com/s/8Dn7Hvpmp59-0xDD28nQkw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-7-5 19:53 , Processed in 0.284548 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表