上海交大AI智能体「ML-Master」登OpenAI MLE-bench榜首，超越微软成全球第一

周大发表于 2025-7-1 14:55:17

上海交通大学人工智能学院Agents团队研发的AI专家智能体「ML-Master」在OpenAI发布的MLE-bench基准测试中以29.3%的平均奖牌率夺冠，领先微软RD-Agent和OpenAI的AIDE。该测试包含75个Kaggle真实任务，评估AI在机器学习全流程中的能力。ML-Master采用“探索-推理深度融合”架构，通过多轨迹探索、可控推理与自适应记忆机制协同运作，在中等难度任务中奖牌率提升2.2倍，计算效率提高一倍。其有效提交率达93.3%，超越44.9%的人类参赛者，展现全面性能优势。该项目标志着AI自主优化领域的关键进展，未来将拓展至更多AI辅助应用领域。
来源：https://mp.weixin.qq.com/s/8Dn7Hvpmp59-0xDD28nQkw

		自动登录	找回密码
密码			立即注册

课程导航

上海交大AI智能体「ML-Master」登OpenAI MLE-bench榜首，超越微软成全球第一