全新合成框架SOTA:强化学习当引擎,任务合成当燃料,蚂蚁港大联合出品

[复制链接]
周大 发表于 2025-10-1 15:28:46 | 显示全部楼层 |阅读模式
蚂蚁与香港大学联合发布PromptCoT 2.0,提出以“任务合成”作为大模型下半场关键技术路径。该框架通过EM循环实现逻辑与问题生成的迭代优化,生成4.77百万个高难度、多样化的合成问题,在数学与代码推理任务上推动30B级模型达到SOTA表现,效果媲美主流顶尖模型。实验证明其合成数据在无需人工标注的情况下显著提升弱模型性能,且具备更强可扩展性。研究还开源了全部数据与方法,为后续向智能体、多模态及自进化方向发展奠定基础。
来源:https://mp.weixin.qq.com/s/iOvdPNMyoXLVP7NQWrLSAg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-10-9 23:56 , Processed in 0.271034 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表