北京理工启动“流星雨”计划,推动大模型自我进化

[复制链接]
周大 发表于 2024-12-5 14:03:56 | 显示全部楼层 |阅读模式
北京理工大学的“流星雨”研究计划旨在探索大模型自我进化的理论与方法。该计划通过SRA-MCTS方法,推动代码大模型在无需外部监督的情况下自我进化,显著提升了模型在复杂任务中的表现。研究分为三个阶段:导师监督学习、自我评估能力习得和自我提升训练,实验结果显示该方法在小规模模型中也展现出强大潜力。未来,团队将继续优化各阶段的自我进化方法,推广该计划的应用。
来源:https://mp.weixin.qq.com/s/_UqhgOpMH6cjYwrsPA0LPg

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-24 00:35 , Processed in 0.279484 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表