北京理工启动“流星雨”计划,推动大模型自我进化
北京理工大学的“流星雨”研究计划旨在探索大模型自我进化的理论与方法。该计划通过SRA-MCTS方法,推动代码大模型在无需外部监督的情况下自我进化,显著提升了模型在复杂任务中的表现。研究分为三个阶段:导师监督学习、自我评估能力习得和自我提升训练,实验结果显示该方法在小规模模型中也展现出强大潜力。未来,团队将继续优化各阶段的自我进化方法,推广该计划的应用。来源:https://mp.weixin.qq.com/s/_UqhgOpMH6cjYwrsPA0LPg
页:
[1]