砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术

[复制链接]
周大 发表于 2025-3-12 15:38:18 | 显示全部楼层 |阅读模式
腾讯AI Lab与香港中文大学(深圳)合作提出无监督前缀微调(UPFT)方法,仅需微调模型生成的前8-32个词,即可使大模型推理能力达到传统监督训练水平。该方法显著降低训练成本,将训练时间缩短约75%,采样成本降低约99%,训练序列长度缩减82.6%-94.7%。研究发现AI解题的关键信号集中在推理路径的前几步,称为“推理前序自一致性”。实验表明,UPFT在多个推理基准测试中超越传统方法,且不同模型对解题路径前半部分的依赖程度存在差异,为优化训练策略提供了新思路。
来源:https://mp.weixin.qq.com/s/AfDB4E8sHo75aLidLUvKXQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-16 04:52 , Processed in 0.292954 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表