周大 发表于 2025-3-12 15:38:18

砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术

腾讯AI Lab与香港中文大学(深圳)合作提出无监督前缀微调(UPFT)方法,仅需微调模型生成的前8-32个词,即可使大模型推理能力达到传统监督训练水平。该方法显著降低训练成本,将训练时间缩短约75%,采样成本降低约99%,训练序列长度缩减82.6%-94.7%。研究发现AI解题的关键信号集中在推理路径的前几步,称为“推理前序自一致性”。实验表明,UPFT在多个推理基准测试中超越传统方法,且不同模型对解题路径前半部分的依赖程度存在差异,为优化训练策略提供了新思路。
来源:https://mp.weixin.qq.com/s/AfDB4E8sHo75aLidLUvKXQ
页: [1]
查看完整版本: 砍掉99%采样成本!腾讯AI Lab提出大模型无监督训练新技术