砍掉99%采样成本！腾讯AI Lab提出大模型无监督训练新技术

周大发表于 2025-3-12 15:38:18

腾讯AI Lab与香港中文大学（深圳）合作提出无监督前缀微调（UPFT）方法，仅需微调模型生成的前8-32个词，即可使大模型推理能力达到传统监督训练水平。该方法显著降低训练成本，将训练时间缩短约75%，采样成本降低约99%，训练序列长度缩减82.6%-94.7%。研究发现AI解题的关键信号集中在推理路径的前几步，称为“推理前序自一致性”。实验表明，UPFT在多个推理基准测试中超越传统方法，且不同模型对解题路径前半部分的依赖程度存在差异，为优化训练策略提供了新思路。
来源：https://mp.weixin.qq.com/s/AfDB4E8sHo75aLidLUvKXQ

		自动登录	找回密码
密码			立即注册

课程导航

砍掉99%采样成本！腾讯AI Lab提出大模型无监督训练新技术