DeepSeek精度效率双提升，华为&信工所提出思维链“提前退出”机制

周大发表于 2025-5-11 14:47:52

华为与中科院信工所合作开发的DEER方法，通过动态提前退出推理解决了大模型过度思考的问题。该方法无需额外训练，通过识别推理信息质量下降前的临界点来中断推理，显著提升了大模型的精度和效率。实验结果显示，在多个基准测试中，DEER将思维链生成长度减少31%-43%，同时将准确率提高1.7%-5.7%。此外，DEER在编程任务中也表现出色，生成长度减少64.9%，pass@1指标提升2.1个点。研究团队还提出了分支并行加速策略，进一步优化了推理效率。
来源：https://mp.weixin.qq.com/s/htk_FgjkVBHayRR6XQCxqQ

		自动登录	找回密码
密码			立即注册

课程导航

DeepSeek精度效率双提升，华为&信工所提出思维链“提前退出”机制