DeepSeek精度效率双提升,华为&信工所提出思维链“提前退出”机制

[复制链接]
周大 发表于 2025-5-11 14:47:52 | 显示全部楼层 |阅读模式
华为与中科院信工所合作开发的DEER方法,通过动态提前退出推理解决了大模型过度思考的问题。该方法无需额外训练,通过识别推理信息质量下降前的临界点来中断推理,显著提升了大模型的精度和效率。实验结果显示,在多个基准测试中,DEER将思维链生成长度减少31%-43%,同时将准确率提高1.7%-5.7%。此外,DEER在编程任务中也表现出色,生成长度减少64.9%,pass@1指标提升2.1个点。研究团队还提出了分支并行加速策略,进一步优化了推理效率。
来源:https://mp.weixin.qq.com/s/htk_FgjkVBHayRR6XQCxqQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-28 12:05 , Processed in 0.265453 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表