新研究揭示DeepSeek/o3弱点：频繁切换思路放弃正确方向，最短答案往往就是对的！

周大发表于 2025-2-3 13:57:30

最新研究表明，推理大模型如DeepSeek-R1和Qwen QwQ系列在处理复杂问题时表现出“欠思考”现象，频繁切换解题思路，导致无效努力，浪费计算资源并降低正确率。研究团队通过实验发现，这些模型在错误回答中消耗的token比正确回答多225%，且思维切换频率增加418%。为解决这一问题，研究人员提出了量化思维不足的指标（UT）和两种改进方案：“思路切换惩罚机制”（TIP）和“简洁解码”，均显著提升了模型的准确率和效率。这为开发更有效的推理模型提供了新思路。
来源：https://mp.weixin.qq.com/s/6oejP8sKLAHGeD2esUZPcA

		自动登录	找回密码
密码			立即注册

课程导航

新研究揭示DeepSeek/o3弱点：频繁切换思路放弃正确方向，最短答案往往就是对的！