大模型“过度思考”问题及优化策略
加州大学伯克利分校等高校的研究人员揭示了大模型在执行Agent任务时的“过度思考”问题,并开发了一套系统评估框架。研究发现,高推理努力配置的模型虽有较高解决率(29.1%),但成本高昂(1400美元);而通过优化策略,生成两个低推理解决方案可将成本降低43%,同时解决率达到27.3%。研究识别出三种过度思考模式:分析瘫痪、鲁莽行动和过早脱离,并设计0-10分的评分系统验证其可靠性。实验表明,推理模型过度思考倾向更高,且模型规模越小越容易过度思考。这一研究为优化大模型性能提供了重要参考。来源:https://tech.ifeng.com/c/8i113Voa2As
页:
[1]