周大 发表于 2025-2-25 14:46:52

LLM学会自我预测,准确率提升显著

研究人员通过结果驱动的微调框架,让大型语言模型(LLM)能够自我学习并大幅提升预测能力。研究使用了Phi-4 14B和DeepSeek-R1 14B两个模型,在12100个二元结果预测问题的数据集上进行训练,并引入Brier分数评估预测准确性。采用直接偏好优化(DPO)微调后,模型预测准确率比基础模型提高了7-10%,且性能可与GPT-4o相媲美。这项研究为LLM预测能力的提升开辟了新道路,使其在不依赖大量人工标注数据的情况下,实现从实际结果中学习改进。
来源:https://mp.weixin.qq.com/s/-pmatwrBtNI623TOY4-67g
页: [1]
查看完整版本: LLM学会自我预测,准确率提升显著