LLM学会自我预测，准确率提升显著

周大发表于 2025-2-25 14:46:52

研究人员通过结果驱动的微调框架，让大型语言模型（LLM）能够自我学习并大幅提升预测能力。研究使用了Phi-4 14B和DeepSeek-R1 14B两个模型，在12100个二元结果预测问题的数据集上进行训练，并引入Brier分数评估预测准确性。采用直接偏好优化（DPO）微调后，模型预测准确率比基础模型提高了7-10%，且性能可与GPT-4o相媲美。这项研究为LLM预测能力的提升开辟了新道路，使其在不依赖大量人工标注数据的情况下，实现从实际结果中学习改进。
来源：https://mp.weixin.qq.com/s/-pmatwrBtNI623TOY4-67g

页: [1]

靠浦ai课堂's Archiver

LLM学会自我预测，准确率提升显著