LLM学会自我预测,准确率提升显著

[复制链接]
周大 发表于 2025-2-25 14:46:52 | 显示全部楼层 |阅读模式
研究人员通过结果驱动的微调框架,让大型语言模型(LLM)能够自我学习并大幅提升预测能力。研究使用了Phi-4 14B和DeepSeek-R1 14B两个模型,在12100个二元结果预测问题的数据集上进行训练,并引入Brier分数评估预测准确性。采用直接偏好优化(DPO)微调后,模型预测准确率比基础模型提高了7-10%,且性能可与GPT-4o相媲美。这项研究为LLM预测能力的提升开辟了新道路,使其在不依赖大量人工标注数据的情况下,实现从实际结果中学习改进。
来源:https://mp.weixin.qq.com/s/-pmatwrBtNI623TOY4-67g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 08:56 , Processed in 0.355134 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表