Hugging Face开源新方法提升小模型数学表现

[复制链接]
周大 发表于 6 天前 | 显示全部楼层 |阅读模式
Hugging Face开源了一种扩展测试时计算的新方法,基于DeepMind的研究成果。该方法在小模型Llama 1B上取得了显著效果,数学分数超过8倍大的模型,甚至超过计算机科学博士生的平均分数(40%)。在Llama 3B上,表现更加出色,可与20几倍大的70B模型媲美。研究涉及三种搜索策略:Best-of-N、Beam search和多样化的验证器树搜索(DVTS)。实验结果显示,DVTS方法在算力预算较大时表现最佳,能够提高答案的多样性和整体性能。未来研究方向包括更强大的验证器、实现自我验证、加入中间步骤和扩展到其他领域。
来源:https://mp.weixin.qq.com/s/IVsbnZZTAsNXwRvr9lqZlg

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-23 12:35 , Processed in 0.249632 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表