Hugging Face开源新方法提升小模型数学表现

周大发表于 2024-12-17 14:36:38

Hugging Face开源了一种扩展测试时计算的新方法，基于DeepMind的研究成果。该方法在小模型Llama 1B上取得了显著效果，数学分数超过8倍大的模型，甚至超过计算机科学博士生的平均分数（40%）。在Llama 3B上，表现更加出色，可与20几倍大的70B模型媲美。研究涉及三种搜索策略：Best-of-N、Beam search和多样化的验证器树搜索（DVTS）。实验结果显示，DVTS方法在算力预算较大时表现最佳，能够提高答案的多样性和整体性能。未来研究方向包括更强大的验证器、实现自我验证、加入中间步骤和扩展到其他领域。
来源：https://mp.weixin.qq.com/s/IVsbnZZTAsNXwRvr9lqZlg

页: [1]

靠浦ai课堂's Archiver

Hugging Face开源新方法提升小模型数学表现