周大 发表于 2024-12-17 14:36:38

Hugging Face开源新方法提升小模型数学表现

Hugging Face开源了一种扩展测试时计算的新方法,基于DeepMind的研究成果。该方法在小模型Llama 1B上取得了显著效果,数学分数超过8倍大的模型,甚至超过计算机科学博士生的平均分数(40%)。在Llama 3B上,表现更加出色,可与20几倍大的70B模型媲美。研究涉及三种搜索策略:Best-of-N、Beam search和多样化的验证器树搜索(DVTS)。实验结果显示,DVTS方法在算力预算较大时表现最佳,能够提高答案的多样性和整体性能。未来研究方向包括更强大的验证器、实现自我验证、加入中间步骤和扩展到其他领域。
来源:https://mp.weixin.qq.com/s/IVsbnZZTAsNXwRvr9lqZlg
页: [1]
查看完整版本: Hugging Face开源新方法提升小模型数学表现