采样越多越聪明?隐式扩展颠覆认知,采样搜索如何挑出完美解

[复制链接]
周大 发表于 2025-4-21 14:13:06 | 显示全部楼层 |阅读模式
基于采样的搜索策略通过生成多个候选答案并进行自我验证,显著提升了模型推理性能。研究表明,随着采样数量和验证强度的增加,模型性能持续提升,尤其是在AIME基准测试中表现出色。隐式扩展现象表明,增加采样数量反而提高了验证准确性。研究人员提出了两个提升LLM自我验证能力的原则:对比答案以定位错误和改写答案以适应验证需求。此外,基于采样的搜索对不同规模模型均有显著性能提升,但新验证基准测试显示现有模型在验证能力方面仍有较大改进空间。
来源:https://mp.weixin.qq.com/s/AVjWS5IkzamELly8zIm5og

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 10:29 , Processed in 0.289717 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表