华人主导谷歌SLED，论文登顶会！一键让模型学会自救

周大发表于 2025-10-3 15:36:44

谷歌在NeurIPS 2024提出SLED方法，通过整合大模型各层的预测信息，在不解码阶段依赖单一输出，显著降低“幻觉”。实验显示，SLED在Gemma、Qwen、Mixtral等多种模型上均提升准确率，如Gemma-3 1B模型在FACTOR数据集上准确率从47.83%升至63.29%，延迟仅增4%。相比DoLa，SLED表现更稳定，且无需额外训练或外部知识，为提升大模型事实性提供了高效可行的新路径。
来源：https://mp.weixin.qq.com/s/KZ3dLVTbRcIbjSmHeX2nIQ

		自动登录	找回密码
密码			立即注册

课程导航

华人主导谷歌SLED，论文登顶会！一键让模型学会自救