华人主导谷歌SLED,论文登顶会!一键让模型学会自救

[复制链接]
周大 发表于 6 天前 | 显示全部楼层 |阅读模式
谷歌在NeurIPS 2024提出SLED方法,通过整合大模型各层的预测信息,在不解码阶段依赖单一输出,显著降低“幻觉”。实验显示,SLED在Gemma、Qwen、Mixtral等多种模型上均提升准确率,如Gemma-3 1B模型在FACTOR数据集上准确率从47.83%升至63.29%,延迟仅增4%。相比DoLa,SLED表现更稳定,且无需额外训练或外部知识,为提升大模型事实性提供了高效可行的新路径。
来源:https://mp.weixin.qq.com/s/KZ3dLVTbRcIbjSmHeX2nIQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-10-9 23:57 , Processed in 0.355604 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表