数学推理场景下,首个分布外检测研究成果来了

[复制链接]
周大 发表于 2024-12-2 14:19:52 | 显示全部楼层 |阅读模式
上海交通大学和阿里巴巴通义实验室合作,首次提出针对数学推理场景的OOD检测算法——TV Score。该算法基于动态Embedding轨迹,解决了传统方法在数学推理中的“模式坍缩”难题,显著提升了OOD检测的精度和鲁棒性。实验结果显示,TV Score在离线和在线检测中均表现出色,尤其在Near-shift OOD场景下优势明显。此外,泛化性测试也验证了其在多种任务和场景下的有效性。
来源:https://mp.weixin.qq.com/s/aq2Rq2cVG5yCQNZKNqTgiA

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-24 03:40 , Processed in 0.277415 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表