数学推理场景下,首个分布外检测研究成果来了
上海交通大学和阿里巴巴通义实验室合作,首次提出针对数学推理场景的OOD检测算法——TV Score。该算法基于动态Embedding轨迹,解决了传统方法在数学推理中的“模式坍缩”难题,显著提升了OOD检测的精度和鲁棒性。实验结果显示,TV Score在离线和在线检测中均表现出色,尤其在Near-shift OOD场景下优势明显。此外,泛化性测试也验证了其在多种任务和场景下的有效性。来源:https://mp.weixin.qq.com/s/aq2Rq2cVG5yCQNZKNqTgiA
页:
[1]