苏黎世联邦理工新研究实现AI幻觉实时检测，Llama-3.3-70B模型AUC达0.90

周大发表于 2025-9-10 14:31:31

苏黎世联邦理工学院与 MATS 的研究人员提出了一种可扩展的幻觉检测方法，能实时识别大语言模型生成文本中的幻觉实体。该方法通过构建 LongFact++ 数据集并使用线性探针与 LoRA 探针训练分类器，在长文本（如 LongFact、HealthBench）和短文本（如 TriviaQA）任务中均表现出色，AUC 值最高达 0.90，显著优于现有方法。研究还发现该方法具备识别数学推理错误的泛化能力。尽管检测性能已大幅提升，但在实际高风险场景应用前仍有改进空间。研究团队已公开数据集与代码，以推动幻觉检测技术的发展。
来源：https://mp.weixin.qq.com/s/sYLvDQ7p7jjQcctGyA5hFg

页: [1]

靠浦ai课堂's Archiver

苏黎世联邦理工新研究实现AI幻觉实时检测，Llama-3.3-70B模型AUC达0.90