周大 发表于 2024-7-10 14:15:56

牛津大学研究:利用语义熵检测大语言模型错误

牛津大学的研究团队近期在Nature上发表了一项新成果,提出使用语义熵来检测大语言模型的错误生成,即“幻觉”。这种方法通过比较同一问题的多次答案,评估其语义不确定性,有效识别LLM在多个领域中的错误,无需改变模型架构。实验显示,语义熵在检测错误方面优于其他基线,有助于提高基于LLM系统的可靠性。
来源:https://mp.weixin.qq.com/s/fdLZ9DDqG9C_uxAAlKgQbw
页: [1]
查看完整版本: 牛津大学研究:利用语义熵检测大语言模型错误