OpenAI宣布开源SimpleQA新基准,专治大模型“胡言乱语”

[复制链接]
周大 发表于 2024-10-31 14:04:45 | 显示全部楼层 |阅读模式
OpenAI 宣布开源新基准 SimpleQA,旨在衡量语言模型回答简短事实问题的准确性。当前语言模型常出现“幻觉”问题,即产生错误或未经证实的答案。SimpleQA 通过高正确性、多样性和前沿挑战性等特点,提供了一个高效且具有挑战性的评估工具。该基准包含 4326 道问题,适用于快速评估,但仅限于短查询的事实准确性。OpenAI 希望 SimpleQA 能推动 AI 研究,提高模型的可信度和可靠性。
来源:https://tech.ifeng.com/c/8e66uznepE0

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-17 22:10 , Processed in 0.303135 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表