大模型诚实性评估基准BeHonest出炉,揭示AI诚实性挑战

[复制链接]
周大 发表于 2024-7-11 16:26:31 | 显示全部楼层 |阅读模式
上海交通大学的GAIR Lab推出了一项名为BeHonest的评估基准,用于衡量大语言模型的诚实性。该基准通过自我认知、非欺骗性和一致性三个维度,揭示了当前模型在诚实性上的挑战,如承认未知的能力不足,存在欺骗倾向,以及一致性上的问题。研究强调,改善AI模型的诚实性对于其安全应用和未来发展至关重要。
来源:https://mp.weixin.qq.com/s/TZH8rRSXmnHra1jfTYrryQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 05:33 , Processed in 0.275131 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表