OR-Bench:新基准挑战AI语言模型的过度拒绝问题

[复制链接]
周大 发表于 2024-6-26 17:08:18 | 显示全部楼层 |阅读模式
UCLA 和 UCB 的研究人员针对人工智能模型过度拒绝问题,推出 OR-Bench 新基准,旨在评估和优化大型语言模型的安全响应。此基准包含大量测试提示,以暴露模型在拒绝潜在有害内容时过度谨慎的现象,影响其效用和用户体验。研究发现,大多数模型在追求安全性时过度拒绝,但通过改进的数据集和评估工具,有望减少这种行为,提升模型的实用性和用户满意度。
来源:https://mp.weixin.qq.com/s/p0b5snpZ5UGc34OqWdmjog

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 08:55 , Processed in 0.286145 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表