大模型作为评估者的「偏好」困境:UDA实现无监督去偏对齐

[复制链接]
周大 发表于 3 天前 | 显示全部楼层 |阅读模式
针对大模型评估中普遍存在的自我偏好偏差问题,智谱AI提出UDA框架,利用无监督学习动态校准成对评分。实验显示,其将裁判间评分标准差降低59%,与人类评估的相关性提升至0.812,并在零样本场景下保持稳健,显著增强LLM评判的公平性与一致性。
来源:https://mp.weixin.qq.com/s/gXJW-6WmKb1irHHAFt0bbQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-12-1 06:08 , Processed in 0.271886 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表