大模型作为评估者的「偏好」困境：UDA实现无监督去偏对齐

周大发表于 3 天前

针对大模型评估中普遍存在的自我偏好偏差问题，智谱AI提出UDA框架，利用无监督学习动态校准成对评分。实验显示，其将裁判间评分标准差降低59%，与人类评估的相关性提升至0.812，并在零样本场景下保持稳健，显著增强LLM评判的公平性与一致性。
来源：https://mp.weixin.qq.com/s/gXJW-6WmKb1irHHAFt0bbQ

		自动登录	找回密码
密码			立即注册

课程导航

大模型作为评估者的「偏好」困境：UDA实现无监督去偏对齐