DeRa在解码中重新对齐,让语言模型更少幻觉、更符合人类偏好
一项由多国研究团队和Google专家合作的论文在ICML-2024上获得了关注,他们提出了一种名为DeRa的新技术,旨在优化语言模型的对齐,使其在生成回答时更符合人类偏好。DeRa允许在不重新训练模型的情况下调整奖励和正则化的平衡,提高了研究效率并减少了计算成本。实验表明,DeRa在多项任务中表现出色,包括调整对齐程度、控制生成内容的长度和改善摘要质量,同时能有效减少大模型中的“幻觉”问题。来源:https://mp.weixin.qq.com/s/-9MjgNOLRrUdaQUF5tVv9w
页:
[1]