AIR框架优化大模型偏好数据集设计

[复制链接]
周大 发表于 2025-4-15 14:58:50 | 显示全部楼层 |阅读模式
清华大学与哈尔滨工业大学联合研究团队提出AIR框架,系统分析偏好数据集的三大核心要素——标注、指令与回复对,并通过实验量化其对大语言模型对齐性能的影响。研究表明,采用极简标注策略、智能指令筛选及科学回复对构造可显著提升模型性能。该框架已在阿里安全御风大模型中应用,为构建高质量偏好数据集提供新思路。
来源:https://mp.weixin.qq.com/s/sIpYVxFlrW76D2151p5Nbg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 19:41 , Processed in 0.283668 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表