只需几个演示就能对齐大模型,杨笛一团队提出的DITTO竟如此高效

[复制链接]
周大 发表于 2024-6-15 15:09:59 | 显示全部楼层 |阅读模式
斯坦福大学的科研团队近期推出了一项名为DITTO的新技术,旨在改进大语言模型的训练方式。DITTO通过用户提供的少量行为示范,使模型能更高效地理解和适应用户的个人偏好,降低了对大规模数据集的依赖。这一创新方法被视作在线模仿学习的突破,能够在某些情况下超越专家表现。初步实验表明,DITTO在对齐语言模型和提升用户满意度方面表现出显著优势。
来源:https://mp.weixin.qq.com/s/sUPep8Z8Fem3rESAqAAI3w

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 11:25 , Processed in 0.260030 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表