周大 发表于 2024-6-15 15:09:59

只需几个演示就能对齐大模型,杨笛一团队提出的DITTO竟如此高效

斯坦福大学的科研团队近期推出了一项名为DITTO的新技术,旨在改进大语言模型的训练方式。DITTO通过用户提供的少量行为示范,使模型能更高效地理解和适应用户的个人偏好,降低了对大规模数据集的依赖。这一创新方法被视作在线模仿学习的突破,能够在某些情况下超越专家表现。初步实验表明,DITTO在对齐语言模型和提升用户满意度方面表现出显著优势。
来源:https://mp.weixin.qq.com/s/sUPep8Z8Fem3rESAqAAI3w
页: [1]
查看完整版本: 只需几个演示就能对齐大模型,杨笛一团队提出的DITTO竟如此高效