只需几个演示就能对齐大模型，杨笛一团队提出的DITTO竟如此高效

周大发表于 2024-6-15 15:09:59

斯坦福大学的科研团队近期推出了一项名为DITTO的新技术，旨在改进大语言模型的训练方式。DITTO通过用户提供的少量行为示范，使模型能更高效地理解和适应用户的个人偏好，降低了对大规模数据集的依赖。这一创新方法被视作在线模仿学习的突破，能够在某些情况下超越专家表现。初步实验表明，DITTO在对齐语言模型和提升用户满意度方面表现出显著优势。
来源：https://mp.weixin.qq.com/s/sUPep8Z8Fem3rESAqAAI3w

页: [1]

靠浦ai课堂's Archiver

只需几个演示就能对齐大模型，杨笛一团队提出的DITTO竟如此高效