清华大学提出IFT算法，优化语言模型对齐效率

周大发表于 2024-5-29 14:46:35

清华大学科研团队近日发表论文，介绍了一种名为“直观微调”（IFT）的新算法，该算法能融合监督微调和强化学习的优势，提高语言模型对人类偏好的理解和性能，同时降低训练成本。IFT在实验中表现出色，尤其是在生成任务上，即使在有限资源下，也能达到与传统方法相当甚至更好的效果，为预训练模型的优化提供了一条高效路径。
来源：https://mp.weixin.qq.com/s/DfBd3C1Of-TkKEhV5tvpOQ

页: [1]

靠浦ai课堂's Archiver

清华大学提出IFT算法，优化语言模型对齐效率