微软清华合作创新:指令预训练提升大模型性能

[复制链接]
周大 发表于 2024-7-10 14:18:32 | 显示全部楼层 |阅读模式
微软与清华大学合作提出了一种新的“指令预训练”技术,旨在改进大模型的训练过程。该方法通过监督多任务学习,利用指令-响应对增强预训练,使较小规模的Llama3-8B模型在某些任务上超越了更大的Llama3-70B模型。研究者构建了200M个高质量指令-响应对,提高了模型的泛化能力和指令微调效率,为预训练带来了新思路。
来源:https://mp.weixin.qq.com/s/y21ii5AxErt-x3mFsAXW2w

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-9 00:31 , Processed in 0.296615 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表