清华唐杰团队新作:一口气生成2万字,大模型开卷长输出

[复制链接]
周大 发表于 2024-8-15 15:16:50 | 显示全部楼层 |阅读模式
清华大学与智谱AI的研究成功让GLM-4和Llama-3.1模型的输出长度显著增加至7800字,解决了大模型生成长度普遍受限于2000字的问题。研究发现,监督式微调阶段缺乏长文本样本是限制因素。为克服这一限制,研究人员提出了AgentWrite,能够将长文本生成任务分解成多个子任务,并利用GPT-4o生成了6000个长输出训练数据。实验结果显示,GLM-4-9B模型在使用AgentWrite后表现最佳。
来源:https://mp.weixin.qq.com/s/rdeBsGZDgMWz-5PzfaTlzA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 16:12 , Processed in 0.298346 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表