清华唐杰团队新作：一口气生成2万字，大模型开卷长输出

周大发表于 2024-8-15 15:16:50

清华大学与智谱AI的研究成功让GLM-4和Llama-3.1模型的输出长度显著增加至7800字，解决了大模型生成长度普遍受限于2000字的问题。研究发现，监督式微调阶段缺乏长文本样本是限制因素。为克服这一限制，研究人员提出了AgentWrite，能够将长文本生成任务分解成多个子任务，并利用GPT-4o生成了6000个长输出训练数据。实验结果显示，GLM-4-9B模型在使用AgentWrite后表现最佳。
来源：https://mp.weixin.qq.com/s/rdeBsGZDgMWz-5PzfaTlzA

页: [1]

靠浦ai课堂's Archiver

清华唐杰团队新作：一口气生成2万字，大模型开卷长输出