智谱发布LongWriter模型,精选数据提升长文本输出能力
智谱团队发布LongWriter-GLM4-9B模型,解决了现有大模型无法输出超长文本的问题。通过构建长输出训练数据集,该模型可在用户指定长度下生成超长文本(10000+ words)。团队开源了LongWriter-6K数据集及其精选版本LongWriter-6K-Filtered,并证明只需少量高质量数据即可实现显著性能提升。相关模型和数据集已开源至ModelScope平台。来源:https://mp.weixin.qq.com/s/LvWUSgIRO5HI5YSDRz7SxA
页:
[1]