彩云科技发布DCFormer架构大模型“云锦天章”

[复制链接]
周大 发表于 2024-11-18 13:33:16 | 显示全部楼层 |阅读模式
彩云科技近日发布了基于DCFormer架构的通用大模型“云锦天章”,该模型具备问答、数学、编程等能力,特别擅长小说创作。彩云科技CEO袁行远和团队自2019年起研究Transformer架构,2024年受邀参加ICML会议并发表论文。DCFormer通过改进注意力机制,提升模型效率,彩云科技计划进一步训练14B参数的模型。公司旗下有三款产品:彩云天气、彩云小译和彩云小梦,后者已升级至V3.5版本,支持更长的文本创作。袁行远希望通过优化模型结构,降低大模型研发成本,打破国内外技术分层的现状。
来源:https://tech.ifeng.com/c/8eaJUi3ZE52

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-26 17:23 , Processed in 0.294248 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表