90分钟生成10万Token,新框架实现3倍无损加速超长文本生成,支持DeepSeek-R1和QwQ!

[复制链接]
周大 发表于 2025-3-12 15:24:09 | 显示全部楼层 |阅读模式
北京通用人工智能研究院团队提出TOKENSWIFT框架,解决传统自回归模型在长文本生成中的瓶颈。通过多Token并行生成、动态KV缓存更新等创新,实现3倍以上加速,将10万Token文本生成时间从近5小时缩短至90分钟。实验显示,该方法不仅大幅提升效率,还保证了生成质量和多样性。团队已发布支持R1-Distill的Qwen-32B微调模型,为超长文本生成提供高效解决方案。
来源:https://mp.weixin.qq.com/s/Icx9sTwykZOLWVgA_qENmg

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-7 13:18 , Processed in 0.268178 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表