开源扩散大模型首次跑赢自回归!上交大联手UCSD推出D2F,吞吐量达LLaMA3的2.5倍

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
上海交通大学 DENG Lab 与加州大学圣地亚哥分校联合提出 D2F,首次使开源扩散大语言模型(dLLMs)推理速度显著超过主流自回归(AR)模型。实验显示,D2F 在 GSM8K 上实现最高 2.5 倍于 LLaMA3 的吞吐量,并相比原始 dLLMs 最高达 50 倍加速。该方法通过混合架构设计,解决了 KV 缓存兼容性和块间并行问题,提供更优性能-效率权衡,为大模型推理优化开辟新路径。
来源:https://mp.weixin.qq.com/s/zmZYKl0f9kdoYpO-99IQjg

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 06:25 , Processed in 0.298912 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表