研究者发现扩散语言模型早期可获正确解码,提出Prophet策略实现推理加速
扩散语言模型(DLM)因其并行解码能力被视为自回归模型的替代方案,但其推理速度受限。针对此问题,研究者提出无需训练的解码策略Prophet,基于“早期答案收敛”现象,通过动态监控模型置信度,在答案稳定后提前终止解码。实验显示,该方法在多个基准任务中保持生成质量的同时实现最高3.4倍加速,甚至在部分任务上表现优于完整解码。该方法为DLM的实际部署提供了高效、通用的解决方案。来源:https://mp.weixin.qq.com/s/g2CPqqvPxIb3X_WTxz6mrg
页:
[1]