冲击自回归,扩散模型正在改写下一代通用模型范式
Google I/O 2025 展示 Gemini Diffusion,一种基于扩散模型的语言模型,生成速度提升显著。扩散模型通过噪声细化生成文本,具备快速迭代与纠错优势,已被多个研究团队应用于语言和多模态任务。蚂蚁集团与人大联合开发的 LLaDA 成为扩散模型重要里程碑,其多模态版本 LLaDA-V 和字节跳动的 MMaDA 在多模态理解中表现优异。扩散模型正从语言走向多模态交互,成为通用智能新方向,未来潜力巨大。来源:https://mp.weixin.qq.com/s/c-YllEX2BlhmDfPjPRU2vQ
页:
[1]