通用的dLLM开发框架，让BERT掌握扩散式对话

周大发表于 5 天前

伯克利与UIUC团队提出dLLM框架，通过离散扩散与轻量指令微调（SFT），仅用约50 GPU·小时即让ModernBERT-large-chat-v0（0.4B）在多项任务上性能逼近Qwen1.5-0.5B。实验证明无需额外生成式预训练，SFT已足以激活BERT生成能力。团队开源全流程代码与模型，并提供可复现的“Hello World”示例，推动扩散语言模型的教学与研究普及。
来源：https://mp.weixin.qq.com/s/bEGnzL6nwMweK7eH8uWQ5w

		自动登录	找回密码
密码			立即注册

课程导航

通用的dLLM开发框架，让BERT掌握扩散式对话