周大 发表于 2025-6-10 14:44:08

比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临

香港大学与华为诺亚方舟实验室合作推出全新多模态模型FUDOKI,其基于非掩码离散流匹配架构,通过并行去噪机制实现了高效的双向信息整合。相比传统自回归方法,FUDOKI无需掩码策略,支持动态修正生成结果,并在图像生成任务中取得了GenEval基准0.76的优异成绩。模型的核心创新包括度量诱导的概率路径和动力学最优速度,允许实时调整生成过程。此外,FUDOKI通过预训练AR模型初始化降低训练成本,为多模态任务提供了灵活高效的技术基础,推动了通用人工智能的发展。
来源:https://mp.weixin.qq.com/s/PpiHlZSBpYlT6oJo0Aa8AA
页: [1]
查看完整版本: 比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临