ILLUME+：华为诺亚探索新GPT-4o架构，理解生成一体模型，昇腾可训！

周大发表于 2025-4-7 14:27:28

华为与港大联合推出的 ILLUME+ 模型，通过 DualViTok 和扩散解码器创新设计，实现了语义理解与高保真图像生成的突破。该模型在多模态理解、生成和编辑任务中表现出色，3B 参数性能媲美 7B 模型。其渐进式训练策略支持任意分辨率输入输出，实验结果显示其在多项基准测试中超越现有 SOTA 模型，为未来多模态大语言模型发展提供了新方向。
来源：https://mp.weixin.qq.com/s/1ZTvuW6oALBj1Kjs-heyXg

页: [1]

靠浦ai课堂's Archiver

ILLUME+：华为诺亚探索新GPT-4o架构，理解生成一体模型，昇腾可训！