阿里开源万相视频生成大模型

周大发表于 2025-2-26 14:05:09

阿里巴巴开源了万相视频生成大模型，提供14B和1.3B两种参数版本，后者仅需8.2GB显存即可运行。该模型可精准还原复杂动作、物理变化，并理解长文本指令，在VBench评测中以86.22%的成绩领先。其核心技术为高效的因果3D VAE和视频Diffusion Transformer。随着此次开源，阿里实现了全模态开源，Qwen衍生模型数量超10万，成为全球最大AI模型家族之一。
来源：https://mp.weixin.qq.com/s/SRj06E-VCSpCiQZqE0gpHA

页: [1]

靠浦ai课堂's Archiver

阿里开源万相视频生成大模型