阿里开源万相视频生成大模型
阿里巴巴开源了万相视频生成大模型,提供14B和1.3B两种参数版本,后者仅需8.2GB显存即可运行。该模型可精准还原复杂动作、物理变化,并理解长文本指令,在VBench评测中以86.22%的成绩领先。其核心技术为高效的因果3D VAE和视频Diffusion Transformer。随着此次开源,阿里实现了全模态开源,Qwen衍生模型数量超10万,成为全球最大AI模型家族之一。来源:https://mp.weixin.qq.com/s/SRj06E-VCSpCiQZqE0gpHA
页:
[1]