阿里开源万相视频生成大模型

[复制链接]
周大 发表于 2025-2-26 14:05:09 | 显示全部楼层 |阅读模式
阿里巴巴开源了万相视频生成大模型,提供14B和1.3B两种参数版本,后者仅需8.2GB显存即可运行。该模型可精准还原复杂动作、物理变化,并理解长文本指令,在VBench评测中以86.22%的成绩领先。其核心技术为高效的因果3D VAE和视频Diffusion Transformer。随着此次开源,阿里实现了全模态开源,Qwen衍生模型数量超10万,成为全球最大AI模型家族之一。
来源:https://mp.weixin.qq.com/s/SRj06E-VCSpCiQZqE0gpHA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-14 20:43 , Processed in 0.312755 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表