阿里开源14B电影级视频模型！实测来了：免费可玩，单次生成时长可达分钟级

周大发表于 2025-8-27 15:28:24

阿里巴巴发布音频驱动视频生成模型Wan2.2-S2V，用户仅需上传图片和音频即可生成面部表情自然、口型同步、动作流畅的高质量数字人视频，单次生成时长可达分钟级。该模型基于超60万段音视频数据训练，融合文本与音频双重控制机制，采用多项技术创新确保音画同步与长视频稳定性，并支持多分辨率输出。模型已开源，公众可通过通义万相官网免费体验。至此，通义系列已构建完整的视频生成工具链，相关模型下载量超过2000万，标志着AI视频生成正加速走向普及化应用。
来源：https://mp.weixin.qq.com/s/lTVYAf0blJ4amLtArx8BJg

页: [1]

靠浦ai课堂's Archiver

阿里开源14B电影级视频模型！实测来了：免费可玩，单次生成时长可达分钟级