阿里开源14B电影级视频模型!实测来了:免费可玩,单次生成时长可达分钟级
阿里巴巴发布音频驱动视频生成模型Wan2.2-S2V,用户仅需上传图片和音频即可生成面部表情自然、口型同步、动作流畅的高质量数字人视频,单次生成时长可达分钟级。该模型基于超60万段音视频数据训练,融合文本与音频双重控制机制,采用多项技术创新确保音画同步与长视频稳定性,并支持多分辨率输出。模型已开源,公众可通过通义万相官网免费体验。至此,通义系列已构建完整的视频生成工具链,相关模型下载量超过2000万,标志着AI视频生成正加速走向普及化应用。来源:https://mp.weixin.qq.com/s/lTVYAf0blJ4amLtArx8BJg
页:
[1]