通义万相新模型突破汉字视频生成
阿里通义万相推出两款新视频生成模型,在生成复杂汉字视频方面取得重大突破,如“福”字、“量子位”等,并能处理赛博朋克、古风等多种风格。新模型在VBench评测中以84.70%的成绩居首,展现其强大的处理复杂动作、还原物理规律及优化运镜的能力,实现了影视级效果。技术创新涵盖VAE与DiT架构协同、超长序列训练突破等方面。目前,用户已可在线免费体验,开发者也可通过API打造专属应用。来源:https://mp.weixin.qq.com/s/fIV5xYvwq_OjtLzGj6ql-g
页:
[1]