通义万相新模型突破汉字视频生成

[复制链接]
周大 发表于 2025-1-9 16:20:37 | 显示全部楼层 |阅读模式
阿里通义万相推出两款新视频生成模型,在生成复杂汉字视频方面取得重大突破,如“福”字、“量子位”等,并能处理赛博朋克、古风等多种风格。新模型在VBench评测中以84.70%的成绩居首,展现其强大的处理复杂动作、还原物理规律及优化运镜的能力,实现了影视级效果。技术创新涵盖VAE与DiT架构协同、超长序列训练突破等方面。目前,用户已可在线免费体验,开发者也可通过API打造专属应用。
来源:https://mp.weixin.qq.com/s/fIV5xYvwq_OjtLzGj6ql-g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 01:09 , Processed in 0.290201 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表