免费用!阿里通义大模型上新,超逼真音视频生成SOTA!

[复制链接]
周大 发表于 2025-4-15 15:00:12 | 显示全部楼层 |阅读模式
阿里通义实验室发布全新数字人生成大模型 OmniTalker,用户只需上传参考视频即可复刻人物表情、声音及说话风格。该模型通过双分支 DiT 架构实现音画同步与风格一致,相比传统方法显著降低成本并提升生成内容的真实感与互动性。实验表明,OmniTalker 在多项核心指标上达到业界领先水平,同时支持实时高质量输出。目前,该项目已在魔搭社区和 HuggingFace 开放体验,提供十余个免费模板供公众使用。
来源:https://mp.weixin.qq.com/s/7owEwU_oV1NlAnmx-Wng9g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-7 05:46 , Processed in 0.283490 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表