免费用!阿里通义大模型上新,超逼真音视频生成SOTA!
阿里通义实验室发布全新数字人生成大模型 OmniTalker,用户只需上传参考视频即可复刻人物表情、声音及说话风格。该模型通过双分支 DiT 架构实现音画同步与风格一致,相比传统方法显著降低成本并提升生成内容的真实感与互动性。实验表明,OmniTalker 在多项核心指标上达到业界领先水平,同时支持实时高质量输出。目前,该项目已在魔搭社区和 HuggingFace 开放体验,提供十余个免费模板供公众使用。来源:https://mp.weixin.qq.com/s/7owEwU_oV1NlAnmx-Wng9g
页:
[1]