周大 发表于 2025-4-15 15:00:12

免费用!阿里通义大模型上新,超逼真音视频生成SOTA!

阿里通义实验室发布全新数字人生成大模型 OmniTalker,用户只需上传参考视频即可复刻人物表情、声音及说话风格。该模型通过双分支 DiT 架构实现音画同步与风格一致,相比传统方法显著降低成本并提升生成内容的真实感与互动性。实验表明,OmniTalker 在多项核心指标上达到业界领先水平,同时支持实时高质量输出。目前,该项目已在魔搭社区和 HuggingFace 开放体验,提供十余个免费模板供公众使用。
来源:https://mp.weixin.qq.com/s/7owEwU_oV1NlAnmx-Wng9g
页: [1]
查看完整版本: 免费用!阿里通义大模型上新,超逼真音视频生成SOTA!