免费用！阿里通义大模型上新，超逼真音视频生成SOTA！

周大发表于 2025-4-15 15:00:12

阿里通义实验室发布全新数字人生成大模型 OmniTalker，用户只需上传参考视频即可复刻人物表情、声音及说话风格。该模型通过双分支 DiT 架构实现音画同步与风格一致，相比传统方法显著降低成本并提升生成内容的真实感与互动性。实验表明，OmniTalker 在多项核心指标上达到业界领先水平，同时支持实时高质量输出。目前，该项目已在魔搭社区和 HuggingFace 开放体验，提供十余个免费模板供公众使用。
来源：https://mp.weixin.qq.com/s/7owEwU_oV1NlAnmx-Wng9g

页: [1]

靠浦ai课堂's Archiver

免费用！阿里通义大模型上新，超逼真音视频生成SOTA！