智谱推出音效生成模型CogSound，实现音画同步

周大发表于 2024-11-9 13:44:48

智谱推出新音效模型CogSound，本月将在“智谱清言”上线，能够生成与视频内容高度匹配的音效。CogSound采用优化后的U-Net结构和“分块时序对齐交叉注意力机制”，确保音画同步和音效流畅。此外，新清影视频生成系统也进行了升级，支持更长、更高清的视频生成，提升了视频质量和美学表现。智谱清影成为国内首个实现音画同步的AI视频生成产品，并已开源，推动了国产AI视频生成技术的发展。
来源：https://mp.weixin.qq.com/s/EeDF9PtMUNXNKfEaK2BKbA

页: [1]

靠浦ai课堂's Archiver

智谱推出音效生成模型CogSound，实现音画同步