智谱推出音效生成模型CogSound,实现音画同步
智谱推出新音效模型CogSound,本月将在“智谱清言”上线,能够生成与视频内容高度匹配的音效。CogSound采用优化后的U-Net结构和“分块时序对齐交叉注意力机制”,确保音画同步和音效流畅。此外,新清影视频生成系统也进行了升级,支持更长、更高清的视频生成,提升了视频质量和美学表现。智谱清影成为国内首个实现音画同步的AI视频生成产品,并已开源,推动了国产AI视频生成技术的发展。来源:https://mp.weixin.qq.com/s/EeDF9PtMUNXNKfEaK2BKbA
页:
[1]