智谱推出音效生成模型CogSound,实现音画同步

[复制链接]
周大 发表于 2024-11-9 13:44:48 | 显示全部楼层 |阅读模式
智谱推出新音效模型CogSound,本月将在“智谱清言”上线,能够生成与视频内容高度匹配的音效。CogSound采用优化后的U-Net结构和“分块时序对齐交叉注意力机制”,确保音画同步和音效流畅。此外,新清影视频生成系统也进行了升级,支持更长、更高清的视频生成,提升了视频质量和美学表现。智谱清影成为国内首个实现音画同步的AI视频生成产品,并已开源,推动了国产AI视频生成技术的发展。
来源:https://mp.weixin.qq.com/s/EeDF9PtMUNXNKfEaK2BKbA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-28 04:57 , Processed in 0.284757 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表