10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一

[复制链接]
周大 发表于 2025-3-12 15:20:56 | 显示全部楼层 |阅读模式
DiffRhythm是由西北工业大学和香港中文大学(深圳)联合开发的AI音乐生成模型。该模型采用全diffusion架构,仅需10秒即可生成长达4分45秒的完整双轨高保真歌曲,支持本地部署且最低只需8G显存。它解决了歌词与歌声对齐等技术难题,并通过压缩鲁棒VAE技术提升了音频质量。实验结果表明,DiffRhythm在音质、音乐性和歌词清晰度等方面表现出色,已完全开源并在Hugging Face平台获得广泛关注。
来源:https://mp.weixin.qq.com/s/u5Y68MvzHPHBKEQKoHmv_A

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-7 12:55 , Processed in 0.271586 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表