周大 发表于 2025-3-12 15:20:56

10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一

DiffRhythm是由西北工业大学和香港中文大学(深圳)联合开发的AI音乐生成模型。该模型采用全diffusion架构,仅需10秒即可生成长达4分45秒的完整双轨高保真歌曲,支持本地部署且最低只需8G显存。它解决了歌词与歌声对齐等技术难题,并通过压缩鲁棒VAE技术提升了音频质量。实验结果表明,DiffRhythm在音质、音乐性和歌词清晰度等方面表现出色,已完全开源并在Hugging Face平台获得广泛关注。
来源:https://mp.weixin.qq.com/s/u5Y68MvzHPHBKEQKoHmv_A
页: [1]
查看完整版本: 10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一