10秒生成4分钟音乐，8GB显存就能跑！已登Hugging Face趋势榜一

周大发表于 2025-3-12 15:20:56

DiffRhythm是由西北工业大学和香港中文大学（深圳）联合开发的AI音乐生成模型。该模型采用全diffusion架构，仅需10秒即可生成长达4分45秒的完整双轨高保真歌曲，支持本地部署且最低只需8G显存。它解决了歌词与歌声对齐等技术难题，并通过压缩鲁棒VAE技术提升了音频质量。实验结果表明，DiffRhythm在音质、音乐性和歌词清晰度等方面表现出色，已完全开源并在Hugging Face平台获得广泛关注。
来源：https://mp.weixin.qq.com/s/u5Y68MvzHPHBKEQKoHmv_A

页: [1]

靠浦ai课堂's Archiver

10秒生成4分钟音乐，8GB显存就能跑！已登Hugging Face趋势榜一