10秒生成4分钟音乐,8GB显存就能跑!已登Hugging Face趋势榜一
DiffRhythm是由西北工业大学和香港中文大学(深圳)联合开发的AI音乐生成模型。该模型采用全diffusion架构,仅需10秒即可生成长达4分45秒的完整双轨高保真歌曲,支持本地部署且最低只需8G显存。它解决了歌词与歌声对齐等技术难题,并通过压缩鲁棒VAE技术提升了音频质量。实验结果表明,DiffRhythm在音质、音乐性和歌词清晰度等方面表现出色,已完全开源并在Hugging Face平台获得广泛关注。来源:https://mp.weixin.qq.com/s/u5Y68MvzHPHBKEQKoHmv_A
页:
[1]