大规模、动态「语音增强/分离」新基准!清华发布移动音源仿真平台SonicSim,含950+小时训练数据

[复制链接]
周大 发表于 2024-10-31 14:00:43 | 显示全部楼层 |阅读模式
清华大学推出了SonicSim平台和SonicSet数据集,为动态声源的语音处理研究提供了强有力的工具和数据支持。SonicSim是一个高度可定制的数据生成工具,能够模拟各种复杂的动态声源场景,而SonicSet则是一个大规模的动态声源数据集,提供了丰富的训练和测试数据。这些工具有效降低了数据采集成本,实验证明它们能显著提升模型在真实环境中的性能。实验结果表明,SonicSet数据集上的模型在真实环境中的表现优异,验证了其在语音分离和增强任务中的潜力。
来源:https://mp.weixin.qq.com/s/7tZDu5nDBoG1h0YuXA1C2g

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-17 05:04 , Processed in 0.298172 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表