清华团队新算法玩转频域时域,压缩95%计算量实现语音分离新SOTA!
清华大学研究团队针对语音分离的计算复杂度高和数据集不真实问题,提出TIGER轻量级模型及EchoSet数据集。TIGER采用时频交叉建模策略,在减少94.3%参数量和95.3%计算量情况下保持高性能。EchoSet包含27,522条语音,模拟真实声学环境。实验显示TIGER在复杂场景中显著优于现有模型,特别是在低资源消耗下表现出色,为语音分离提供了新的解决方案。来源:https://mp.weixin.qq.com/s/u_EyPe41-hbHUdocWpgrFA
页:
[1]