清华团队新算法玩转频域时域,压缩95%计算量实现语音分离新SOTA!

[复制链接]
周大 发表于 2025-2-14 20:39:35 | 显示全部楼层 |阅读模式
清华大学研究团队针对语音分离的计算复杂度高和数据集不真实问题,提出TIGER轻量级模型及EchoSet数据集。TIGER采用时频交叉建模策略,在减少94.3%参数量和95.3%计算量情况下保持高性能。EchoSet包含27,522条语音,模拟真实声学环境。实验显示TIGER在复杂场景中显著优于现有模型,特别是在低资源消耗下表现出色,为语音分离提供了新的解决方案。
来源:https://mp.weixin.qq.com/s/u_EyPe41-hbHUdocWpgrFA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-20 20:05 , Processed in 0.282125 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表