Kimi开源全新音频基础模型,横扫十多项基准测试,总体性能第一

[复制链接]
周大 发表于 2025-4-26 14:23:12 | 显示全部楼层 |阅读模式
Kimi-Audio 是一款全新通用音频基础模型,支持语音识别、音频理解等多任务,在十多个基准测试中表现卓越,WER 低至 1.28%,VocalSound 测试接近满分。其集成式架构包含音频分词器、大模型与去分词器,基于 1300 万小时数据预训练并微调优化。研究人员还开发了评估工具包,助力公平对比。目前,相关代码与工具已在 Github 开源。
来源:https://mp.weixin.qq.com/s/hbecvcn6qe4WO2LyqkS-iA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 09:28 , Processed in 0.274611 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表