没想到,音频大模型开源最彻底的,居然是小红书

[复制链接]
周大 发表于 2025-9-18 16:39:34 | 显示全部楼层 |阅读模式
近期国内AI开源热潮持续升温,小红书在音频大模型领域表现突出,陆续开源FireRedTTS、FireRedASR等达到SOTA水平的技术成果。其FireRedASR字错率低至3.05%,优于多个闭源方案;新一代FireRedTTS-2在多说话人对话与播客生成中领先开源竞品;最新发布的FireRedChat是业内首个全双工语音对话全链路开源系统,集成VAD、ASR、TTS等核心模块,支持私有部署。小红书正构建覆盖语音识别、生成、交互的完整技术栈,致力于打造工业级可商用的开源音频生态,推动AI技术平权与产业化落地。
来源:https://www.chinaz.com/2025/0918/1710491.shtml

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 14:28 , Processed in 0.271727 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表