周大 发表于 2025-9-18 16:39:34

没想到,音频大模型开源最彻底的,居然是小红书

近期国内AI开源热潮持续升温,小红书在音频大模型领域表现突出,陆续开源FireRedTTS、FireRedASR等达到SOTA水平的技术成果。其FireRedASR字错率低至3.05%,优于多个闭源方案;新一代FireRedTTS-2在多说话人对话与播客生成中领先开源竞品;最新发布的FireRedChat是业内首个全双工语音对话全链路开源系统,集成VAD、ASR、TTS等核心模块,支持私有部署。小红书正构建覆盖语音识别、生成、交互的完整技术栈,致力于打造工业级可商用的开源音频生态,推动AI技术平权与产业化落地。
来源:https://www.chinaz.com/2025/0918/1710491.shtml
页: [1]
查看完整版本: 没想到,音频大模型开源最彻底的,居然是小红书