没想到，音频大模型开源最彻底的，居然是小红书

周大发表于 2025-9-18 16:39:34

近期国内AI开源热潮持续升温，小红书在音频大模型领域表现突出，陆续开源FireRedTTS、FireRedASR等达到SOTA水平的技术成果。其FireRedASR字错率低至3.05%，优于多个闭源方案；新一代FireRedTTS-2在多说话人对话与播客生成中领先开源竞品；最新发布的FireRedChat是业内首个全双工语音对话全链路开源系统，集成VAD、ASR、TTS等核心模块，支持私有部署。小红书正构建覆盖语音识别、生成、交互的完整技术栈，致力于打造工业级可商用的开源音频生态，推动AI技术平权与产业化落地。
来源：https://www.chinaz.com/2025/0918/1710491.shtml

页: [1]

靠浦ai课堂's Archiver

没想到，音频大模型开源最彻底的，居然是小红书