仅用4块GPU、不到3天训练出「开源版GPT-4o」LLaMA-Omni实现低延迟语音交互

[复制链接]
周大 发表于 2024-9-23 15:21:26 | 显示全部楼层 |阅读模式
中国科学院团队研发的LLaMA-Omni模型实现了与大型语言模型(LLM)的低延迟语音交互,响应延迟低至226ms。该模型由语音编码器、适配器、LLM和流式语音解码器组成,无需生成中间文本。实验结果显示,LLaMA-Omni在内容和风格评分上优于其他模型,解码时间和响应延迟表现优异。
来源:https://mp.weixin.qq.com/s/6SEsQqd9265A2CycOul9fA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 06:36 , Processed in 0.265956 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表