周大 发表于 2024-7-4 14:53:08

法国实验室推出Moshi开源 挑战GPT-4o实时语音技术

法国Kyutai实验室挑战GPT-4o,发布开源AI模型Moshi,具备多模态交互能力,能在300毫秒内响应,支持实时打断和模仿口音。这款由8人团队在6个月内研发的模型,将在改变数字世界语音应用上发挥潜力,其代码和权重即将开源,有望推动AI领域发展。
来源:https://mp.weixin.qq.com/s/FwTEnQqxGLP7U_qcw_DzFg
页: [1]
查看完整版本: 法国实验室推出Moshi开源 挑战GPT-4o实时语音技术