受DeepSeek-R1启发,小米大模型团队登顶音频推理MMAU榜

[复制链接]
周大 发表于 2025-3-17 16:01:48 | 显示全部楼层 |阅读模式
小米大模型团队在音频推理领域取得重大突破,受DeepSeek-R1启发,首次将强化学习应用于多模态音频理解任务,并以64.5%的准确率登顶MMAU评测榜首,超越GPT-4o和Gemini 2.0 Flash等顶尖模型。实验表明,强化学习在小规模数据集上的表现优于监督学习,并使7B参数模型展现出强推理能力。尽管距离人类专家水平(82.23%)仍有差距,但此次研究验证了强化学习的独特价值,为智能听觉时代奠定了基础。小米已同步开源相关代码和技术报告。
来源:https://tech.ifeng.com/c/8hnEPWsbzYA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-6 00:18 , Processed in 0.275083 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表