阿里开源R1-Omni全模态情感识别模型

周大发表于 2025-3-11 15:22:58

阿里通义实验室薄列峰团队开源了R1-Omni模型，该模型首次将RLVR（可验证奖励强化学习）应用于包含音频和视频的全模态大语言模型，在情感识别任务中表现出色。实验结果表明，与三个基线模型相比，R1-Omni在推理能力、理解能力和泛化能力方面均有显著提升。特别是在DFEW数据集上实现了65.83%的UAR和56.27%的WAR，远超其他模型。此外，该模型已在多个数据集上进行测试，并已全部开源。
来源：https://mp.weixin.qq.com/s/G7Y9imSmdSCshte36wrfWw

页: [1]

靠浦ai课堂's Archiver

阿里开源R1-Omni全模态情感识别模型