阿里开源R1-Omni全模态情感识别模型
阿里通义实验室薄列峰团队开源了R1-Omni模型,该模型首次将RLVR(可验证奖励强化学习)应用于包含音频和视频的全模态大语言模型,在情感识别任务中表现出色。实验结果表明,与三个基线模型相比,R1-Omni在推理能力、理解能力和泛化能力方面均有显著提升。特别是在DFEW数据集上实现了65.83%的UAR和56.27%的WAR,远超其他模型。此外,该模型已在多个数据集上进行测试,并已全部开源。来源:https://mp.weixin.qq.com/s/G7Y9imSmdSCshte36wrfWw
页:
[1]