多模态大模型对齐新范式,10个评估维度全面提升,快手&中科院&南大打破瓶颈
快手、中科院及南大团队提出多模态大语言模型(MLLMs)对齐新方法,在10个维度、27个基准测试中取得显著性能增益。该方法引入12万标注对的新数据集和创新奖励模型,使LLaVA-ov-7B模型对话能力提升19.5%,安全性提升60%。研究显示小规模MLLM难以通过自我提升实现全面性能提升,强调高质量人工注释的重要性。相关代码及数据已开源,并在社交媒体引起广泛关注。来源:https://mp.weixin.qq.com/s/nG6MiwLl_xxXMWM0QGKW1w
页:
[1]