多模态检索新突破,用软标签打破传统刚性映射约束,全面超越CLIP|AAAI 2026 Oral

[复制链接]
周大 发表于 2025-11-15 15:13:56 | 显示全部楼层 |阅读模式
UniME-V2提出基于“MLLM-as-a-Judge”的新方法,通过多模态大模型生成软语义匹配分数,精准挖掘高质量困难负例,提升统一多模态嵌入模型的判别能力。实验显示,其在MMEB基准上相较VLM2Vec最高提升3.5%,超越多个先进模型0.5%-0.9%,OOD得分为66.7;在SugarCrepe任务中性能提升达9.2%。配套重排序模型UniME-V2-Reranker在少数据下仍优于LamRA,最高提升7.4%,展现出更强的语义区分与泛化能力。
来源:https://mp.weixin.qq.com/s/LnSqRpnxH33lzmCAFeGfHA

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-11-28 00:42 , Processed in 0.268651 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表