多图场景用DPO对齐,上海AI实验室等提出新方法,无需人工标注

[复制链接]
周大 发表于 2024-11-2 14:21:38 | 显示全部楼层 |阅读模式
上海交通大学、上海AI实验室、港中文等机构联合开发了MIA-DPO,这是一种用于大型视觉语言模型的多图像增强偏好对齐方法。MIA-DPO通过将单图像数据扩展到多图像数据,并设计了序列、网格拼贴和图中图三种数据格式,大幅降低了数据收集和标注成本。该方法通过基于注意力的选择机制自动过滤错误答案,无需依赖人工标注或昂贵API。实验结果显示,MIA-DPO在多个多图和单图基准测试中显著提升了模型的多图感知与推理能力,同时保持了单图理解能力。
来源:https://www.chinaz.com/feed/1102/1650896.shtml

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-17 02:44 , Processed in 0.290621 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表