多图场景用DPO对齐，上海AI实验室等提出新方法，无需人工标注

周大发表于 2024-11-2 14:21:38

上海交通大学、上海AI实验室、港中文等机构联合开发了MIA-DPO，这是一种用于大型视觉语言模型的多图像增强偏好对齐方法。MIA-DPO通过将单图像数据扩展到多图像数据，并设计了序列、网格拼贴和图中图三种数据格式，大幅降低了数据收集和标注成本。该方法通过基于注意力的选择机制自动过滤错误答案，无需依赖人工标注或昂贵API。实验结果显示，MIA-DPO在多个多图和单图基准测试中显著提升了模型的多图感知与推理能力，同时保持了单图理解能力。
来源：https://www.chinaz.com/feed/1102/1650896.shtml

页: [1]

靠浦ai课堂's Archiver

多图场景用DPO对齐，上海AI实验室等提出新方法，无需人工标注