周大 发表于 2024-6-12 15:12:49

复旦字节强强联手,量身定制多模态思维链,让7B模型全面超越GPT-4V

复旦大学和字节跳动的研究人员为解决多模态大模型在复杂任务中的局限,提出了一种名为 VoCoT 的新推理框架。VoCoT 侧重于以对象为中心的多步骤推理,增强了模型处理模态差异的能力。基于这一框架,他们构建了 VolCano 模型,该模型在7B参数规模下,在多项基准测试中表现出色,超越了当前的 SOTA 模型 GPT-4V,展示了在复杂推理任务上的卓越性能。
来源:https://mp.weixin.qq.com/s/Co5PV5fGS85XV7-NHWdzoA
页: [1]
查看完整版本: 复旦字节强强联手,量身定制多模态思维链,让7B模型全面超越GPT-4V