周大 发表于 2024-5-11 16:16:44

LLaVA-NeXT 升级,多模态能力逼近 GPT-4

LLaVA-NeXT研究团队发布新版本,借助 LLaMA-3 和 Qwen-1.5 提升多模态理解能力,达到接近 GPT-4 的水平。新模型在视觉对话功能上得到优化,并通过新基准 LLaVA-Bench(Wilder)测试日常生活场景,该模型以高效训练和开源特性引起关注。
来源:https://mp.weixin.qq.com/s/MvKm0u0uaCfFrxTi5ovsdQ
页: [1]
查看完整版本: LLaVA-NeXT 升级,多模态能力逼近 GPT-4