英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升

[复制链接]
周大 发表于 2024-9-24 15:24:31 | 显示全部楼层 |阅读模式
英伟达推出的NVLM 1.0系列多模态大模型在视觉语言任务上表现优异,与GPT-4o等模型相媲美,并在文本数学和编码基准测试中平均准确率提高4.3个百分点。该模型通过引入1-D图块标签设计,提升了多模态推理和OCR任务性能,并在多模态训练中整合高质量纯文本数据集,增强数学和编码能力。
来源:https://mp.weixin.qq.com/s/Q0SItplR2Ok2_0RhBLMxiA

学员登陆|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2024-12-23 12:24 , Processed in 0.273629 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表