上交联合美团发布TokenIT/TokenFD/TokenVL三大成果

[复制链接]
周大 发表于 2025-3-18 14:11:08 | 显示全部楼层 |阅读模式
上海交通大学联合美团推出三大核心成果——TokenIT数据集、TokenFD基座和TokenVL模型,填补了细粒度图文对齐领域的空白。TokenIT作为首个token级图文数据集,包含2000万图像和18亿Token-Mask对,规模远超现有数据集。TokenFD通过简化token embedding层实现图像与语言token的共享特征空间,大幅提升文本分割、理解及检索性能。TokenVL进一步打通模态GAP,显著提升多模态大模型在OCR、文档解析等任务中的表现,为商业化应用提供了新可能。
来源:https://mp.weixin.qq.com/s/dL9wH2XAktxnupl5-K73Aw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-6 00:08 , Processed in 0.301791 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表