GPT-4V仅达Level-2？全球首个多模态通才段位排行榜发布，General-Level打造多模态通用AI评测新范式

周大发表于 2025-5-16 14:01:19

多模态大模型发展迅猛，ICML’25论文提出全新评测框架General-Level与General-Bench。前者通过五级段位体系评估模型协同能力，后者为超大规模基准，涵盖700多任务及32万+数据。配套Leaderboard系统多层次榜单设计，促进公平比较。目前最高段位为Level-4，Level-5暂未实现，引发社区热烈讨论。
来源：https://mp.weixin.qq.com/s/SMh18jbBw7K32RsW8Yr6VA

页: [1]

靠浦ai课堂's Archiver

GPT-4V仅达Level-2？全球首个多模态通才段位排行榜发布，General-Level打造多模态通用AI评测新范式