周大 发表于 2025-5-16 14:01:19

GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式

多模态大模型发展迅猛,ICML’25论文提出全新评测框架General-Level与General-Bench。前者通过五级段位体系评估模型协同能力,后者为超大规模基准,涵盖700多任务及32万+数据。配套Leaderboard系统多层次榜单设计,促进公平比较。目前最高段位为Level-4,Level-5暂未实现,引发社区热烈讨论。
来源:https://mp.weixin.qq.com/s/SMh18jbBw7K32RsW8Yr6VA
页: [1]
查看完整版本: GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式