GPT-4V仅达Level-2?全球首个多模态通才段位排行榜发布,General-Level打造多模态通用AI评测新范式
多模态大模型发展迅猛,ICML’25论文提出全新评测框架General-Level与General-Bench。前者通过五级段位体系评估模型协同能力,后者为超大规模基准,涵盖700多任务及32万+数据。配套Leaderboard系统多层次榜单设计,促进公平比较。目前最高段位为Level-4,Level-5暂未实现,引发社区热烈讨论。来源:https://mp.weixin.qq.com/s/SMh18jbBw7K32RsW8Yr6VA
页:
[1]