LMArena排名公正性遭多方质疑

周大发表于 2025-5-1 14:21:10

大模型排行榜LMArena因被指控排名遭大公司操纵而引发争议。斯坦福、MIT等机构研究者联合发布论文，指出少数公司通过私下测试机制过度优化排名，导致榜单失真。AI大佬Karpathy也质疑其公正性，并推荐OpenRouter作为替代平台。LMArena官方迅速回应，否认指控并提出改进措施以恢复透明性和公平性。数据显示，闭源模型在LMArena中占据更多数据优势，进一步加剧了对平台公正性的担忧。
来源：https://mp.weixin.qq.com/s/vYDyMsT1Z8UJQhtYFc76Fw

页: [1]

靠浦ai课堂's Archiver

LMArena排名公正性遭多方质疑