LMArena排名公正性遭多方质疑
大模型排行榜LMArena因被指控排名遭大公司操纵而引发争议。斯坦福、MIT等机构研究者联合发布论文,指出少数公司通过私下测试机制过度优化排名,导致榜单失真。AI大佬Karpathy也质疑其公正性,并推荐OpenRouter作为替代平台。LMArena官方迅速回应,否认指控并提出改进措施以恢复透明性和公平性。数据显示,闭源模型在LMArena中占据更多数据优势,进一步加剧了对平台公正性的担忧。来源:https://mp.weixin.qq.com/s/vYDyMsT1Z8UJQhtYFc76Fw
页:
[1]