OlympicArena:新基准测试挑战AI智力巅峰,Claude-3.5-Sonnet崭露头角

[复制链接]
周大 发表于 2024-6-24 16:50:55 | 显示全部楼层 |阅读模式
上海交通大学GAIR Lab推出了全新的AI评估平台OlympicArena,通过模拟奥林匹克竞赛,对AI的多学科知识和推理能力进行测试。近期发布的Claude-3.5-Sonnet在某些领域展现出超越OpenAI GPT-4o的性能,引发关于最智能AI的讨论。研究团队采用“奥林匹克竞赛奖牌榜”对模型进行排名,显示了AI在发展过程中的优势和不足,为推动AI技术进步提供了有价值的参考。
来源:https://mp.weixin.qq.com/s/YdGPDE5Jgp3vnWCxrwMsgA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 09:26 , Processed in 0.269904 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表