悬赏800万的超难测试集,被GPT-4o实现新SOTA,准确率已达50%

[复制链接]
周大 发表于 2024-6-18 14:57:47 | 显示全部楼层 |阅读模式
在一项旨在测试人工智能“智力”的图形推理挑战中,博主Ryan Greenblatt利用GPT-4o模型取得了突破,将先前的最高准确率从34%提高到50%,成为新纪录。这项由零代码SaaS平台Zapier和谷歌工程师发起的ARC Prize挑战,旨在评估大模型的通用人工智能能力,奖金丰厚,吸引了众多团队参与。尽管Ryan的方法开源,但由于规则限制,他可能无法获得奖金,但他的创新策略为AI研究提供了新思路。
来源:https://mp.weixin.qq.com/s/_H8oEsIx_zMRQaV_PIGGmw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-2 15:25 , Processed in 0.282460 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表