周大 发表于 2024-6-18 14:57:47

悬赏800万的超难测试集,被GPT-4o实现新SOTA,准确率已达50%

在一项旨在测试人工智能“智力”的图形推理挑战中,博主Ryan Greenblatt利用GPT-4o模型取得了突破,将先前的最高准确率从34%提高到50%,成为新纪录。这项由零代码SaaS平台Zapier和谷歌工程师发起的ARC Prize挑战,旨在评估大模型的通用人工智能能力,奖金丰厚,吸引了众多团队参与。尽管Ryan的方法开源,但由于规则限制,他可能无法获得奖金,但他的创新策略为AI研究提供了新思路。
来源:https://mp.weixin.qq.com/s/_H8oEsIx_zMRQaV_PIGGmw
页: [1]
查看完整版本: 悬赏800万的超难测试集,被GPT-4o实现新SOTA,准确率已达50%