悬赏800万的超难测试集，被GPT-4o实现新SOTA，准确率已达50%

周大发表于 2024-6-18 14:57:47

在一项旨在测试人工智能“智力”的图形推理挑战中，博主Ryan Greenblatt利用GPT-4o模型取得了突破，将先前的最高准确率从34%提高到50%，成为新纪录。这项由零代码SaaS平台Zapier和谷歌工程师发起的ARC Prize挑战，旨在评估大模型的通用人工智能能力，奖金丰厚，吸引了众多团队参与。尽管Ryan的方法开源，但由于规则限制，他可能无法获得奖金，但他的创新策略为AI研究提供了新思路。
来源：https://mp.weixin.qq.com/s/_H8oEsIx_zMRQaV_PIGGmw

页: [1]

靠浦ai课堂's Archiver

悬赏800万的超难测试集，被GPT-4o实现新SOTA，准确率已达50%