AI智能体是否能预测未来?字节跳动seed发布FutureX动态评测基准

[复制链接]
周大 发表于 2025-8-31 13:54:56 | 显示全部楼层 |阅读模式
字节跳动与多所高校联合推出 FutureX 动态评测平台,用于测试 AI 预测未来事件的能力。该平台每周从全球 195 多个信息源中自动生成约 500 个预测任务,涵盖经济、科技、体育等领域,并自动评估 AI 模型在事件发生前的预测准确率。数据显示,Grok-4 暂列榜首,但其在高难度任务中准确率仍不足 20%,AI 整体表现仍落后于人类专家。研究指出,预测未来需结合搜索与推理,且面临信息不确定等挑战。FutureX 旨在推动 AI 向更高级的智能方向发展。
来源:https://mp.weixin.qq.com/s/O10duXkDh_FEq3JjRJN-ng

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 18:36 , Processed in 0.287857 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表