周大 发表于 2025-8-31 13:54:56

AI智能体是否能预测未来?字节跳动seed发布FutureX动态评测基准

字节跳动与多所高校联合推出 FutureX 动态评测平台,用于测试 AI 预测未来事件的能力。该平台每周从全球 195 多个信息源中自动生成约 500 个预测任务,涵盖经济、科技、体育等领域,并自动评估 AI 模型在事件发生前的预测准确率。数据显示,Grok-4 暂列榜首,但其在高难度任务中准确率仍不足 20%,AI 整体表现仍落后于人类专家。研究指出,预测未来需结合搜索与推理,且面临信息不确定等挑战。FutureX 旨在推动 AI 向更高级的智能方向发展。
来源:https://mp.weixin.qq.com/s/O10duXkDh_FEq3JjRJN-ng
页: [1]
查看完整版本: AI智能体是否能预测未来?字节跳动seed发布FutureX动态评测基准