Prophet Arena评估AI预测能力，o3-mini靠“神押注”赚9倍，DeepSeek特立独行

周大发表于 2025-8-18 14:16:41

芝加哥大学SIGMA Lab推出名为「Prophet Arena」的AI预测基准测试，通过真实世界事件评估AI的预测能力。该平台结合市场数据与AI推理，采用Brier分数和投资回报等指标评估模型表现。测试发现，预测准确度与收益并不完全相关，部分低准确度模型因捕捉市场偏差而获得高回报。不同AI模型在相同条件下展现出差异化“性格”，如Qwen3偏激进、Llama 4 Maverick更保守。OpenAI的o3-mini凭借精准识别高性价比下注机会，在回报率上领先。该平台旨在推动AI在预测领域的解释力与人机协作能力，助力高风险决策优化。
来源：https://mp.weixin.qq.com/s/KlH-hxJBbt6jB3T_05vcMw

页: [1]

靠浦ai课堂's Archiver

Prophet Arena评估AI预测能力，o3-mini靠“神押注”赚9倍，DeepSeek特立独行