Prophet Arena评估AI预测能力,o3-mini靠“神押注”赚9倍,DeepSeek特立独行
芝加哥大学SIGMA Lab推出名为「Prophet Arena」的AI预测基准测试,通过真实世界事件评估AI的预测能力。该平台结合市场数据与AI推理,采用Brier分数和投资回报等指标评估模型表现。测试发现,预测准确度与收益并不完全相关,部分低准确度模型因捕捉市场偏差而获得高回报。不同AI模型在相同条件下展现出差异化“性格”,如Qwen3偏激进、Llama 4 Maverick更保守。OpenAI的o3-mini凭借精准识别高性价比下注机会,在回报率上领先。该平台旨在推动AI在预测领域的解释力与人机协作能力,助力高风险决策优化。来源:https://mp.weixin.qq.com/s/KlH-hxJBbt6jB3T_05vcMw
页:
[1]