Prophet Arena评估AI预测能力,o3-mini靠“神押注”赚9倍,DeepSeek特立独行

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
芝加哥大学SIGMA Lab推出名为「Prophet Arena」的AI预测基准测试,通过真实世界事件评估AI的预测能力。该平台结合市场数据与AI推理,采用Brier分数和投资回报等指标评估模型表现。测试发现,预测准确度与收益并不完全相关,部分低准确度模型因捕捉市场偏差而获得高回报。不同AI模型在相同条件下展现出差异化“性格”,如Qwen3偏激进、Llama 4 Maverick更保守。OpenAI的o3-mini凭借精准识别高性价比下注机会,在回报率上领先。该平台旨在推动AI在预测领域的解释力与人机协作能力,助力高风险决策优化。
来源:https://mp.weixin.qq.com/s/KlH-hxJBbt6jB3T_05vcMw

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 06:50 , Processed in 0.277263 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表