字节Seed联合哥大推FinSearchComp基准,马斯克转发,AI金融分析尚存短板
字节跳动与哥伦比亚大学推出首个开源金融搜索推理基准FinSearchComp,涵盖635个专家设计问题,评测显示最优AI模型在全球数据集准确率仅68.9%,距人类专家仍有差距,大中华区差距更大。研究揭示搜索能力是关键,配备网络搜索或金融插件显著提升性能,但现有AI仍难胜任复杂金融任务,凸显建立行业级评估体系的重要性。来源:https://mp.weixin.qq.com/s/08GCdomcJulDHqswLW-66Q
页:
[1]