Search版o1:推理过程会主动查资料,整体性能优于人类专家,清华人大出品
人大和清华联合推出的「Agentic搜索增强推理模型框架」Search-o1,在博士级别科学问答、数学和代码能力的11项评测中,取得10个第一。该框架针对现有推理模型“知识不足”问题,通过暂停推理并搜索缺失知识,再继续推理的方式,显著提升了推理模型的可靠性和适用性。核心技术包括RAG和Reason-in-Documents模块,确保推理过程连贯且逻辑一致。实验结果显示,Search-o1在复杂推理任务和多跳QA任务中表现优异,尤其在多跳QA任务上平均准确率提升了近30%。目前,该项目已开源,可从GitHub和抱抱脸获取。来源:https://mp.weixin.qq.com/s/J_n5cn_Zp4lRs8ESqFEFmg
页:
[1]