通义 DeepResearch 推出全新开源 AI 研究代理模型 30B-A3B,在 Humanity's Last Exam、BrowseComp 等多项 Deep Research 基准测试中达到 SOTA,性能超越海外闭源模型。该模型依托全合成数据策略、Agentic 增量预训练与强化学习闭环训练体系,在 ReAct 与新型 IterResearch 推理模式下展现强大复杂任务处理能力。团队同步开源模型、框架与方法论,并已将其应用于高德地图与法律智能体“通义法睿”,标志着深度研究型 AI 向普惠化迈出关键一步。
来源:https://mp.weixin.qq.com/s/XLpRvvpG7XPX1GmpwG3BMQ