通义实验室发布WebDancer:突破数据与训练瓶颈,打造自主Deep Research智能体
WebDancer 是一款致力于解决信息检索领域中高质量训练数据稀缺和开放环境训练复杂问题的新型智能体。它通过 CRAWLQA 和 E2HQA 两种数据合成策略生成高质量训练数据,并结合 ReAct 框架内化 agentic 能力。其两阶段训练策略(SFT 和 RL)显著提升了性能,尤其在 GAIA 和 WebWalkerQA 数据集上的表现超越了 GPT-4o 等基线模型。实验表明,WebDancer 在复杂任务中展现了强大的泛化能力和鲁棒性。未来,WebDancer 将集成更多工具,扩展至长文本写作任务,并进一步探索开源 agent 模型的潜力,为自主智能体的发展开辟新路径。来源:https://mp.weixin.qq.com/s/D9cV_T6pZrXBwHKMij7e1g
页:
[1]