阿里巴巴开源WebAgent AI智能体:端到端自主搜索与多步推理能力
阿里巴巴近日在 Github 开源了自主搜索 AI Agent——WebAgent,其具备强大的信息检索与多步推理能力,可为用户提供精准的研究报告。WebAgent 包含 WebDancer 和 WebWalker 两部分,前者作为智能体训练框架,通过数据构建、短/长推理、监督微调及强化学习等环节逐步优化性能,后者则用于 LLM 基准测试。其中,强化学习阶段的 DAPO 算法显著提升了数据效率与策略鲁棒性,助力智能体在复杂任务中做出最优决策。这一技术突破为信息检索领域带来了新的可能性。来源:https://tech.ifeng.com/c/8jlj3lcVjbR
页:
[1]