周大 发表于 2024-9-30 14:51:20

端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE

字节跳动ByteDance Research提出AGILE,一种基于强化学习的LLM Agent框架,具备记忆、工具使用及向专家求助等能力,并支持端到端训练。实验显示,AGILE框架下的Agent在复杂问答任务中表现优于GPT-4 Agent,特别是在ProductQA与MedMCQA任务上,准确率显著提高。
来源:https://mp.weixin.qq.com/s/cUXuXhfwP6--18DUJkA2dA
页: [1]
查看完整版本: 端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE