Agent RL和智能体自我进化的关键一步: TaskCraft实现复杂智能体任务的自动生成
OPPO 研究院针对当前智能体训练中高质量任务数据匮乏的问题,提出自动化任务生成框架 TaskCraft,并构建包含约 41,000 条任务的开源数据集。TaskCraft 支持原子任务生成与深度/宽度拓展,结合 Prompt Learning 显著提升生成效率,实验显示其生成任务通过率提高、验证更快、工具调用更稳定。基于该数据集对模型进行监督微调后,性能平均提升 14%,并适用于强化学习训练。这一成果为通用智能体的发展提供了坚实基础。来源:https://mp.weixin.qq.com/s/7OhnAVFxguFZzkkqSEZx5g
页:
[1]