Agent RL和智能体自我进化的关键一步: TaskCraft实现复杂智能体任务的自动生成

周大发表于 2025-7-4 15:05:54

OPPO 研究院针对当前智能体训练中高质量任务数据匮乏的问题，提出自动化任务生成框架 TaskCraft，并构建包含约 41,000 条任务的开源数据集。TaskCraft 支持原子任务生成与深度/宽度拓展，结合 Prompt Learning 显著提升生成效率，实验显示其生成任务通过率提高、验证更快、工具调用更稳定。基于该数据集对模型进行监督微调后，性能平均提升 14%，并适用于强化学习训练。这一成果为通用智能体的发展提供了坚实基础。
来源：https://mp.weixin.qq.com/s/7OhnAVFxguFZzkkqSEZx5g

页: [1]

靠浦ai课堂's Archiver

Agent RL和智能体自我进化的关键一步: TaskCraft实现复杂智能体任务的自动生成