从思考到行动：大模型自主工具调用能力的深度实现

周大发表于 2025-4-17 14:43:55

复旦大学知识工场实验室推出开源项目SimpleGRPO，通过强化学习赋予大模型自主工具调用能力。研究发现，尽管当前主流模型具备深度思考能力，但基础问题上仍有不足，且现有工具调用方式受限于浅层模仿和强上下文依赖。SimpleGRPO采用“边想边干”和“专业分工”两种模式，使模型能够灵活调用工具并动态调整策略。实验显示，该技术显著提升了模型解决复杂问题的能力，并展现出强大的泛化性，为未来大模型的实际应用提供了重要参考。
来源：https://mp.weixin.qq.com/s/hjPf68M5qciZBc3zczctYQ

页: [1]

靠浦ai课堂's Archiver

从思考到行动：大模型自主工具调用能力的深度实现