周大 发表于 2025-4-17 14:43:55

从思考到行动:大模型自主工具调用能力的深度实现

复旦大学知识工场实验室推出开源项目SimpleGRPO,通过强化学习赋予大模型自主工具调用能力。研究发现,尽管当前主流模型具备深度思考能力,但基础问题上仍有不足,且现有工具调用方式受限于浅层模仿和强上下文依赖。SimpleGRPO采用“边想边干”和“专业分工”两种模式,使模型能够灵活调用工具并动态调整策略。实验显示,该技术显著提升了模型解决复杂问题的能力,并展现出强大的泛化性,为未来大模型的实际应用提供了重要参考。
来源:https://mp.weixin.qq.com/s/hjPf68M5qciZBc3zczctYQ
页: [1]
查看完整版本: 从思考到行动:大模型自主工具调用能力的深度实现