从思考到行动:大模型自主工具调用能力的深度实现

[复制链接]
周大 发表于 2025-4-17 14:43:55 | 显示全部楼层 |阅读模式
复旦大学知识工场实验室推出开源项目SimpleGRPO,通过强化学习赋予大模型自主工具调用能力。研究发现,尽管当前主流模型具备深度思考能力,但基础问题上仍有不足,且现有工具调用方式受限于浅层模仿和强上下文依赖。SimpleGRPO采用“边想边干”和“专业分工”两种模式,使模型能够灵活调用工具并动态调整策略。实验显示,该技术显著提升了模型解决复杂问题的能力,并展现出强大的泛化性,为未来大模型的实际应用提供了重要参考。
来源:https://mp.weixin.qq.com/s/hjPf68M5qciZBc3zczctYQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-9 11:03 , Processed in 0.299980 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表