魔搭社区推出高效GRPO训练解决方案
ModelScope魔搭社区针对GRPO训练难题,推出基于MS-SWIFT训练框架和EvalScope评估框架的完整解决方案。该方案通过多实例数据并行采样、异步采样等技术优化,有效解决了现有方案训练速度慢、集群配置复杂等问题。实验结果显示,SWIFT框架在八卡环境下的训练效率显著优于其他框架。此外,SWIFT还支持多模态GRPO训练,EvalScope则提供了全面的大模型评测工具。这些创新为开发者提供了更高效、易用的RL训练方案。来源:https://mp.weixin.qq.com/s/mnVuIyBLFHfjskSI__hdCQ
页:
[1]