4w Star!一个低成本微调DeepSeek的开源方案,悄悄火了
Colossal-AI发布开源大模型后训练工具箱,针对DeepSeek V3/R1 671B模型提供低成本微调方案。该工具箱包含完整的强化学习工具链,兼容多种硬件,并支持混合精度训练和灵活配置。通过LoRA优化,最低硬件要求降低近10倍。此外,还提供强化学习微调蒸馏版DeepSeek解决方案,助力开发者基于开源模型快速构建高质量私有模型,提升业务竞争力与价值。来源:https://mp.weixin.qq.com/s/9gW6SP2Jnk9_WJxRAn8VWQ
页:
[1]