DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍
Colossal-AI发布开源大模型后训练工具箱,已收获近4万GitHub星标。该工具箱支持671B参数的DeepSeek V3/R1低成本微调,提供完整的强化学习工具链及灵活配置接口,兼容英伟达GPU和华为昇腾NPU等多种硬件。通过LoRA优化等技术,最低硬件要求降低近10倍,并支持多种并行策略配置。此外,还提供了强化学习微调蒸馏版DeepSeek的解决方案,助力开发者低成本快速构建私有模型,提升业务竞争力与价值。来源:https://mp.weixin.qq.com/s/ywJAbcjXPef1RazHj1HIjg
页:
[1]