微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B,效果媲美H100
随着 AI 模型参数量激增,算力需求随之提升,Felafax 使用 8 张 AMD MI300X GPU 和 JAX 成功微调 LLaMA 3.1 405B 模型,训练速度达 35 tokens/秒。相比英伟达 H100,AMD GPU 性价比更高,JAX 支持多硬件并行,简化了非英伟达硬件上的模型训练流程,降低了训练成本。来源:https://mp.weixin.qq.com/s/eJwg4GwH--9IVFedum_BnA
页:
[1]