微调大模型，AMD MI300X就够了！跟着这篇博客微调Llama 3.1 405B，效果媲美H100

周大发表于 2024-10-8 14:50:52

随着 AI 模型参数量激增，算力需求随之提升，Felafax 使用 8 张 AMD MI300X GPU 和 JAX 成功微调 LLaMA 3.1 405B 模型，训练速度达 35 tokens/秒。相比英伟达 H100，AMD GPU 性价比更高，JAX 支持多硬件并行，简化了非英伟达硬件上的模型训练流程，降低了训练成本。
来源：https://mp.weixin.qq.com/s/eJwg4GwH--9IVFedum_BnA

页: [1]

靠浦ai课堂's Archiver

微调大模型，AMD MI300X就够了！跟着这篇博客微调Llama 3.1 405B，效果媲美H100