微调大模型,AMD MI300X就够了!跟着这篇博客微调Llama 3.1 405B,效果媲美H100

[复制链接]
周大 发表于 2024-10-8 14:50:52 | 显示全部楼层 |阅读模式
随着 AI 模型参数量激增,算力需求随之提升,Felafax 使用 8 张 AMD MI300X GPU 和 JAX 成功微调 LLaMA 3.1 405B 模型,训练速度达 35 tokens/秒。相比英伟达 H100,AMD GPU 性价比更高,JAX 支持多硬件并行,简化了非英伟达硬件上的模型训练流程,降低了训练成本。
来源:https://mp.weixin.qq.com/s/eJwg4GwH--9IVFedum_BnA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 01:15 , Processed in 0.279783 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表