谷歌超硬核教科书来了！Jeff Dean带货揭Gemini训练秘籍：在TPU上scaling

周大发表于 2025-2-21 15:14:17

谷歌团队发布了《How to Scale Your Model》教科书，深入解析了大语言模型（LLM）在张量处理单元（TPU）上的扩展技术。该书由谷歌DeepMind科学家编写，旨在揭开LLM Scaling的神秘面纱，解释TPU工作原理及优化方法，以提高模型扩展效率，解决通信瓶颈问题。书中内容涵盖了从硬件到算法的各个方面，包括TPU/GPU工作原理、Transformer架构演化以及并行计算方案的选择等。作者表示，读完此书将能更好地理解如何为特定硬件平台选择最佳并行方案，并估算训练和推理耗时。Jeff Dean特别指出，书中还包含了谷歌最强AI模型Gemini训练的相关信息。
来源：https://mp.weixin.qq.com/s/__aYLXjE4Mk1H6gGcs1XSw

		自动登录	找回密码
密码			立即注册

课程导航

谷歌超硬核教科书来了！Jeff Dean带货揭Gemini训练秘籍：在TPU上scaling