周大 发表于 2024-6-10 15:41:53

Karpathy最新四小时视频教程:从零详解复现GPT-2全程

AI大牛Andrej Karpathy近期推出了一项长达4小时的视频教程,带领观众逐步复现GPT-2模型,涵盖网络架构、训练优化和超参数设定等全过程。教程详细到从零开始,最终能得到与GPT-3相似的模型。视频内容丰富,被比作流行歌手的新单曲发布,甚至激发了将其转化为Rap的创意。Karpathy还提供了完整的GitHub代码库供学习者跟踪进度。
来源:https://mp.weixin.qq.com/s/BI8EdDyTEk8meL_FhX-ftw
页: [1]
查看完整版本: Karpathy最新四小时视频教程:从零详解复现GPT-2全程