Karpathy最新四小时视频教程:从零详解复现GPT-2全程

[复制链接]
周大 发表于 2024-6-10 15:41:53 | 显示全部楼层 |阅读模式
AI大牛Andrej Karpathy近期推出了一项长达4小时的视频教程,带领观众逐步复现GPT-2模型,涵盖网络架构、训练优化和超参数设定等全过程。教程详细到从零开始,最终能得到与GPT-3相似的模型。视频内容丰富,被比作流行歌手的新单曲发布,甚至激发了将其转化为Rap的创意。Karpathy还提供了完整的GitHub代码库供学习者跟踪进度。
来源:https://mp.weixin.qq.com/s/BI8EdDyTEk8meL_FhX-ftw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 15:35 , Processed in 0.310897 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表