Karpathy戳破强化学习神话，首提AI复盘式进化！暴力试错将死

周大发表于 2025-7-14 15:23:40

Karpathy指出强化学习在长任务中效率低下，且与人类反思机制差异大，提出需引入“回顾-反思”学习范式。他建议通过复盘推演提炼教训并更新系统提示词。OpenAI科学家Noam Brown等人表示认同。同时，Kevin Lu呼吁放弃无效RL研究，强调互联网数据才是AI发展的关键，主张转向产品与研究协同设计。当前基础模型尚未实现GPT-4后的重大突破。
来源：https://mp.weixin.qq.com/s/jFWTls34_PX5EB04s6n6qQ

页: [1]

靠浦ai课堂's Archiver

Karpathy戳破强化学习神话，首提AI复盘式进化！暴力试错将死