Karpathy戳破强化学习神话,首提AI复盘式进化!暴力试错将死

[复制链接]
周大 发表于 2025-7-14 15:23:40 | 显示全部楼层 |阅读模式
Karpathy指出强化学习在长任务中效率低下,且与人类反思机制差异大,提出需引入“回顾-反思”学习范式。他建议通过复盘推演提炼教训并更新系统提示词。OpenAI科学家Noam Brown等人表示认同。同时,Kevin Lu呼吁放弃无效RL研究,强调互联网数据才是AI发展的关键,主张转向产品与研究协同设计。当前基础模型尚未实现GPT-4后的重大突破。
来源:https://mp.weixin.qq.com/s/jFWTls34_PX5EB04s6n6qQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 18:51 , Processed in 0.294605 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表