Karpathy戳破强化学习神话,首提AI复盘式进化!暴力试错将死
Karpathy指出强化学习在长任务中效率低下,且与人类反思机制差异大,提出需引入“回顾-反思”学习范式。他建议通过复盘推演提炼教训并更新系统提示词。OpenAI科学家Noam Brown等人表示认同。同时,Kevin Lu呼吁放弃无效RL研究,强调互联网数据才是AI发展的关键,主张转向产品与研究协同设计。当前基础模型尚未实现GPT-4后的重大突破。来源:https://mp.weixin.qq.com/s/jFWTls34_PX5EB04s6n6qQ
页:
[1]