Richard Sutton 和 Andrew Barto 因为在强化学习领域的奠基性贡献荣获2024年图灵奖。自1980年代起,两人合作引入了强化学习的核心理念,并开发了关键算法。他们的著作《Reinforcement Learning: An Introduction》至今被引用超过75,000次。Sutton 认为强化学习能让机器通过试错从经验中学习,而大语言模型(LLM)仅依赖历史数据生成回应,缺乏认知能力。强化学习已在AlphaGo等项目中取得重大突破,应用广泛,涵盖机器人运动技能学习、网络拥塞控制等多个领域。图灵奖被誉为“计算机领域的诺贝尔奖”,奖金100万美元,由谷歌提供资金支持。
来源:https://mp.weixin.qq.com/s/VbEurkBIcl82kVGW0FHJJA