图灵奖得主Sutton再突破:强化学习在控制问题上媲美深度强化学习?

[复制链接]
周大 发表于 2025-8-3 14:25:19 | 显示全部楼层 |阅读模式
Richard S. Sutton 及其团队近期提出强化学习新算法 Swift-Sarsa,旨在提升线性控制任务的性能。该算法基于 SwiftTD,融合步长优化与衰减机制,在新提出的“操作性条件反射基准”测试中表现出色,生命周期平均奖励接近最优值。研究显示,Swift-Sarsa 在参数鲁棒性和控制性能方面具有优势,结合预处理方法后可达到与深度强化学习相当的效果,为未来经验驱动型 AI 提供了新方向。
来源:https://mp.weixin.qq.com/s/I8IE8Ck-k5OoAy7SLqi9-Q

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 14:44 , Processed in 0.262047 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表