清华团队强化学习多项突破推动具身智能

[复制链接]
周大 发表于 2025-1-17 13:50:25 | 显示全部楼层 |阅读模式
清华大学深度强化学习实验室近期取得多项突破性成果。团队开发的DSAC及DSAC-T算法有效解决了强化学习中的过估计问题,在基准测试中性能领先;DACER算法将扩散模型与在线强化学习结合,刷新了性能记录;RAD优化器从动力学视角出发,为训练稳定性提供了保障。这些成果将集成到开源软件GOPS中,推动具身智能的发展,应用于自动驾驶、物流机器人等多个领域。
来源:https://mp.weixin.qq.com/s/qHBKdXyOtF-nqKi4M9B2sA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 16:51 , Processed in 0.280433 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表