周大 发表于 2025-1-17 13:50:25

清华团队强化学习多项突破推动具身智能

清华大学深度强化学习实验室近期取得多项突破性成果。团队开发的DSAC及DSAC-T算法有效解决了强化学习中的过估计问题,在基准测试中性能领先;DACER算法将扩散模型与在线强化学习结合,刷新了性能记录;RAD优化器从动力学视角出发,为训练稳定性提供了保障。这些成果将集成到开源软件GOPS中,推动具身智能的发展,应用于自动驾驶、物流机器人等多个领域。
来源:https://mp.weixin.qq.com/s/qHBKdXyOtF-nqKi4M9B2sA
页: [1]
查看完整版本: 清华团队强化学习多项突破推动具身智能