率先解决多类数据同时受损,中科大MIRA团队TRACER入选NeurIPS 2024:强鲁棒性的离线变分贝叶斯强化学习

[复制链接]
周大 发表于 2024-11-16 13:47:24 | 显示全部楼层 |阅读模式
中科大王杰教授团队提出了一种新的鲁棒变分贝叶斯推断方法TRACER,专门解决离线强化学习数据集中的多类数据损坏问题。该方法通过引入基于熵的不确定性度量,能够区分和减弱损坏数据的影响,提升智能体在干净环境中的表现。实验结果显示,TRACER在机器人控制和自动驾驶仿真环境中显著提高了智能体的鲁棒性,性能提升幅度达21.1%。
来源:https://mp.weixin.qq.com/s/HMDSXM9kWQK_GD2P56nIVQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-27 00:29 , Processed in 0.281040 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表