率先解决多类数据同时受损,中科大MIRA团队TRACER入选NeurIPS 2024:强鲁棒性的离线变分贝叶斯强化学习
中科大王杰教授团队提出了一种新的鲁棒变分贝叶斯推断方法TRACER,专门解决离线强化学习数据集中的多类数据损坏问题。该方法通过引入基于熵的不确定性度量,能够区分和减弱损坏数据的影响,提升智能体在干净环境中的表现。实验结果显示,TRACER在机器人控制和自动驾驶仿真环境中显著提高了智能体的鲁棒性,性能提升幅度达21.1%。来源:https://mp.weixin.qq.com/s/HMDSXM9kWQK_GD2P56nIVQ
页:
[1]