周大 发表于 2024-9-28 14:38:45

从数据增强的隐藏作用出发,揭示视觉强化学习可塑性损失的独特机制

清华大学等机构研究显示,在深度强化学习中,Critic网络的可塑性损失是样本利用效率低下的关键原因。数据增强能显著提升性能,尤其是在训练早期阶段。研究揭示了数据增强在缓解可塑性损失方面的重要作用,并提出自适应回放比例方法。
来源:https://mp.weixin.qq.com/s/OqADRb3l2gBsDuxv1H1QeA
页: [1]
查看完整版本: 从数据增强的隐藏作用出发,揭示视觉强化学习可塑性损失的独特机制