DIAMOND智能体在Atari测试中超越人类玩家
日内瓦大学和爱丁堡大学的研究团队开发了一种名为DIAMOND的新型强化学习智能体,该智能体在扩散模型构建的虚拟世界中进行训练,显著提高了学习效率。在Atari 100k基准测试中,DIAMOND的平均得分达到1.46的人类标准化分数,超越了人类玩家的表现。研究团队通过改善视觉细节,使用U-Net结构和自适应组归一化技术,进一步提升了智能体的性能。DIAMOND在《阿斯特里克斯》、《打砖块》和《公路赛跑者》等游戏中表现出色,证明了其在复杂环境中的决策能力。来源:https://mp.weixin.qq.com/s/_y25jjsP2jjJcN7N6MtiRw
页:
[1]