DIAMOND智能体在Atari测试中超越人类玩家

[复制链接]
周大 发表于 2024-11-18 13:56:46 | 显示全部楼层 |阅读模式
日内瓦大学和爱丁堡大学的研究团队开发了一种名为DIAMOND的新型强化学习智能体,该智能体在扩散模型构建的虚拟世界中进行训练,显著提高了学习效率。在Atari 100k基准测试中,DIAMOND的平均得分达到1.46的人类标准化分数,超越了人类玩家的表现。研究团队通过改善视觉细节,使用U-Net结构和自适应组归一化技术,进一步提升了智能体的性能。DIAMOND在《阿斯特里克斯》、《打砖块》和《公路赛跑者》等游戏中表现出色,证明了其在复杂环境中的决策能力。
来源:https://mp.weixin.qq.com/s/_y25jjsP2jjJcN7N6MtiRw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-16 22:36 , Processed in 0.300867 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表