AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据

[复制链接]
周大 发表于 2025-4-20 15:06:56 | 显示全部楼层 |阅读模式
德州大学奥斯汀分校研究团队利用Transformer和离线强化学习技术,打造了一个无需规则或启发式算法的宝可梦AI智能体。该AI通过47.5万场人类对战回放数据进行训练,成功在复杂策略游戏中达到顶尖水平,并在全球Pokémon Showdown天梯排名中跻身前10%。研究结合行为克隆、强化学习及大模型训练方法,证明了数据驱动方式在游戏AI领域的潜力,为未来解决更复杂的现实任务提供了新思路。
来源:https://mp.weixin.qq.com/s/Tjf3r-w9hVy_5Y6l2laAaA

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-30 22:36 , Processed in 0.284150 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表