周大 发表于 2025-4-20 15:06:56

AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据

德州大学奥斯汀分校研究团队利用Transformer和离线强化学习技术,打造了一个无需规则或启发式算法的宝可梦AI智能体。该AI通过47.5万场人类对战回放数据进行训练,成功在复杂策略游戏中达到顶尖水平,并在全球Pokémon Showdown天梯排名中跻身前10%。研究结合行为克隆、强化学习及大模型训练方法,证明了数据驱动方式在游戏AI领域的潜力,为未来解决更复杂的现实任务提供了新思路。
来源:https://mp.weixin.qq.com/s/Tjf3r-w9hVy_5Y6l2laAaA
页: [1]
查看完整版本: AI版本宝可梦冲榜上全球前10%!一次性「吃掉」10年47.5万场人类对战数据