谷歌Gemini 2.5 Pro通关《宝可梦蓝》,发现30年游戏Bug并展现复杂任务解决能力
谷歌发布的Gemini 2.5系列大模型技术报告详细记录了AI在《宝可梦蓝》中的表现。AI展现了惊人的创造力和长期规划能力,例如利用“飞行”技能逃脱死循环、调整队伍击败道馆馆主,并成功完成多项复杂任务,包括获取隐藏技能和解决迷宫难题。然而,AI也暴露出“恐慌”状态、幻觉问题和思维定势等局限性。整个项目始于Twitch直播间,Gemini 2.5 Pro耗时831小时首次通关,第二次通关时间缩短至一半。目前,Gemini 2.5 Pro正挑战《宝可梦黄》原版困难模式,同时Claude 4也加入比赛,引发关注。来源:https://mp.weixin.qq.com/s/fOGbijWnqEloziC3TISz_w
页:
[1]