日本艺术家新图难倒众大模型，仅o3-Pro识别成功，或与其推理能力有关

周大发表于 2025-7-6 14:41:16

日本艺术家北冈秋吉创作的一幅视觉错位图需眯眼识别才可看出是《蒙娜丽莎》，这一挑战难倒了包括ChatGPT、Gemini、Grok及多个国产大模型。多数模型仅能识别图像轮廓或风格，却无法准确判断人物身份。其中o3-Pro成为少数成功识别的模型，推测因其具备更强的推理与图像处理能力。部分模型如GPT-4o在多次尝试与提示下“猜中”答案，但也被质疑为偶然。此次测试揭示当前大模型在处理视觉错觉任务上仍存在局限。
来源：https://mp.weixin.qq.com/s/rFXwoOq5jN-w0cLH47OCTw

页: [1]

靠浦ai课堂's Archiver

日本艺术家新图难倒众大模型，仅o3-Pro识别成功，或与其推理能力有关