周大 发表于 2025-7-6 14:41:16

日本艺术家新图难倒众大模型,仅o3-Pro识别成功,或与其推理能力有关

日本艺术家北冈秋吉创作的一幅视觉错位图需眯眼识别才可看出是《蒙娜丽莎》,这一挑战难倒了包括ChatGPT、Gemini、Grok及多个国产大模型。多数模型仅能识别图像轮廓或风格,却无法准确判断人物身份。其中o3-Pro成为少数成功识别的模型,推测因其具备更强的推理与图像处理能力。部分模型如GPT-4o在多次尝试与提示下“猜中”答案,但也被质疑为偶然。此次测试揭示当前大模型在处理视觉错觉任务上仍存在局限。
来源:https://mp.weixin.qq.com/s/rFXwoOq5jN-w0cLH47OCTw
页: [1]
查看完整版本: 日本艺术家新图难倒众大模型,仅o3-Pro识别成功,或与其推理能力有关