OpenAI发布MRCR基准测试挑战AI极限

周大发表于 2025-5-4 14:47:11

OpenAI发布MRCR基准测试，评估AI模型在超长上下文中的精确信息定位能力。GPT4.1具备1000万tokens的上下文窗口，但面对MRCR的高难度挑战（如区分多个相似目标），其性能仍受上下文长度和任务复杂度影响。MRCR不仅揭示了当前AI的能力边界，还将推动下一代更强大、更可靠的模型发展，促进AI技术的审慎应用与持续进步。
来源：https://mp.weixin.qq.com/s/8VBV4Dc_hdslYn-uk8ZEYA

页: [1]

靠浦ai课堂's Archiver

OpenAI发布MRCR基准测试挑战AI极限