周大 发表于 5 天前

OpenAI发布MRCR基准测试挑战AI极限

OpenAI发布MRCR基准测试,评估AI模型在超长上下文中的精确信息定位能力。GPT4.1具备1000万tokens的上下文窗口,但面对MRCR的高难度挑战(如区分多个相似目标),其性能仍受上下文长度和任务复杂度影响。MRCR不仅揭示了当前AI的能力边界,还将推动下一代更强大、更可靠的模型发展,促进AI技术的审慎应用与持续进步。
来源:https://mp.weixin.qq.com/s/8VBV4Dc_hdslYn-uk8ZEYA
页: [1]
查看完整版本: OpenAI发布MRCR基准测试挑战AI极限