7个月翻一番!AI agent能力飙升,METR报告揭示指数级进化规律
非营利研究机构METR最新报告指出,AI agent的能力呈现出类似“摩尔定律”的指数级增长趋势,在9项涵盖编程、数学、自动驾驶等领域的基准测试中,其可完成任务的time horizon平均每7个月翻一番,部分任务甚至每2-6个月即翻倍。当前agent已能完成人类需50–200分钟处理的任务,某些前沿模型(如o3)的增长速度更快。尽管自动驾驶等任务提升较慢,整体趋势显示AI正朝着更长时程、更强规划能力方向快速发展,预示未来可能胜任“几天→几周”级别的复杂任务。来源:https://mp.weixin.qq.com/s/_QbX2uz6ZpN6-vCQdbPPIA
页:
[1]