312条轨迹激发241%性能!上交大与SII开源电脑智能体,超越 Claude 3.7
上海交通大学与 SII 团队提出新方法,仅用312条人类轨迹结合Claude 3.7 Sonnet合成动作决策,训练出性能提升241%的PC Agent-E。该模型成为Windows系统上的新一代SOTA,展现极高样本效率。研究证明,少量高质量轨迹配合“轨迹增强”技术,可显著激发智能体长程推理能力,降低数据需求并提升泛化性能。来源:https://mp.weixin.qq.com/s/lpz9JgEdrLTWah_68HHJ9w
页:
[1]