周大 发表于 2025-1-6 15:15:02

GPT-4o最自私,Claude更慷慨!DeepMind发布全新「AI道德测试」

Google DeepMind研究发现,在模拟人类合作行为的捐赠者游戏中,不同LLM智能体表现出显著差异。Claude 3.5展现出更强的合作能力和惩罚搭便车行为的能力,而Gemini 1.5 Flash和GPT-4o则表现较为自私。该研究通过10代迭代实验,揭示了LLM智能体在资源分配中的策略演变,对构建未来人机协同社会具有重要启示意义。研究表明,初始合作条件对智能体进化路径有重要影响,为评估大模型的社会适应性提供了新视角。
来源:https://mp.weixin.qq.com/s/xFHgenDh-7HuemaUAh_wHg
页: [1]
查看完整版本: GPT-4o最自私,Claude更慷慨!DeepMind发布全新「AI道德测试」