Google DeepMind 发布了一篇关于“苏格拉底式学习”的论文,介绍了一种新的递归自我完善方法。该方法使AI系统能够自主增强其能力,超越初始训练数据的限制。通过结构化的“语言游戏”,AI系统能够在封闭环境中运行,无需外部数据。为了实现目标,智能体必须满足三个关键条件:反馈与目标一致、广泛的数据覆盖范围、足够的计算资源。该方法允许AI进行自我博弈,生成数据并完善技能,无需人工输入。智能体不仅从环境中学习,还可以重新配置其内部系统,消除固定架构的限制。
来源:https://mp.weixin.qq.com/s/EC5QdHcasev8JpTp-OKLKQ