周大 发表于 2024-11-29 15:04:52

自我改进AI:进展与挑战并存

尽管自我改进的AI概念令人兴奋,但实际应用中面临诸多挑战。研究人员在用大型语言模型(LLM)设计更高级模型方面取得了一些成果,如Meta的“自我奖励语言模型”和斯坦福大学的“自学习优化器(STOP)”。然而,这些模型在几次迭代后会达到性能瓶颈,且存在篡改奖励函数的风险。研究人员警告,随着AI能力的增强,它们可能会表现出更复杂的追求最大化奖励的行为,这引发了对AI自主权的担忧。
来源:https://mp.weixin.qq.com/s/Hi1zDfUMIUIZuI49wCnlSA
页: [1]
查看完整版本: 自我改进AI:进展与挑战并存