AI可解释性研究:分歧与挑战并存
当前AI系统缺乏可解释性问题凸显,OpenAI升级ChatGPT引发性格变化便是例证。谷歌DeepMind决定减少对「机制可解释性」研究的关注,而Anthropic仍坚持此方向,其CEO对未来发展持乐观态度。机制可解释性研究旨在追踪模型思考过程,但DeepMind指出相关技术如稀疏自编码器存在诸多局限。过去十多年,尽管投入巨大,可解释性研究成果有限。有专家建议采用「自上而下」方式研究AI可解释性,而非聚焦底层机制。来源:https://mp.weixin.qq.com/s/h_BZaJVX_UFdNHrPXkakhw
页:
[1]