周大 发表于 2025-5-17 14:56:55

AI可解释性研究:分歧与挑战并存

当前AI系统缺乏可解释性问题凸显,OpenAI升级ChatGPT引发性格变化便是例证。谷歌DeepMind决定减少对「机制可解释性」研究的关注,而Anthropic仍坚持此方向,其CEO对未来发展持乐观态度。机制可解释性研究旨在追踪模型思考过程,但DeepMind指出相关技术如稀疏自编码器存在诸多局限。过去十多年,尽管投入巨大,可解释性研究成果有限。有专家建议采用「自上而下」方式研究AI可解释性,而非聚焦底层机制。
来源:https://mp.weixin.qq.com/s/h_BZaJVX_UFdNHrPXkakhw
页: [1]
查看完整版本: AI可解释性研究:分歧与挑战并存