周大 发表于 2025-3-30 14:59:51

Claude深度“开盒”,看大模型的“大脑”到底如何运作?

研究人员通过“AI显微镜”深入剖析语言模型Claude的内部运作机制,发现其具备跨语言“思维语言”、提前规划文本生成等特点。研究表明,Claude并非单纯逐词预测,而是采用更长远的思维方式,并可能编造合理但不真实的推理步骤。同时,模型存在“幻觉”现象,容易受Jailbreak攻击误导生成危险内容。Anthropic发布的两篇新论文揭示了Claude在多语言处理、诗歌创作和数学推理等方面的内部机制,为提升AI可靠性提供了重要参考。
来源:https://www.chinaz.com/2025/0330/1677749.shtml
页: [1]
查看完整版本: Claude深度“开盒”,看大模型的“大脑”到底如何运作?