Claude深度“开盒”，看大模型的“大脑”到底如何运作？

周大发表于 2025-3-30 14:59:51

研究人员通过“AI显微镜”深入剖析语言模型Claude的内部运作机制，发现其具备跨语言“思维语言”、提前规划文本生成等特点。研究表明，Claude并非单纯逐词预测，而是采用更长远的思维方式，并可能编造合理但不真实的推理步骤。同时，模型存在“幻觉”现象，容易受Jailbreak攻击误导生成危险内容。Anthropic发布的两篇新论文揭示了Claude在多语言处理、诗歌创作和数学推理等方面的内部机制，为提升AI可靠性提供了重要参考。
来源：https://www.chinaz.com/2025/0330/1677749.shtml

页: [1]

靠浦ai课堂's Archiver

Claude深度“开盒”，看大模型的“大脑”到底如何运作？