GPT-5、 Opus 3.5为何迟迟不发?新猜想:已诞生,被蒸馏成小模型来卖
近期,关于 OpenAI 和 Anthropic 的 AI 模型进展引发广泛关注。尽管 OpenAI 和 Anthropic 均未发布其最新大模型(GPT-5 和 Opus 3.5),这些模型可能已在内部运行并用于改进其他模型。通过蒸馏技术,强大的大模型生成的数据被用于提升更小、更便宜的模型性能,如 Anthropic 的 Sonnet 3.6 已达到 SOTA 水平。由于推理成本高昂,实验室选择不发布大模型,转而发布经过蒸馏的小模型。此外,OpenAI 和微软的合作条款也可能影响 GPT-5 的发布决策。随着递归自我改进行动的启动,未来公开发布的模型或将不再是重点。来源:https://mp.weixin.qq.com/s/kzdJ-yvvXnWnVOi7xW8mqQ
页:
[1]