周大 发表于 2025-9-4 14:29:24

OpenAI强推路由功能降本却翻车,大模型公司亟待提升算力兑换智力效率

随着大模型行业快速发展,算力成本控制成为商业化关键。DeepSeek凭借显著降低的训练与推理成本在开源社区走红,MoE架构也因效率优势成为主流。OpenAI在GPT-5中首次引入“路由”功能,旨在通过任务复杂度匹配不同模型,以提升算力效率,但因功能不成熟引发用户不满。研究表明推理模型算力消耗是非推理模型的5-6倍,延迟甚至高达60倍,而性能差异仅约5%。若路由功能能识别10%的简单任务,即可降低8%算力成本。行业已将自动路由作为基础设施能力,但其本质是复杂的多目标工程问题。DeepSeek尝试通过混合推理模型提高效率,但也出现稳定性问题。与此同时,OpenAI仍在大力扩张算力基础设施,并面临“AI成本悖论”——模型性能提升推动token总需求增长。高效调度“深度思考”能力,正成为大模型公司在系统效率与商业可持续性上的核心竞争力。
来源:https://tech.ifeng.com/c/8mLWieVHIvc
页: [1]
查看完整版本: OpenAI强推路由功能降本却翻车,大模型公司亟待提升算力兑换智力效率