OpenAI强推路由功能降本却翻车,大模型公司亟待提升算力兑换智力效率

[复制链接]
周大 发表于 2025-9-4 14:29:24 | 显示全部楼层 |阅读模式
随着大模型行业快速发展,算力成本控制成为商业化关键。DeepSeek凭借显著降低的训练与推理成本在开源社区走红,MoE架构也因效率优势成为主流。OpenAI在GPT-5中首次引入“路由”功能,旨在通过任务复杂度匹配不同模型,以提升算力效率,但因功能不成熟引发用户不满。研究表明推理模型算力消耗是非推理模型的5-6倍,延迟甚至高达60倍,而性能差异仅约5%。若路由功能能识别10%的简单任务,即可降低8%算力成本。行业已将自动路由作为基础设施能力,但其本质是复杂的多目标工程问题。DeepSeek尝试通过混合推理模型提高效率,但也出现稳定性问题。与此同时,OpenAI仍在大力扩张算力基础设施,并面临“AI成本悖论”——模型性能提升推动token总需求增长。高效调度“深度思考”能力,正成为大模型公司在系统效率与商业可持续性上的核心竞争力。
来源:https://tech.ifeng.com/c/8mLWieVHIvc

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 16:23 , Processed in 0.290289 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表