周大 发表于 2025-8-1 15:41:47

又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

阶跃星辰开源其多模态大模型Step-3,凭借321B参数和MoE结构,在MMMU等多个榜单取得开源SOTA成绩。其解码速度达每秒4039 Token,为DeepSeek-V3的174%,并在多种硬件配置下实现显著成本优势,如H20成本仅为V3的30%,8K长度下每百万Token成本不到4毛钱。Step-3通过模型-Infra协同设计、MFA注意力机制与AFD任务分拆策略,实现高效资源利用。此外,Hugging Face榜单前十中有8个为中国模型,国产开源大模型已占据主导地位。
来源:https://mp.weixin.qq.com/s/XumyxSxZQFDnfXP8aliuzQ
页: [1]
查看完整版本: 又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱