又一SOTA级开源模型!阶跃Step-3多模态推理登顶,百万token解码成本不到4毛钱

[复制链接]
周大 发表于 2025-8-1 15:41:47 | 显示全部楼层 |阅读模式
阶跃星辰开源其多模态大模型Step-3,凭借321B参数和MoE结构,在MMMU等多个榜单取得开源SOTA成绩。其解码速度达每秒4039 Token,为DeepSeek-V3的174%,并在多种硬件配置下实现显著成本优势,如H20成本仅为V3的30%,8K长度下每百万Token成本不到4毛钱。Step-3通过模型-Infra协同设计、MFA注意力机制与AFD任务分拆策略,实现高效资源利用。此外,Hugging Face榜单前十中有8个为中国模型,国产开源大模型已占据主导地位。
来源:https://mp.weixin.qq.com/s/XumyxSxZQFDnfXP8aliuzQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-22 21:58 , Processed in 0.306349 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表