Cerebras推出全球最快AI推理解决方案,速度是英伟达方案的20倍
Cerebras Systems 推出 Cerebras Inference,宣称全球最快 AI 推理解决方案,速度比英伟达快 20 倍,为 Llama 3.1 8B 和 70B 提供极高 token 速度。新方案性价比高出 GPU 云 100 倍,并采用 CS-3 系统与 WSE-3 处理器,内存带宽优于 Nvidia H100 7000 倍。提供免费、开发者和企业三层级服务,有望改变行业格局。来源:https://tech.ifeng.com/c/8cPWDrvPvWj
页:
[1]