周大 发表于 2025-2-27 15:53:03

首个商业级扩散大模型Mercury发布

Inception Labs发布了首个商业级扩散大型语言模型Mercury。该模型采用新的语言生成方法,在英伟达H100上能达到每秒1000+ token的速度,将推理成本降低10倍。与现有自回归模型相比,Mercury Coder性能更优、速度快5-10倍。其“从粗到细”的生成方式提升了推理和结构化响应能力,现已开放试用并提供企业级服务,有望推动AI领域的新变革。
来源:https://mp.weixin.qq.com/s/SsEo7iCl0bNDr4F2uGXMTw
页: [1]
查看完整版本: 首个商业级扩散大模型Mercury发布