首个商业级扩散大模型Mercury发布
Inception Labs发布了首个商业级扩散大型语言模型Mercury。该模型采用新的语言生成方法,在英伟达H100上能达到每秒1000+ token的速度,将推理成本降低10倍。与现有自回归模型相比,Mercury Coder性能更优、速度快5-10倍。其“从粗到细”的生成方式提升了推理和结构化响应能力,现已开放试用并提供企业级服务,有望推动AI领域的新变革。来源:https://mp.weixin.qq.com/s/SsEo7iCl0bNDr4F2uGXMTw
页:
[1]