周大 发表于 2024-4-28 16:54:19

阿里巴巴发布Qwen1.5-110B模型

阿里巴巴发布首个千亿参数模型Qwen1.5-110B,集成了Transformer架构和GQA机制,支持多语言和32K tokens上下文长度,性能超越Meta-Llama3-70B。
来源:https://mp.weixin.qq.com/s/nSzWHKG_9ApUNies3jlqIA
页: [1]
查看完整版本: 阿里巴巴发布Qwen1.5-110B模型