阿里除夕发布Qwen2.5-Max反超DeepSeek V3

周大发表于 2025-1-30 11:29:32

阿里通义Qwen发布了最新的大模型Qwen2.5-Max，作为新春贺礼。该模型在Arena-Hard、LiveBench等多个基准测试中超越了DeepSeek V3、Llama-3.1-405B及GPT-4o等竞争对手，展现了强大的知识理解和推理能力。Qwen2.5-Max是超大规模的MoE模型，经过超过20万亿token预训练数据及精心设计的SFT+RLHF后训练方案训练而成。它具备联网搜索、代码创作、Artifacts功能等多种多模态能力。目前，Qwen2.5-Max已在Qwen Chat上线，并提供多种平台的Demo和API服务，受到了网友们的广泛关注和好评。
来源：https://mp.weixin.qq.com/s/4gf6qQXDlq0fc3rGkzJj2g

		自动登录	找回密码
密码			立即注册

课程导航

阿里除夕发布Qwen2.5-Max反超DeepSeek V3