阿里除夕发布Qwen2.5-Max反超DeepSeek V3

[复制链接]
周大 发表于 2025-1-30 11:29:32 | 显示全部楼层 |阅读模式
阿里通义Qwen发布了最新的大模型Qwen2.5-Max,作为新春贺礼。该模型在Arena-Hard、LiveBench等多个基准测试中超越了DeepSeek V3、Llama-3.1-405B及GPT-4o等竞争对手,展现了强大的知识理解和推理能力。Qwen2.5-Max是超大规模的MoE模型,经过超过20万亿token预训练数据及精心设计的SFT+RLHF后训练方案训练而成。它具备联网搜索、代码创作、Artifacts功能等多种多模态能力。目前,Qwen2.5-Max已在Qwen Chat上线,并提供多种平台的Demo和API服务,受到了网友们的广泛关注和好评。
来源:https://mp.weixin.qq.com/s/4gf6qQXDlq0fc3rGkzJj2g

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 07:41 , Processed in 0.289904 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表