阿里通义千问推出Qwen2.5-1M开源模型,支持100万Tokens上下文

[复制链接]
周大 发表于 2025-1-27 16:03:23 | 显示全部楼层 |阅读模式
阿里通义千问正式推出开源的Qwen2.5-1M模型及其推理框架支持,发布两款新模型(Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M),首次将上下文扩展至1M长度。配套的vLLM推理框架使处理速度提升3-7倍。测试结果显示,Qwen2.5-1M系列在长上下文任务中显著优于128K版本,在多个数据集上超越GPT-4o-mini,同时保持了短文本任务的性能水平,为长上下文任务提供了强大的开源选择。
来源:https://tech.ifeng.com/c/8gTXNwjosfO

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 11:16 , Processed in 0.282929 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表