阿里通义千问推出Qwen2.5-1M开源模型，支持100万Tokens上下文

周大发表于 2025-1-27 16:03:23

阿里通义千问正式推出开源的Qwen2.5-1M模型及其推理框架支持，发布两款新模型（Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M），首次将上下文扩展至1M长度。配套的vLLM推理框架使处理速度提升3-7倍。测试结果显示，Qwen2.5-1M系列在长上下文任务中显著优于128K版本，在多个数据集上超越GPT-4o-mini，同时保持了短文本任务的性能水平，为长上下文任务提供了强大的开源选择。
来源：https://tech.ifeng.com/c/8gTXNwjosfO

页: [1]

靠浦ai课堂's Archiver

阿里通义千问推出Qwen2.5-1M开源模型，支持100万Tokens上下文