阿里通义千问推出Qwen2.5-1M开源模型,支持100万Tokens上下文
阿里通义千问正式推出开源的Qwen2.5-1M模型及其推理框架支持,发布两款新模型(Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M),首次将上下文扩展至1M长度。配套的vLLM推理框架使处理速度提升3-7倍。测试结果显示,Qwen2.5-1M系列在长上下文任务中显著优于128K版本,在多个数据集上超越GPT-4o-mini,同时保持了短文本任务的性能水平,为长上下文任务提供了强大的开源选择。来源:https://tech.ifeng.com/c/8gTXNwjosfO
页:
[1]