Qwen3-Coder-Flash开源：33GB内存本地运行，百万上下文窗口直逼GPT-4.1

周大发表于 2025-8-1 15:38:29

Qwen3-Coder-Flash 正式开源，作为 Qwen3-Coder 的轻量版本，采用 MoE 架构，参数总量 30 亿，激活参数 3.3 亿，支持 256K 原生上下文窗口并可扩展至 100 万 token，适合处理复杂编程任务。在中端笔记本上即可运行，实测生成速度达每秒 107 token，量化版本进一步降低显存需求。模型在 Agentic 编程、工具调用等方面表现突出，实测生成网页游戏效果良好。Qwen 近期密集开源多个模型并推出多种优化方案，推动本地 AI 编程发展。
来源：https://mp.weixin.qq.com/s/npy6mL53gfW9Y2r2oNPFyg

页: [1]

靠浦ai课堂's Archiver

Qwen3-Coder-Flash开源：33GB内存本地运行，百万上下文窗口直逼GPT-4.1