Qwen3-Coder-Flash开源:33GB内存本地运行,百万上下文窗口直逼GPT-4.1
Qwen3-Coder-Flash 正式开源,作为 Qwen3-Coder 的轻量版本,采用 MoE 架构,参数总量 30 亿,激活参数 3.3 亿,支持 256K 原生上下文窗口并可扩展至 100 万 token,适合处理复杂编程任务。在中端笔记本上即可运行,实测生成速度达每秒 107 token,量化版本进一步降低显存需求。模型在 Agentic 编程、工具调用等方面表现突出,实测生成网页游戏效果良好。Qwen 近期密集开源多个模型并推出多种优化方案,推动本地 AI 编程发展。来源:https://mp.weixin.qq.com/s/npy6mL53gfW9Y2r2oNPFyg
页:
[1]