周大 发表于 2025-8-20 15:22:54

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4

DeepSeek正式发布V3.1版本,支持128K上下文长度,模型参数达6850亿,具备多种精度支持。该版本在Aider编程基准测试中获得71.6%高分,超越Claude 4 Opus,且编程任务成本仅1.01美元。新增原生搜索token,或预示未来采用混合架构。实测显示其输出速度提升,但未完全发挥上下文极限。在SVGBench和MMLU等基准测试中表现出色,接近GPT-4.1-mini和GPT-5水平。尽管部分功能仍有待完善,V3.1已引发社区广泛关注,上线即登Hugging Face趋势榜第四。
来源:https://mp.weixin.qq.com/s/panSxt0KlfUoaudcdE8y5Q
页: [1]
查看完整版本: DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4