周大 发表于 2025-5-30 14:06:16

DeepSeek深夜发布“小更新”,R1-0528模型性能飙升,或提前呈现R2部分特性

DeepSeek近日发布新版本模型DeepSeek-R1-0528,并在Hugging Face平台开源。尽管官方将其定义为“小版本”升级,但其性能大幅提升,在Live CodeBench测试中得分73.1分,接近OpenAI的o3。新版本参数量达685B,上下文长度为164K,表现出强大的编程、推理及交互能力。用户反馈显示,其文本生成更自然,推理更深入,且能处理长达30-60分钟的单任务。部分业内人士猜测,这可能是原计划中的R2模型提前推出,但因效果未达预期而未升级版本号。此次更新进一步缩小了与领先模型的差距,对其他国产闭源大模型形成压力。
来源:https://tech.ifeng.com/c/8jj2IgF0LBX
页: [1]
查看完整版本: DeepSeek深夜发布“小更新”,R1-0528模型性能飙升,或提前呈现R2部分特性