周大 发表于 2025-5-30 14:44:14

见证历史!DeepSeek跃居全球第二AI实验室,R1登顶开源王座,R2全网催更

DeepSeek-R1-0528正式发布,其数学、编程及通用逻辑性能直逼o3和Gemini 2.5 Pro,幻觉率降低45%-50%,并在AIME 2025测试中将准确率从70%提升至87.5%。新版本支持JSON输出与工具调用,代码生成能力显著增强。同时,基于Qwen3-8B Base微调的蒸馏模型DeepSeek-R1-0528-Qwen3-8B在AIME 2024中表现突出,超越Phi-4 14B和Qwen3-8B。DeepSeek智能指数从60分跃升至68分,成为全球第二大AI实验室,进一步缩小了开源与闭源模型间的差距,彰显强化学习和后训练优化的重要性。
来源:https://tech.ifeng.com/c/8jm0aIC1GiT
页: [1]
查看完整版本: 见证历史!DeepSeek跃居全球第二AI实验室,R1登顶开源王座,R2全网催更