周大 发表于 2025-4-11 14:03:34

200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了

字节跳动豆包团队推出Seed-Thinking-v1.5推理模型,该模型拥有200B总参数,每次激活20B参数,在AIME、Codeforces等权威基准测试中表现卓越,分别获得86.7分、55.0分及77.3分,全面超越671B参数的DeepSeek-R1。基于MoE架构设计,其规模紧凑且泛化能力强,非推理任务胜率较DeepSeek R1高出8%,未来将公开评估集以促进研究发展。
来源:https://mp.weixin.qq.com/s/wUzb58pUnZ1s7fO9aYs1vQ
页: [1]
查看完整版本: 200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了