200B参数击败满血DeepSeek-R1，字节豆包推理模型Seed-Thinking-v1.5要来了

周大发表于 2025-4-11 14:03:34

字节跳动豆包团队推出Seed-Thinking-v1.5推理模型，该模型拥有200B总参数，每次激活20B参数，在AIME、Codeforces等权威基准测试中表现卓越，分别获得86.7分、55.0分及77.3分，全面超越671B参数的DeepSeek-R1。基于MoE架构设计，其规模紧凑且泛化能力强，非推理任务胜率较DeepSeek R1高出8%，未来将公开评估集以促进研究发展。
来源：https://mp.weixin.qq.com/s/wUzb58pUnZ1s7fO9aYs1vQ

页: [1]

靠浦ai课堂's Archiver

200B参数击败满血DeepSeek-R1，字节豆包推理模型Seed-Thinking-v1.5要来了