200B参数击败满血DeepSeek-R1,字节豆包推理模型Seed-Thinking-v1.5要来了

[复制链接]
周大 发表于 2025-4-11 14:03:34 | 显示全部楼层 |阅读模式
字节跳动豆包团队推出Seed-Thinking-v1.5推理模型,该模型拥有200B总参数,每次激活20B参数,在AIME、Codeforces等权威基准测试中表现卓越,分别获得86.7分、55.0分及77.3分,全面超越671B参数的DeepSeek-R1。基于MoE架构设计,其规模紧凑且泛化能力强,非推理任务胜率较DeepSeek R1高出8%,未来将公开评估集以促进研究发展。
来源:https://mp.weixin.qq.com/s/wUzb58pUnZ1s7fO9aYs1vQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-23 17:10 , Processed in 0.295117 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表