字节新推理模型逆袭DeepSeek,200B参数战胜671B,豆包史诗级加强?
字节Seed团队推出Seed-Thinking-v1.5模型,在数学和代码推理任务中表现突出,参数规模更小但仍超越DeepSeek-R1。团队从数据优化、强化学习算法(如VAPO和DAPO)及基础设施改进三方面提升推理能力,开发全新数学评测集BeyondAIME。模型在AIME 2024基准测试中得分86.7,接近OpenAI o3-mini-high水平,但在部分任务中仍落后于顶级模型。尽管目前未公开发布,但未来或会部署至豆包APP。来源:https://mp.weixin.qq.com/s/wfiPEXHayAmwJwrGTAjD2Q
页:
[1]