周大 发表于 2025-5-11 14:51:32

字节Seed开源8B代码模型Seed-Coder

字节Seed开源8B规模代码模型Seed-Coder,通过自动生成与筛选高质量训练数据,在多个基准测试中超越Qwen3等模型。模型包含Base、Instruct、Reasoning三个版本,上下文长度达32K,使用6T tokens训练,采用MIT协议。Seed团队提出“模型中心”数据处理方法,从GitHub和网络档案提取高质量数据。此外,还发布了视频生成模型Seaweed、推理模型Seed-Thinking-v1.5及智能体UI-TARS,推动AI开源与普惠。
来源:https://mp.weixin.qq.com/s/SffydOQwYcb9lIQL4wYxVQ
页: [1]
查看完整版本: 字节Seed开源8B代码模型Seed-Coder