突破数据思维密度，仅4T数据让8B模型逼近GPT-4o-mini

周大发表于 2025-1-17 14:04:27

上海人工智能实验室发布书生·浦语3.0，通过精炼数据框架，仅使用4T训练数据即达到主流开源模型18T数据的效果，节约训练成本75%以上。该模型首次实现常规对话与深度思考能力融合，提出“思维密度”概念，其数据思维密度较同量级开源模型高出4倍以上。经多维度评测，书生·浦语3.0综合性能接近GPT-4o-mini，在推理、数学、编程等方面表现出色，且支持浏览器使用，成为首个具备深度思考能力的通用对话开源模型，积极促进AI生态繁荣。
来源：https://mp.weixin.qq.com/s/z9QD5hsDuWsGX9V6Pl9I7Q

页: [1]

靠浦ai课堂's Archiver

突破数据思维密度，仅4T数据让8B模型逼近GPT-4o-mini