周大 发表于 2025-1-17 14:04:27

突破数据思维密度,仅4T数据让8B模型逼近GPT-4o-mini

上海人工智能实验室发布书生·浦语3.0,通过精炼数据框架,仅使用4T训练数据即达到主流开源模型18T数据的效果,节约训练成本75%以上。该模型首次实现常规对话与深度思考能力融合,提出“思维密度”概念,其数据思维密度较同量级开源模型高出4倍以上。经多维度评测,书生·浦语3.0综合性能接近GPT-4o-mini,在推理、数学、编程等方面表现出色,且支持浏览器使用,成为首个具备深度思考能力的通用对话开源模型,积极促进AI生态繁荣。
来源:https://mp.weixin.qq.com/s/z9QD5hsDuWsGX9V6Pl9I7Q
页: [1]
查看完整版本: 突破数据思维密度,仅4T数据让8B模型逼近GPT-4o-mini