突破数据思维密度,仅4T数据让8B模型逼近GPT-4o-mini

[复制链接]
周大 发表于 2025-1-17 14:04:27 | 显示全部楼层 |阅读模式
上海人工智能实验室发布书生·浦语3.0,通过精炼数据框架,仅使用4T训练数据即达到主流开源模型18T数据的效果,节约训练成本75%以上。该模型首次实现常规对话与深度思考能力融合,提出“思维密度”概念,其数据思维密度较同量级开源模型高出4倍以上。经多维度评测,书生·浦语3.0综合性能接近GPT-4o-mini,在推理、数学、编程等方面表现出色,且支持浏览器使用,成为首个具备深度思考能力的通用对话开源模型,积极促进AI生态繁荣。
来源:https://mp.weixin.qq.com/s/z9QD5hsDuWsGX9V6Pl9I7Q

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-15 08:29 , Processed in 0.277017 second(s), 22 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表