沉寂一个月,openPangu性能飙升8%!华为1B开源模型来了

[复制链接]
周大 发表于 2025-9-5 14:55:13 | 显示全部楼层 |阅读模式
华为推出专为昇腾端侧硬件优化的高性能语言模型 openPangu Embedded-1B,仅10亿参数却在多个基准测试中创下SOTA纪录,整体平均分达63.90,接近1.7B参数模型Qwen3的水平。该模型通过软硬件协同设计,在昇腾 Atlas 200I A2 设备上实现首token输出仅1.8秒、每token生成0.156秒的高效推理。采用多阶段训练策略,包括课程学习、知识蒸馏与多源强化学习,使其在数学推理任务中GSM8K达82.76%、MATH达81.83%。相比上一版本,新版本性能提升8%以上,迭代速度快。未来,华为还将开源支持快慢思考自适应融合的7B级模型,推动端侧AI在资源受限设备上的高效智能应用。
来源:https://mp.weixin.qq.com/s/Ty7g5sLqgCgWQaYENAVm0A

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-9-27 16:30 , Processed in 0.292878 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表