沉寂一个月,openPangu性能飙升8%!华为1B开源模型来了
华为推出专为昇腾端侧硬件优化的高性能语言模型 openPangu Embedded-1B,仅10亿参数却在多个基准测试中创下SOTA纪录,整体平均分达63.90,接近1.7B参数模型Qwen3的水平。该模型通过软硬件协同设计,在昇腾 Atlas 200I A2 设备上实现首token输出仅1.8秒、每token生成0.156秒的高效推理。采用多阶段训练策略,包括课程学习、知识蒸馏与多源强化学习,使其在数学推理任务中GSM8K达82.76%、MATH达81.83%。相比上一版本,新版本性能提升8%以上,迭代速度快。未来,华为还将开源支持快慢思考自适应融合的7B级模型,推动端侧AI在资源受限设备上的高效智能应用。来源:https://mp.weixin.qq.com/s/Ty7g5sLqgCgWQaYENAVm0A
页:
[1]