大模型推理的“左右脑”革命!华为盘古Embedded凭昇腾之力,让快慢思考合二为一
华为盘古团队推出盘古 Embedded 模型,基于昇腾 NPU 实现快慢双系统推理能力,通过两阶段训练框架融合“快思考”与“慢思考”模式。模型参数量为 7B,在通用及垂域任务中表现优异,尤其在法律和数学领域成绩突出。其自适应切换功能可根据任务复杂度动态调整推理深度,平衡效率与准确性,为高性能语言模型开发提供新方向。来源:https://mp.weixin.qq.com/s/Eem1OYzEE1sM1-MWqsfcpA
页:
[1]