周大 发表于 2024-8-16 15:50:56

英伟达玩转剪枝、蒸馏:把Llama 3.1 8B参数减半,性能同尺寸更强

英伟达通过结构化权重剪枝与知识蒸馏相结合的技术,成功将Llama 3.1 8B模型提炼为Llama-3.1-Minitron 4B模型,该模型不仅保持了高性能,而且大幅降低了部署成本。这一成果得到了图灵奖得主Yann LeCun的认可。Llama-3.1-Minitron 4B模型在多个基准测试中展现出色性能,并且在指令遵循等任务中也表现出色,证明了小型语言模型的强大潜力。
来源:https://mp.weixin.qq.com/s/zxW9EagxGJX-rS5loNLKXw
页: [1]
查看完整版本: 英伟达玩转剪枝、蒸馏:把Llama 3.1 8B参数减半,性能同尺寸更强