英伟达全新开源模型：三倍吞吐、单卡可跑，还拿下推理SOTA

周大发表于 2025-7-29 15:41:55

英伟达发布Llama Nemotron Super v1.5开源模型，专为复杂推理与智能体任务优化。该模型基于Llama-3.3-70B-Instruct，采用神经架构搜索（NAS）优化结构，引入跳过注意力机制与可变前馈网络，提升吞吐量至前代3倍，可在单张H100 80GB显卡高效运行。训练使用400亿token数据，结合知识蒸馏、SFT与强化学习提升性能。模型已开源，支持NVIDIA生态部署。Nemotron生态包含Nano、Super、Ultra三大系列，满足不同场景需求，已获多家企业集成使用。
来源：https://mp.weixin.qq.com/s/UmNGzlymnFyToZOm_37MsQ

		自动登录	找回密码
密码			立即注册

课程导航

英伟达全新开源模型：三倍吞吐、单卡可跑，还拿下推理SOTA