周大 发表于 2025-7-29 15:41:55

英伟达全新开源模型:三倍吞吐、单卡可跑,还拿下推理SOTA

英伟达发布Llama Nemotron Super v1.5开源模型,专为复杂推理与智能体任务优化。该模型基于Llama-3.3-70B-Instruct,采用神经架构搜索(NAS)优化结构,引入跳过注意力机制与可变前馈网络,提升吞吐量至前代3倍,可在单张H100 80GB显卡高效运行。训练使用400亿token数据,结合知识蒸馏、SFT与强化学习提升性能。模型已开源,支持NVIDIA生态部署。Nemotron生态包含Nano、Super、Ultra三大系列,满足不同场景需求,已获多家企业集成使用。
来源:https://mp.weixin.qq.com/s/UmNGzlymnFyToZOm_37MsQ
页: [1]
查看完整版本: 英伟达全新开源模型:三倍吞吐、单卡可跑,还拿下推理SOTA