英伟达全新开源模型:三倍吞吐、单卡可跑,还拿下推理SOTA

[复制链接]
周大 发表于 2025-7-29 15:41:55 | 显示全部楼层 |阅读模式
英伟达发布Llama Nemotron Super v1.5开源模型,专为复杂推理与智能体任务优化。该模型基于Llama-3.3-70B-Instruct,采用神经架构搜索(NAS)优化结构,引入跳过注意力机制与可变前馈网络,提升吞吐量至前代3倍,可在单张H100 80GB显卡高效运行。训练使用400亿token数据,结合知识蒸馏、SFT与强化学习提升性能。模型已开源,支持NVIDIA生态部署。Nemotron生态包含Nano、Super、Ultra三大系列,满足不同场景需求,已获多家企业集成使用。
来源:https://mp.weixin.qq.com/s/UmNGzlymnFyToZOm_37MsQ

搜索|Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-8-23 00:12 , Processed in 0.279620 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表