英伟达开源3400亿参数大模型Nemotron,助力合成数据生成
英伟达推出了全新的开源大模型Nemotron-4 340B,拥有3400亿参数,旨在解决训练大语言模型时高质量数据的获取难题。该模型包括基础、Instruct和Reward三个部分,可生成用于训练的合成数据。借助NVIDIA NeMo和TensorRT-LLM,开发者能优化模型效率。Nemotron-4 340B已在多项任务中展现出高准确性和性能,超越了同类模型。来源:https://mp.weixin.qq.com/s/ghN4Vyr7ipNkP2Od70oAEw
页:
[1]