英伟达开源3400亿参数大模型Nemotron,助力合成数据生成

[复制链接]
周大 发表于 2024-6-15 15:04:09 | 显示全部楼层 |阅读模式
英伟达推出了全新的开源大模型Nemotron-4 340B,拥有3400亿参数,旨在解决训练大语言模型时高质量数据的获取难题。该模型包括基础、Instruct和Reward三个部分,可生成用于训练的合成数据。借助NVIDIA NeMo和TensorRT-LLM,开发者能优化模型效率。Nemotron-4 340B已在多项任务中展现出高准确性和性能,超越了同类模型。
来源:https://mp.weixin.qq.com/s/ghN4Vyr7ipNkP2Od70oAEw

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-19 11:24 , Processed in 0.294937 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表