英伟达开源NeMo-Aligner,助力大模型安全对齐

[复制链接]
周大 发表于 2024-5-13 21:06:01 | 显示全部楼层 |阅读模式
为解决大模型应用中的对齐难题,英伟达推出开源框架NeMo-Aligner,集成RLHF和SteerLM等技术,强化学习人类偏好以优化模型行为。RLHF借助人类反馈和PPO策略,确保模型输出符合价值观,而SteerLM通过引导信号定制模型生成内容,提升安全性和准确性。
来源:https://www.chinaz.com/2024/0513/1616012.shtml

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-7 22:41 , Processed in 0.288598 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表