周大 发表于 2024-5-13 21:06:01

英伟达开源NeMo-Aligner,助力大模型安全对齐

为解决大模型应用中的对齐难题,英伟达推出开源框架NeMo-Aligner,集成RLHF和SteerLM等技术,强化学习人类偏好以优化模型行为。RLHF借助人类反馈和PPO策略,确保模型输出符合价值观,而SteerLM通过引导信号定制模型生成内容,提升安全性和准确性。
来源:https://www.chinaz.com/2024/0513/1616012.shtml
页: [1]
查看完整版本: 英伟达开源NeMo-Aligner,助力大模型安全对齐