靠浦ai课堂's Archiver
版块
›
靠浦ai资讯
› 英伟达开源NeMo-Aligner,助力大模型安全对齐
周大
发表于 2024-5-13 21:06:01
英伟达开源NeMo-Aligner,助力大模型安全对齐
为解决大模型应用中的对齐难题,英伟达推出开源框架NeMo-Aligner,集成RLHF和SteerLM等技术,强化学习人类偏好以优化模型行为。RLHF借助人类反馈和PPO策略,确保模型输出符合价值观,而SteerLM通过引导信号定制模型生成内容,提升安全性和准确性。
来源:https://www.chinaz.com/2024/0513/1616012.shtml
页:
[1]
查看完整版本:
英伟达开源NeMo-Aligner,助力大模型安全对齐