斯坦福研究:非直接指令调优也能提升AI指令遵循力

[复制链接]
周大 发表于 2024-9-26 18:20:14 | 显示全部楼层 |阅读模式
斯坦福大学最新研究表明,除传统指令调优外,响应调优及单任务微调亦能有效促进语言模型的指令遵循能力,无需直接针对指令优化。实验中,响应调优模型与专业指令调优模型相比展现出相近胜率,揭示指令明确指定并非指令遵循的唯一路径。此外,针对如诗歌生成的窄领域数据微调,模型也能展示出跨领域的指令响应能力,深化了对语言模型潜在适应性的认知。
来源:https://mp.weixin.qq.com/s/gBDQHtOgx26sjQ-APWBRqQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-5-18 05:54 , Processed in 0.298613 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表