周大 发表于 2024-9-26 18:20:14

斯坦福研究:非直接指令调优也能提升AI指令遵循力

斯坦福大学最新研究表明,除传统指令调优外,响应调优及单任务微调亦能有效促进语言模型的指令遵循能力,无需直接针对指令优化。实验中,响应调优模型与专业指令调优模型相比展现出相近胜率,揭示指令明确指定并非指令遵循的唯一路径。此外,针对如诗歌生成的窄领域数据微调,模型也能展示出跨领域的指令响应能力,深化了对语言模型潜在适应性的认知。
来源:https://mp.weixin.qq.com/s/gBDQHtOgx26sjQ-APWBRqQ
页: [1]
查看完整版本: 斯坦福研究:非直接指令调优也能提升AI指令遵循力