斯坦福研究：非直接指令调优也能提升AI指令遵循力

周大发表于 2024-9-26 18:20:14

斯坦福大学最新研究表明，除传统指令调优外，响应调优及单任务微调亦能有效促进语言模型的指令遵循能力，无需直接针对指令优化。实验中，响应调优模型与专业指令调优模型相比展现出相近胜率，揭示指令明确指定并非指令遵循的唯一路径。此外，针对如诗歌生成的窄领域数据微调，模型也能展示出跨领域的指令响应能力，深化了对语言模型潜在适应性的认知。
来源：https://mp.weixin.qq.com/s/gBDQHtOgx26sjQ-APWBRqQ

页: [1]

靠浦ai课堂's Archiver

斯坦福研究：非直接指令调优也能提升AI指令遵循力