北大团队综述:以心理测量学革新大语言模型评估与增强
北京大学宋国杰教授团队发表63页综述论文,探讨如何科学评估大语言模型(LLM)的心智特征。论文指出传统方法已无法满足需求,提出将心理测量学引入AI评估,从构念导向、严谨方法到项目反应理论实现革新。研究涵盖人格、能力等多维度测量,并在特质调控、安全对齐等方面助力LLM提升。未来需发展新理论与工具,推动AI向更安全可靠方向发展。来源:https://mp.weixin.qq.com/s/w0Sgy74UMWsUd_zfVnXiKg
页:
[1]