北大团队综述：以心理测量学革新大语言模型评估与增强

周大发表于 2025-5-27 15:41:25

北京大学宋国杰教授团队发表63页综述论文，探讨如何科学评估大语言模型（LLM）的心智特征。论文指出传统方法已无法满足需求，提出将心理测量学引入AI评估，从构念导向、严谨方法到项目反应理论实现革新。研究涵盖人格、能力等多维度测量，并在特质调控、安全对齐等方面助力LLM提升。未来需发展新理论与工具，推动AI向更安全可靠方向发展。
来源：https://mp.weixin.qq.com/s/w0Sgy74UMWsUd_zfVnXiKg

页: [1]

靠浦ai课堂's Archiver

北大团队综述：以心理测量学革新大语言模型评估与增强