周大 发表于 2025-5-27 15:41:25

北大团队综述:以心理测量学革新大语言模型评估与增强

北京大学宋国杰教授团队发表63页综述论文,探讨如何科学评估大语言模型(LLM)的心智特征。论文指出传统方法已无法满足需求,提出将心理测量学引入AI评估,从构念导向、严谨方法到项目反应理论实现革新。研究涵盖人格、能力等多维度测量,并在特质调控、安全对齐等方面助力LLM提升。未来需发展新理论与工具,推动AI向更安全可靠方向发展。
来源:https://mp.weixin.qq.com/s/w0Sgy74UMWsUd_zfVnXiKg
页: [1]
查看完整版本: 北大团队综述:以心理测量学革新大语言模型评估与增强