周大 发表于 2024-9-17 16:13:36

战胜100多位NLP研究人员!杨笛一团队最新百页论文:首次统计学上证明,LLM生成的idea新颖性优于人类

斯坦福大学历时一年研究发现,大型语言模型(LLMs)生成的研究想法在新颖性上显著优于人类专家(p < 0.05),但在可行性方面略逊一筹。实验招募了100多名高水平NLP研究人员参与盲审,首次对LLM创意代理与人类专家进行了直接比较,揭示了LLM在自我评估及多样性上的不足。
来源:https://mp.weixin.qq.com/s/_5ob8m_LUni1YbOaEGncaA
页: [1]
查看完整版本: 战胜100多位NLP研究人员!杨笛一团队最新百页论文:首次统计学上证明,LLM生成的idea新颖性优于人类