战胜100多位NLP研究人员！杨笛一团队最新百页论文：首次统计学上证明，LLM生成的idea新颖性优于人类

周大发表于 2024-9-17 16:13:36

斯坦福大学历时一年研究发现，大型语言模型（LLMs）生成的研究想法在新颖性上显著优于人类专家（p < 0.05），但在可行性方面略逊一筹。实验招募了100多名高水平NLP研究人员参与盲审，首次对LLM创意代理与人类专家进行了直接比较，揭示了LLM在自我评估及多样性上的不足。
来源：https://mp.weixin.qq.com/s/_5ob8m_LUni1YbOaEGncaA

页: [1]

靠浦ai课堂's Archiver

战胜100多位NLP研究人员！杨笛一团队最新百页论文：首次统计学上证明，LLM生成的idea新颖性优于人类