大型语言模型(LLM)在训练过程中可能出现“幻觉”,如DeepSeek V3 和 Google 的 Gemini,这源于训练数据受到特定模型输出内容的污染。AI内容版权问题逐渐凸显,现有版权法难以适用,导致《纽约时报》等起诉相关公司。Scribd 联合创始人推出“Created by Humans”项目,试图通过新商业模式平衡各方利益,但目前仅限于图书版权。AI对“语料”的使用缺乏监管,创作者权益亟待保护,未来需进一步明确AI版权归属及使用规则。
来源:https://tech.ifeng.com/c/8fkzHcROQTq