周大 发表于 2024-6-15 15:16:26

互联网文本数据预计2028年耗尽,AI发展面临“数据墙”挑战

随着大型语言模型的发展,数据已成为关键制约因素。根据Epoch AI的最新研究,互联网上的人类文本数据可能在2028年耗尽,这对AI模型的扩展构成重大挑战。OpenAI已面临数据不足问题,考虑使用非传统来源如YouTube文本。尽管数据瓶颈逼近,但AI生成数据、多模态学习等策略提供了潜在解决方案,一定程度上缓解数据瓶颈问题。
来源:https://mp.weixin.qq.com/s/Iu5sxYAy98wQpuBZn53ncA
页: [1]
查看完整版本: 互联网文本数据预计2028年耗尽,AI发展面临“数据墙”挑战