周大 发表于 2025-2-14 20:47:37

谷歌DeepMind发布WebLI-100B:千亿级数据集解锁AI视觉语言模型的文化多样性

谷歌DeepMind推出WebLI-100B数据集,包含1000亿个图像-文本对,比现有最大数据集大10倍。该数据集通过扩展规模而非严格过滤来提升视觉语言模型的文化多样性和多语言理解能力,特别在低资源语言和跨文化任务中表现出色。研究显示,在相同计算资源下,使用更大规模数据集训练的模型能显著改善非西方语言和文化的识别准确度。
来源:https://tech.ifeng.com/c/8gy0XrSfwCJ
页: [1]
查看完整版本: 谷歌DeepMind发布WebLI-100B:千亿级数据集解锁AI视觉语言模型的文化多样性