周大 发表于 2025-6-25 14:55:07

南京大学团队系统剖析深度表格数据表示学习,分类方法并探讨挑战与评估体系

南京大学团队系统梳理了表格表示学习的研究进展,将深度学习方法按泛化能力划分为专用、可迁移与通用三类模型。研究表明,随着架构优化与训练策略改进,DNN在表格建模中的性能已逐步接近甚至超过传统树模型,在点击率预测、异常检测等任务中表现突出。然而,表格数据因其特征异质性强、列顺序无语义、缺失值普遍等特性,仍对建模构成挑战。团队还提出构建跨数据集稳健评估体系的必要性,并综述了从特征处理、模型选择到评价指标的完整技术框架。此外,多个大规模带语义表格数据集的发布也为表格大模型的发展提供了支撑。
来源:https://mp.weixin.qq.com/s/EUByU9yyjVAvIy1eqvZDmA
页: [1]
查看完整版本: 南京大学团队系统剖析深度表格数据表示学习,分类方法并探讨挑战与评估体系