超越KL!大连理工发布Wasserstein距离知识蒸馏新方法

[复制链接]
周大 发表于 2025-1-10 15:38:59 | 显示全部楼层 |阅读模式
大连理工大学研究团队提出基于Wasserstein距离的知识蒸馏方法WKD,解决传统KL散度在Logit和Feature蒸馏中的局限。WKD分为Logit蒸馏(WKD-L)和Feature蒸馏(WKD-F),通过跨类别比较和高斯分布建模特征,分别克服了KL散度无法进行类别间比较及处理不重叠分布的问题。实验结果显示,WKD在图像分类和目标检测任务中均超越现有方法,尤其在ImageNet、CIFAR-100和MS-COCO数据集上表现出色,论文已被NeurIPS 2024接收为Poster。
来源:https://mp.weixin.qq.com/s/R0xS3FErHt3McVbwuO2HvQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-21 19:25 , Processed in 0.292162 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表