IML领域首个稀疏化视觉Transformer,代码已开源

[复制链接]
周大 发表于 2025-1-6 15:11:54 | 显示全部楼层 |阅读模式
SparseViT由四川大学和澳门大学联合开发,针对现有图像篡改检测模型依赖手工特征提取的局限性,提出基于稀疏自注意力机制的新架构。该模型通过稀疏编码高效提取非语义特征,计算量最高减少80% FLOPs,同时引入可学习多尺度监督机制提升泛化能力。实验结果表明,SparseViT在四个公共数据集上达到SOTA性能,为图像篡改检测提供了新思路。相关代码已完全开源。
来源:https://mp.weixin.qq.com/s/kLbkNjDpYpEeULip32RkTQ

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-4-22 03:14 , Processed in 0.314123 second(s), 24 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表