CVPR'25跨模态因果对齐,让机器更懂视觉证据丨中大南洋理工等联合开源
中山大学与新加坡南洋理工大学团队提出跨模态因果对齐框架(CRA),通过因果干预和跨模态对齐解决现有视频问答模型依赖统计偏差的问题。CRA包含三个核心模块:GSG用于噪声抑制,CMA实现特征对齐,ECI消除虚假因果链。实验表明,CRA在NextGQA和STAR数据集上的表现显著优于现有方法,分别提升2.2%和1.2%的性能。代码已开源,未来或将推动自动驾驶与智能监控等领域的可信AI应用。来源:https://mp.weixin.qq.com/s/wGSylM4QRjyHvTrPl0UGDg
页:
[1]