周大 发表于 2024-6-8 16:22:30

LSTM创始人推出Vision-LSTM,挑战Transformer在视觉领域的地位

著名科学家Sepp Hochreiter引领的研究团队近期发布Vision-LSTM,这是一种将经典LSTM扩展到视觉任务的新架构。ViL通过交替的mLSTM块设计,解决了Transformer在高分辨率图像处理中的计算复杂性问题,表现出优于基于Transformer的ViT模型的性能。在ImageNet-1K实验中,ViL的性能与优化过的ViT相当,展示了其在语义分割和医学成像等任务的潜力。
来源:https://mp.weixin.qq.com/s/_9DYLbRkiXTU70nsXJLCDQ
页: [1]
查看完整版本: LSTM创始人推出Vision-LSTM,挑战Transformer在视觉领域的地位