天天看点

实现通道注意力_即插即用!Rotate to Attend:卷积Triplet注意力模块

实现通道注意力_即插即用!Rotate to Attend:卷积Triplet注意力模块

即插即用!Triplet注意力来了!性能优于GC、SRM、CBAM和SE等注意力机制,可应用于分类、检测等任务,代码现已开源!

注:现在看到论文各种"即插即用"、各种注意力,都快麻木了...会疑问究竟work不work
Rotate to Attend: Convolutional Triplet Attention Module

作者单位:Landskape, 印度理工学院, UIUC等

代码:LandskapeAI/triplet-attention

论文: https:// arxiv.org/abs/2010.0304 5

注:如果上述论文链接无法访问,可以看文末,论文已上传至百度云,方便下载。

受益于在通道或空间位置之间建立相互依存的能力,注意力机制最近已被广泛研究并广泛用于各种计算机视觉任务中。

各种Attention模块对比:
实现通道注意力_即插即用!Rotate to Attend:卷积Triplet注意力模块
实现通道注意力_即插即用!Rotate to Attend:卷积Triplet注意力模块

在本文中,我们研究了轻量但有效的注意力机制,并提出了Triplet注意力,这是一种通过使用三分支结构捕获跨维度交互来计算注意力权重的新方法。

实现通道注意力_即插即用!Rotate to Attend:卷积Triplet注意力模块

对于输入张量,Triplet注意力通过旋转操作和残差变换建立维度间的依存关系,并以可忽略的计算开销对通道间和空间信息进行编码。

实现通道注意力_即插即用!Rotate to Attend:卷积Triplet注意力模块
实现通道注意力_即插即用!Rotate to Attend:卷积Triplet注意力模块

我们的方法既简单又有效,并且可以轻松地作为附加模块插入经典backbone。

实验结果

我们证明了我们的方法在各种挑战性任务中的有效性,包括ImageNet-1k上的图像分类以及MSCOCO和PASCAL VOC数据集上的目标检测。

实现通道注意力_即插即用!Rotate to Attend:卷积Triplet注意力模块
实现通道注意力_即插即用!Rotate to Attend:卷积Triplet注意力模块

此外,我们通过检查GradCAM和GradCAM++结果,深入了解Triplet注意力的表现。对我们的方法进行的经验评估支持我们的直觉,即在计算注意力权重时捕获跨维度依赖性的重要性。

实现通道注意力_即插即用!Rotate to Attend:卷积Triplet注意力模块

论文下载

链接: https:// pan.baidu.com/s/1YAVF4m pY8SyLxdVBSDaW9A

提取码:cver

强烈推荐大家关注

CVer知乎

账号和

CVer

微信公众号,可以快速了解到最新优质的CV论文。

推荐阅读

旷视提出MegDetV2:目标检测/实例分割系统

综述 | 基于深度学习的医学图像分割技术:全面调研

ResNet还是DenseNet?即插即用的DS涨点神器来了!

综述 | 基于深度学习的端到端人脸识别技术:全面调研

TBC:共享Thinner Filters,实现更强的CNN!

综述 | 行人检测技术(从手工特征到深度学习):全面调研

超越EfficientNets!无需注意力,也能让你的网络更快更强!

OpenCV 4.5来了!更强的SIFT,改进RANSAC算法,新增目标跟踪网络SiamRPN++

综述 | 基于深度学习的实时语义分割方法:全面调研

涨点神器!南航提出AFF:注意力特征融合

NeurIPS 2020 | 谷歌大脑提出:重新思考预训练和自训练

NeurIPS 2020 | 用于图像复原/恢复的神经稀疏表示

NeurIPS 2020 | aLRPLoss:统一目标检测中的分类和定位的平衡损失函数

CCE:具有互补交叉熵的不平衡图像分类

谷歌地标检索2020 Kaggle 第一名解决方案

ECCV AIM 2020 真实图像超分辨率挑战赛3项冠军解决方案

LVIS 实例分割挑战赛2020的第一名解决方案:好的Box不能保证好的Mask

ETH Zurich提出DPIR:具有Denoiser先验的即插即用图像恢复

综述 | 人脸图像质量评估:全面调研(2004-2020)

VarifocalNet:IoU-aware 密集目标检测器(已开源)

ECCV 2020 | NAS-DIP:通过NAS实现DIP(去噪/去雾/超分辨率/修复等)

TIP 2020 | PNEN:金字塔Non-Local增强型网络

综述 | 小样本学习:全面调研(Few-shot)

MiCo:用于半监督域自适应的Mixup联合训练

使用深度神经网络从Noisy Labels中学习:全面调研

PyTorch3D:面向3D计算机视觉的PyTorch工具箱

剪枝filter?还是剪枝layer?这是个问题

ECCV 2020 | WeightNet:重新探索Weight网络的设计空间

Mask TextSpotter v3:用于场景文字检测和识别的分割Proposal网络

ECCV 2020 | 魔鬼在细节中:车辆重识别的自监督注意力(SAVER)

ECCV 2020 | 53.5 AP!PAA:用于目标检测的IoU预测的概率Anchor分配

ECCV 2020 | 南京理工提出FPT:特征金字塔Transformer

ECCV 2020 | 长尾数据集中多标签分类的分布平衡损失

ECCV 2020 | BMask R-CNN:边界保持的Mask R-CNN

ECCV 2020 | 即插即用!PSConv:将特征金字塔压缩到紧凑的多尺度卷积层中

ECCV 2020 | STTN:用于视频修复的时空联合Transformer

ECCV 2020 | LiteFlowNet3:实现更准确的光流估计