OrientedRCNN论文解读

2022-04-12 11:35:05

论文链接

1、出发点

首先Rotate RPN通过撒各个角度比例尺寸的anchor生成OP(Oriented Proposal的缩写)，缺点很明显：计算量和内存占用大。

于是RoI Transformer提出借助水平anchor来生成OP，由于舍弃了旋转anchor故计算量下去了。大致流程就是：Horizental_Anchor --> RPN --> Horizental Proposal -->Roi Align–> FC --> OP。缺点：引入了FC和RoIAlign，导致网络heavy且复杂。

故本文考虑直接Horizental_Anchor --> OP,从而简化模型降低过拟合风险。

2、模型结构

总体结构比较简单，就是二阶网络结构。我首先介绍Oriented RPN。

2.1. Oriented RPN

这里关注下通道维度变化：首先256是特征图维度，之后在特征图每个位置撒了A(A=3)个Horizental anchor，经过 1*1 的卷积操作将通道维度变成了6*A = 18。即每个anchor的输出预测值为6个参数：(x,y,w,h, delta_alpha, delta_belta)，分别表示中心，倾斜框的外接矩形的宽和高以及偏移中心位置的两个量。以下图为例：

本质上将OP表示方式变成了6个参数表示方式。通过下面公式很容易得到OP的v1-v4四个角点的横纵坐标。

polys = torch.stack([ga, y1, x2, gb, _ga, y2, x1, _gb], dim=-1) # 平行四边形四个坐标
    center = torch.stack([gx, gy, gx, gy, gx, gy, gx, gy], dim=-1)  # 堆叠四次中心坐标
    center_polys = polys - center     # 计算每个坐标和中心的相对距离
    diag_len = torch.sqrt(            # 计算对角线长度,就是 勾股定理
        torch.square(center_polys[..., 0::2]) + torch.square(center_polys[..., 1::2]))
    max_diag_len, _ = torch.max(diag_len, dim=-1, keepdim=True)      # 获得长边长度
    diag_scale_factor = max_diag_len / diag_len                      # 获得resize比例
    # 将相对距离进行resize
    center_polys = center_polys * diag_scale_factor.repeat_interleave(2, dim=-1) 
    rectpolys = center_polys + center  # 相对距离在+上中心得到倾斜矩形四个坐标
    obboxes = rectpoly2obb(rectpolys).flatten(-2) # 转成五点表示法

2.2. RRoI Align

总结

OrientedRCNN论文解读

2.1. Oriented RPN

2.2. RRoI Align

继续阅读

简单文档分类——朴素贝叶斯算法朴素贝叶斯算法简单文档分类实例步骤总结朴素贝叶斯分类调用(sklearn)

考证大全 | 证券从业资格考试

敲黑板！2021年证券从业考试考点预测

2021年银行从业考试考情介绍,果断收藏!

证券从业合格证书什么时候打印？有哪些注意事项？

【干货满满】初级银行从业考试《个人理财》重点梳理

2020年经济师考试，难吗？

初级银行从业资格证有什么用？

MBA提前面试纯干货分享

MBA值得学么

吴恩达logistic回归实现

【人工智能行业大师访谈1】吴恩达采访 Geoffery Hinton

深度学习模型分析人类复杂疾病的准确性

【趋高机器视觉】机器视觉技术原理解析及解决方案

解码器用于语义分割：数据依赖的解码可以实现灵活的特征聚合

cs231n斯坦福基于卷积神经网络的CV学习笔记（一）KNN和线性分类器/分类器损失/反向传播一，KNN图像分类算法二，线性分类器三，线性分类器损失四，反向传播五，神经网络