天天看点

这是一篇转载:HOG特征(这是我看到过的讲的最适合我的博客)                          图像处理之特征提取:HOG特征简单梳理

这篇博客写的好好啊,尤其是原博主自己画的图,点赞收藏评论已经不能满足我了,于是我专门去学了怎么转载csdn上的文章。。。大家都去看原文吧,原文排版更好看,我刚学会转载,排版很奇怪。

只说2点 当时不太明白现在明白的,不过也可能我又理解错了

1下面那个7和15个扫描窗口来自于 ((64-16)/8)+1=7,64是水平长度,16是因为一个cell边长为8,一个block有2x2个cell,所以是2x8=16,公式中的8是步长,其实就是拿一个block去盖图片,每次移动一个步长,即8像素,水平方向能盖7次,因为一个block是16x16像素的。

2下面那个9个直方图的bin,论文里面说,9是试验做出来的,论文名:Histograms of Oriented Gradients for Human Detection,下载链接 http://www.micc.unifi.it/delbimbo/wp-content/uploads/2011/03/reference_papers/Dalal.pdf

转载自博主Coming_is_winter,

原博客链接 https://blog.csdn.net/coming_is_winter/article/details/72850511

写得好好,这篇是我转载的,大家去看原文,看原文,看原文,重要的事情说三遍,原文有评论!

以下是原博客内容

                          图像处理之特征提取:HOG特征简单梳理

           HOG方向梯度直方图,这里分解为方向梯度与直方图。

一、方向梯度

梯度:在向量微积分中,标量场的梯度是一个向量场。标量场中某一点上的梯度指向标量场增长最快的方向,梯度的长度是这个最大的变化率。更严格的说,从欧几里得空间Rn到R的函数的梯度是在Rn某一点最佳的线性近似。在这个意义上,梯度是雅可比矩阵的一个特殊情况。

      在单变量的实值函数的情况,梯度只是导数,或者,对于一个线性函数,也就是线的斜率。

在图像中梯度的概念也是像素值变换最快的方向,把边缘(在图像合成中单一物体的轮廓叫做边缘)引入进来,边缘与梯度保持垂直方向。

这是一篇转载:HOG特征(这是我看到过的讲的最适合我的博客)                          图像处理之特征提取:HOG特征简单梳理

                                                                                                     图1

方向梯度中的方向是如何确定的?P0到P1的梯度方向:

这是一篇转载:HOG特征(这是我看到过的讲的最适合我的博客)                          图像处理之特征提取:HOG特征简单梳理

                                                                                                        图2

具体在HOG中方向梯度的实现:首先用[-1,0,1]梯度算子对原图像做卷积运算,得到x方向(水平方向,以向右为正方向)的梯度分量gradscalx,然后用[1,0,-1]T梯度算子对原图像做卷积运算,得到y方向(竖直方向,以向上为正方向)的梯度分量gradscaly。然后再用以下公式计算该像素点的梯度大小和方向。

这是一篇转载:HOG特征(这是我看到过的讲的最适合我的博客)                          图像处理之特征提取:HOG特征简单梳理

二、直方图

  直方图是一个图像处理中用的比较多的概念,想深入了解,可以度娘一下。

三、方向梯度直方图HOG的提取

  方向梯度直方图为图像局部区域的梯度特征量统计,我们为什么要提取这个东东呢?

     HOG主要应用于行人检测方面,以行人照片为例。

这是一篇转载:HOG特征(这是我看到过的讲的最适合我的博客)                          图像处理之特征提取:HOG特征简单梳理

                                                                                                        图3

  上图是一张行人图的四种表示方式,原三色图,灰度图,边缘图,梯度图,人脑根据前期学习与先验知识很容易理解到图像中包含着一个行人,并可以根据一定情况将其从图像中抠选出来,但计算机是怎么思考的呢?怎样让计算机理解以上图像中包含的是一个行人呢?前三个图像现在情况不适用,所以选取梯度图,现在的梯度图同样也是人脑处理理解的平面结果,计算机是办不到的,需要将直观地的梯度图像转换成一种计算机容易理解的数据特征语言。

  

  对于64*128的图像而言,每8*8的像素组成一个cell,每2*2个cell组成一个块,以8个像素为步长,那么,水平方向将有7个扫描窗口,垂直方向将有15个扫描窗口。也就是说,64*128的图片,总共有36*7*15=3780个特征。这里截取梯度图的一部分画图进行理解,尺寸与比例并不精确。

这是一篇转载:HOG特征(这是我看到过的讲的最适合我的博客)                          图像处理之特征提取:HOG特征简单梳理

                                                                                                          图4

  单独将其中一个8*8的小格拿出来,方向梯度中指的方向范围为2π,360°,为了画直方图我们还需要选取合适的组距也就是bin,这里组距选取2π/9,也就是最后的直方图组数为9。下图为8*8像素的cell对应的方向梯度(未全部画出,共有8*8=64个)。

这是一篇转载:HOG特征(这是我看到过的讲的最适合我的博客)                          图像处理之特征提取:HOG特征简单梳理

                                                                                                   图5

  将上面的64个方向梯度,按着直方图的参数设置进行画图,其中梯度的大小在统计数量中呈线性关系,比如梯度大小为2,则直方图对应增加2个单位,

        画出的对应直方图假设如下所示:

这是一篇转载:HOG特征(这是我看到过的讲的最适合我的博客)                          图像处理之特征提取:HOG特征简单梳理

                                                                                                              图6

  把上图中单个cell对应的方向直方图转换为单维向量,也就是按规定组距对对应方向梯度个数进行编码,(8,10,6,12,4,5,8,6,14),得到单个cell的9个特征,每个block(扫描窗口)包含2*2个cell也就是2*2*9=36个特征,一个64*128大小的图像最后得到的特征数为36*7*15=3780个。这样将一幅直观的梯度图通过分解提取变为计算机容易理解的特征向量。

  以上工作为HOG提取的主要内容,最后得到对应的行人的由方向梯度直方图HOG提取到的特征向量,但是计算机还是不知道这个数据数组代表了什么意思,什么时候这组向量代表行人,什么时候代表其他东西,怎样train,最后通过不断地学习,而后在检测积累的基础上对对未知图像检测识别有没有行人呢?那就是后一步SVM要做的事了。

参考文献:

      目标检测的图像特征提取之(一)HOG特征  

                          图像处理之特征提取:HOG特征简单梳理

继续阅读