算法概述:
首先对源图像与要筛选的图像进行直方图数据采集,对采集的各自图像直方图进行归一化再
使用巴氏系数算法对直方图数据进行计算,最终得出图像相似度值,其值范围在[0, 1]之间
0表示极其不同,1表示极其相似(相同)。
算法步骤详解:
大致可以分为两步,根据源图像与候选图像的像素数据,生成各自直方图数据。第二步:使
用第一步输出的直方图结果,运用巴氏系数(bhattacharyya coefficient)算法,计算出相似程
度值。
第一步:直方图计算
直方图分为灰度直方图与rgb直方图,对于灰度图像直方图计算十分简单,只要初始化一
个大小为256的直方图数组h,然后根据像素值完成频率分布统计,假设像素值为124,则
h[124] += 1, 而对于彩色rgb像素来说直方图表达有两种方式,一种是单一直方图,另外一
种是三维直方图,三维直方图比较简单明了,分别对应rgb三种颜色,定义三个直方图hr,
hg, hb, 假设某一个像素点p的rgb值为(4, 231,129), 则对于的直方图计算为hr[4] += 1,
hg[231] += 1, hb[129] += 1, 如此对每个像素点完成统计以后,rgb彩色直方图数据就生成了。
而rgb像素的单一直方图sh表示稍微复杂点,每个颜色的值范围为0 ~ 255之间的,假设
可以分为一定范围等份,当8等份时,每个等份的值范围为32, 16等份时,每个等份值范
围为16,当4等份时候,每个等份值的范围为64,假设rgb值为(14, 68, 221), 16等份之
后,它对应直方图索引值(index)分别为: (0, 4, 13), 根据计算索引值公式:index = r + g*16 + b*16*16
对应的直方图index = 0 + 4*16 + 13 * 16 * 16, sh[3392] += 1
如此遍历所有rgb像素值,完成直方图数据计算。
第二步:巴氏系数计算,计算公式如下:

其中p, p’分别代表源与候选的图像直方图数据,对每个相同i的数据点乘积开平方以后相加
得出的结果即为图像相似度值(巴氏系数因子值),范围为0到1之间。
程序效果:
相似度超过99%以上,极其相似
相似度为:72%, 一般相似
程序直方图计算源代码如下:
public void setgreenbincount(int greenbincount) {
this.greenbins = greenbincount;
}
public void setbluebincount(int bluebincount) {
this.bluebins = bluebincount;
public float[] filter(bufferedimage src, bufferedimage dest) {
int width = src.getwidth();
int height = src.getheight();
int[] inpixels = new int[width*height];
float[] histogramdata = new float[redbins * greenbins * bluebins];
getrgb( src, 0, 0, width, height, inpixels );
int index = 0;
int redidx = 0, greenidx = 0, blueidx = 0;
int singleindex = 0;
float total = 0;
for(int row=0; row<height; row++) {
int ta = 0, tr = 0, tg = 0, tb = 0;
for(int col=0; col<width; col++) {
index = row * width + col;
ta = (inpixels[index] >> 24) & 0xff;
tr = (inpixels[index] >> 16) & 0xff;
tg = (inpixels[index] >> 8) & 0xff;
tb = inpixels[index] & 0xff;
redidx = (int)getbinindex(redbins, tr, 255);
greenidx = (int)getbinindex(greenbins, tg, 255);
blueidx = (int)getbinindex(bluebins, tb, 255);
singleindex = redidx + greenidx * redbins + blueidx * redbins * greenbins;
histogramdata[singleindex] += 1;
total += 1;
}
}
// start to normalize the histogram data
for (int i = 0; i < histogramdata.length; i++)
{
histogramdata[i] = histogramdata[i] / total;
return histogramdata;
计算巴氏系数的代码如下:
/**
* bhattacharyya coefficient
* http://www.cse.yorku.ca/~kosta/compvis_notes/bhattacharyya.pdf
*
* @return
*/
public double modelmatch() {
histogramfilter hfilter = new histogramfilter();
float[] sourcedata = hfilter.filter(sourceimage, null);
float[] candidatedata = hfilter.filter(candidateimage, null);
double[] mixeddata = new double[sourcedata.length];
for(int i=0; i<sourcedata.length; i++ ) {
mixeddata[i] = math.sqrt(sourcedata[i] * candidatedata[i]);
}
// the values of bhattacharyya coefficient ranges from 0 to 1,
double similarity = 0;
for(int i=0; i<mixeddata.length; i++ ) {
similarity += mixeddata[i];
// the degree of similarity
return similarity;