在OCR識别過程中,碰到一些情況的處理方法:
1. 如果圖像是倒過來的
可以使用mirror_image算子對圖像進行鏡像處理,将颠倒的圖像轉正
mirror_image
Image:輸入圖像
ImageMirror:輸出鏡像後的圖像
Mode:翻轉軸
2. 關于預處理:主要包括濾波和拉開圖像對比度
濾波主要使用三種:中值濾波、均值濾波、高斯濾波
拉開對比度,主要會使用到的算子有:
gray_range_image
gray_erosion
scale_image
拉開對比度,主要是為了更好的進行接下來的二值化處理
3. 關于形态學方面的東西
形态學主要包括四種方式:膨脹、腐蝕、開運算、閉運算
對于二值化圖像和區域,膨脹和閉運算增加的是像素(面積),腐蝕和開運算減少的是像素(面積)
對于灰階圖像:膨脹和閉運算會讓圖像變得更亮,腐蝕和開運算會讓圖像變得更暗
開運算:先腐蝕後膨脹,較少像素,但是減少的像素比純腐蝕要少
閉運算,先膨脹後腐蝕,增加像素,但是增加的像素比純膨脹要少