天天看點

人工智能講師葉梓人工智能之深度學習計算機視覺:計算機視覺OCR識别-3最後講解下深度學習方法其他辦法

接一篇,聯系人工智能講師葉梓老師課程合作,可點選 個人首頁

最後講解下深度學習方法

以全卷積為基礎的深度學習方法是一種二值化方法,具體讀者可以閱讀論文《Multi-Scale Fully Convolution NeuralNetwork》,該論文由 Chris Tensmeyer等人于2017年提出,該論文利用多尺度全卷積神經網絡對文檔圖像進行二值化,并在 DIBCO和 PLM這兩個資料集上取得了良好的效果。

本文指出,傳統的全局門檻值和局部門檻值都忽略了像素點的排列,邊緣檢測和馬爾科夫随機場算法對前景形狀有很大的偏置,但 FCN能夠通過訓練資料學習和挖掘出像素點在空間上的聯系,而不是依靠人工設定的局部形狀的偏置。

其他辦法

2016年, RupinderKaur等人提出了一種基于形态學和門檻值的文檔圖像二值化方法,主要步驟如下:

RGB圖象轉換為灰階圖象;

二、是圖像濾波處理;

三、數學形态運算;

四、是門檻值操作。

更多課程,及老師資料可點選 個人首頁

繼續閱讀