驗證碼識别之Tesseract-OCR

2023-08-05 20:49:35

驗證碼識别之Tesseract-OCR

最近在寫一個關于驗證碼識别的程式，但效果總是不好，對于最簡單的驗證碼，對于圖像的預處理是最基本的，但是處理完成并分割後，預處理部分後面有時間再寫，主要問題是處理完之後識别過程。

因為沒使用深度學習的相關内容，最開始想到的是模闆比對，手動将10個數字裁剪出來之後，用了10個if，判斷哪個可信度最大，但是特别的差，後來不得不想其他辦法。

然後使用了SVM，利用已有資源手寫數字，對十個數字進行了訓練，得到的結果，也是準确率不高。

後來無奈下使用了tesseract進行嘗試，

首先是cmd下調用：

驗證碼識别之Tesseract-OCR

其次是python中調用也十分簡單，代碼如下：

驗證碼識别之Tesseract-OCR

但是在C++中調用就沒那麼容易了，我配置半天也總是提示亂碼，怎麼改也不對。是以放棄，正常的配置。但後來轉了個思路，使用C++調用python語言，然後再進行Tessercat的調用，最終成功。記錄一下過程，舉一反三，以備後面使用：

1、VS2017添加包含目錄python/include，庫目錄python/lib，debug需将lib中的版本+_d.lib,連結庫輸入pythonxx_d.lib，同時需要将pythonxx.dll添加進入系統檔案夾裡。

2、代碼如下：

#include <iostream>
#include "Python.h" 
int main(){ 
 Py_Initialize();
 PyRun_SimpleString("# coding: utf - 8");
 PyRun_SimpleString("import sys");
 PyRun_SimpleString("import numpy");
 PyRun_SimpleString("from PIL import Image");
 PyRun_SimpleString("import pytesseract"); 
 PyRun_SimpleString("print ('The Result: ')");
 PyRun_SimpleString("image = Image.open('C:/Users/14587/Desktop/3.png')");
 PyRun_SimpleString("content = pytesseract.image_to_string(image)"); 
 PyRun_SimpleString("print (content)");
 Py_Finalize(); 
 while (1) { 
  int i = 0;
 } 
 return 0;
}

驗證碼識别之Tesseract-OCR

驗證碼識别之Tesseract-OCR

驗證碼識别之Tesseract-OCR

繼續閱讀

【釋出】App Store 預覽視訊制作總結知乎專欄：AppStore預覽視訊制作心得

Linux下分卷壓縮較大的檔案

軟體測試作業2

解決pyinstaller打包exe出現selenium geckodriver黑視窗問題

為什麼運放輸入端串聯一個隔直電容後輸出沒有波形？------關于隔直電路的簡要了解前言一、常見的錯誤隔直電路二、正确的隔直電路

聯想拯救者Y7000p拆機換壓條(軸蓋)

麥博FC330低音炮拆機圖（簡易版）

xml解析失敗Invalid byte 1 of 1-byte UTF-8 sequence

2020年終總結和展望前言一、2020年終總結二、2021年展望

一場春雨，一個帶着泥土芬芳的記憶

在DOS下運作不了ipconfig指令

開博一周年

MathType

【可靠性評估】電力系統可靠性評估matlab仿真1.軟體版本2.本算法理論知識

在linux下安裝GSL庫以及在codeblocks上配置GSL庫一在 linux 上安裝 GSL 二在codeblocks 上按如下方式配置 GSL庫：三測試程式

swmm與lisflood-fp源碼如何一起編譯 CMake指令