天天看點

python使用tesseract-ocr完成驗證碼識别(安裝部分)

一、tesseract-ocr安裝

Ubuntu版本:

1.tesseract-ocr安裝 

sudo apt-get install tesseract-ocr

2.pytesseract安裝 

sudo pip install pytesseract

3.Pillow 安裝 

sudo pip install pillow

其他linux版本(如centos):   

1.tesseract-ocr安裝 

沒找到直接指令安裝,是以需要手動下載下傳安裝包。 

https://github.com/tesseract-ocr/tesseract 

在上述位址中下載下傳最新的tesseract-ocr的安裝包,并解壓。 

通過以下指令安裝: 

(1)cd tesseract-3.04.01

(2)./autogen.sh

(3)./configure 

注意,如果出現error: leptonica not found,需要下載下傳安裝leptonica 

http://www.leptonica.org/download.html

(4)make

(5)make install

(6)ldconfig

2.pytesseract安裝 

sudo pip install pytesseract

3.Pillow 安裝 

sudo pip install pillow

windows版本:

1.tesseract-ocr安裝 

http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.00dev.exe 

下載下傳,并安裝。 

注意:如果是64位的使用者,在安裝的時需要改變安裝目錄,如下圖所示: 

python使用tesseract-ocr完成驗證碼識别(安裝部分)

2.pytesseract安裝 

pip install pytesseract

3.Pillow 安裝 

pip install pillow

二、windows下運作jTessBoxEditor

這是在windows下面運作的工具,主要用來對初始訓練的結果進行參數的調整。

1、安裝jdk1.8(網上找jdk1.8的安裝包,不支援1.7),然後在電腦上配置好java的環境變量

2、下載下傳https://ncu.dl.sourceforge.net/project/vietocr/jTessBoxEditor/jTessBoxEditor-2.0-Beta.zip

3、在檔案夾下運作train.bat檔案

python使用tesseract-ocr完成驗證碼識别(安裝部分)
python使用tesseract-ocr完成驗證碼識别(安裝部分)

轉載于:https://www.cnblogs.com/zhang-ke/p/7606396.html