天天看點

Tesseract-OCR+pytesseract驗證碼環境搭建及簡單demo操作執行個體

安裝包

安裝包:​​https://pan.baidu.com/s/1WE_K-pWN53mHoHcimD0jVA ​​ 提取碼:8fwj 

環境:Anaconda3

安裝過程

安裝Tesseract

解壓檔案,執行”tesseract-ocr-setup-4.00.00dev.exe”,預設安裝,本文安裝目錄為”C:\Tesseract-OCR”。把”tessdata-master.zip”解壓,把解壓後的内容,拷貝到”C:\Tesseract-OCR\tessdata”目錄下。

安裝完畢之後,設定環境變量:

TESSDATA_PREFIX= C:\Tesseract-OCR\tessdata

在Path中添加”C:\Tesseract-OCR”,進行上文操作之後,Tesseract-OCR安裝完畢。

安裝pytesseract

進入到pytesseract-0.2.6.tar.gz所在目錄,執行指令”pip install pytesseract-0.2.6.tar.gz”。

進入到pytesseract-0.2.6.tar.gz所在目錄,執行指令”pip install pytesseract-0.2.6.tar.gz”。安裝成功。

修改/Anaconda3/Lib/site-packages/pytesseract/pytesseract.py中的代碼:

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'      

修改為類似如下,tesseract_cmd為Tesseract-OCR目錄下的tesseract檔案

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = r'C:\Tesseract-OCR\tesseract'      

測試

驗證圖檔:

Tesseract-OCR+pytesseract驗證碼環境搭建及簡單demo操作執行個體

測試代碼:

# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract

imagepath="logo.png"

text=pytesseract.image_to_string(Image.open(imagepath),lang='chi_sim')
print(text)      
Tesseract-OCR+pytesseract驗證碼環境搭建及簡單demo操作執行個體
Tesseract-OCR+pytesseract驗證碼環境搭建及簡單demo操作執行個體

執行執行上述代碼:

繼續閱讀