安裝包
安裝包:https://pan.baidu.com/s/1WE_K-pWN53mHoHcimD0jVA 提取碼:8fwj
環境:Anaconda3
安裝過程
安裝Tesseract
解壓檔案,執行”tesseract-ocr-setup-4.00.00dev.exe”,預設安裝,本文安裝目錄為”C:\Tesseract-OCR”。把”tessdata-master.zip”解壓,把解壓後的内容,拷貝到”C:\Tesseract-OCR\tessdata”目錄下。
安裝完畢之後,設定環境變量:
TESSDATA_PREFIX= C:\Tesseract-OCR\tessdata
在Path中添加”C:\Tesseract-OCR”,進行上文操作之後,Tesseract-OCR安裝完畢。
安裝pytesseract
進入到pytesseract-0.2.6.tar.gz所在目錄,執行指令”pip install pytesseract-0.2.6.tar.gz”。
進入到pytesseract-0.2.6.tar.gz所在目錄,執行指令”pip install pytesseract-0.2.6.tar.gz”。安裝成功。
修改/Anaconda3/Lib/site-packages/pytesseract/pytesseract.py中的代碼:
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'
修改為類似如下,tesseract_cmd為Tesseract-OCR目錄下的tesseract檔案
# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = r'C:\Tesseract-OCR\tesseract'
測試
驗證圖檔:
測試代碼:
# -*- coding: utf-8 -*-
from PIL import Image
import pytesseract
imagepath="logo.png"
text=pytesseract.image_to_string(Image.open(imagepath),lang='chi_sim')
print(text)
執行執行上述代碼: