Tesseract-OCR是一款關于中文的識别,并且是開源的,識别效果比較好的軟體包。
接下來給大家介紹Python驗證碼識别tesseract-ocr安裝,報錯解決。
工具/原料
- tesseract-ocr
方法/步驟
-
1
首先需要下載下傳tesseract-ocr
以下是下載下傳位址
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe
下載下傳好後,輕按兩下tesseract-ocr-setup-4.00.00dev.exe安裝,彈出歡迎界面,如下圖所示
-
2
第二步,勾選【同意協定】,點選【next】即可
-
3
選擇安裝使用者,選擇勾選【全部使用者】
-
4
選擇安裝功能,其他的預設即可,但是一定要選擇這個語言包哦,這個語言包就是簡體中文
-
5
選好安裝目錄後,點選【next】下一步
-
6
預設的點選下一步【next】,下一步【next】進行安裝即可
-
7
安裝完成後,點選下一步【next】即可,點選【finish】完成即可
-
8
最後一步,如果報錯資訊如下圖所示,怎麼辦?
其實百度搜尋有很多的解決方案,小編想說的是,小編親自實踐解決的一種方法,希望能有所幫助。
text = pytesseract.image_to_string(Image.open('C:\\Users\\123.png'), , config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"')
在使用的時候,加上以下這段即可
config='--tessdata-dir "C:\\Program Files (x86)\\Tesseract-OCR\\tessdata"'