Tesseract-OCR入門使用(3)-VS2010編譯源碼

2022-10-18 12:10:54

作者：我不是校長

本系列簡單介紹Tesseract-OCR 3.x版本如何上手使用，隻适用于入門級别。

1.源碼擷取

2.編譯

3.測試

1.源碼擷取

1.1擷取tesseract-ocr源碼

源碼下載下傳位址:https://github.com/tesseract-ocr/tesseract/tree/3.02.02

在github中可以根據需要選擇不同的版本

1.2因為Tesseract依賴Leptonica庫，是以還需要編譯Leptonica

源碼：leptonica-1.68.tar.gz

VS工程：vs2008-1.68.zip

相關頭檔案和庫：leptonica-1.68-win32-lib-include-dirs.zip

2.編譯

2.1編譯Leptonica

step1 将壓縮包解壓并移動位置如下圖

step2 在vs2008中找到工程并使用vs2010打開工程

step3 編譯

分别對Release和Debug進行編譯，一次成功。

2.2編譯tesseract-ocr

step1 在vs2008檔案夾中找到工程

step2 用vs2010轉換項目後報錯誤

錯誤 1 error C1083: 無法打開包括檔案:“allheaders.h”: No such file or directory

這是因為allheaders.h在Leptonica中，而兩個工程目錄沒有協調導緻。

解決方法：

調整目錄如下圖

step3 調整目錄後重新編譯，報錯

錯誤 2 error C2146: 文法錯誤: 缺少“}”(在辨別符“銆”的前面)

這是錯誤由于檔案編碼格式引起的。

解決方法：

選擇vs2010的菜單“檔案 -- 進階儲存選項”，在視窗中選擇“簡體中文（gb2312）-代碼頁936”，儲存後重新編譯。

終于成功

3.測試

參考資料：

1.《如何在windows上編譯Tesseract OCR》

2.《Tesseract-OCR 進行文字識别 VS2010》

3.《Tesseract-OCR學習系列（二）建構》

4.《Tesseract-OCR學習系列（三）簡例》

5.《幹貨：Tesseract的圖文識别！》

6.《VS2010編譯出現“error C2146: 文法錯誤: 缺少“;”(在辨別符“銆”的前面)”》

關注【OpenCV學習交流】

長按或者掃描下面二維碼即可關注

Tesseract-OCR入門使用(3)-VS2010編譯源碼

繼續閱讀

Git本地倉庫送出代碼到遠端倉庫出現報錯：fatal: ‘origin‘ does not appear to be a git repository fatal: Could not read fr

Python 報錯之 ValueError: too many values to unpack (expected 3)

用pyinstaller 子產品在打包代碼的，時候出現閃退的情況

python+vlc 實作視訊播放，需要安裝這個vlc這個子產品,使用pip install vlc安裝，出現無法找到子產品錯誤解決方法

《Vue學習》render函數

小e開發闆重新編譯刷寫測試AT例程全過程

Windows cd 無法切換盤符目錄

怎樣從0開始搭建一個測試架構_1——HTMLTestRunner報告HTMLTestRunner的代碼如下：

用Webpack啟動Vue項目時提示This is probably not a problem with npm,there is likely additional logging output

Android常見錯誤及解決辦法（一直更新）

【Unity開發小技巧】Unity日志輸出存儲

關于運作robot framework 報錯解決方法，ModuleNotFoundError: No module named ‘robot‘

【解決方法】Docker+uWSGI+Flask 報錯 ModuleNotFoundError: No module named ‘flask‘背景問題分析解決方案其他問題

react native Android 手機搖一搖與菜單鍵無效

虛拟作業系統：VMware無法安裝tools相關驅動的解決方法

npm install stylus --save失敗