天天看點

tesseract OCR庫在vs2010中的調用

首先下載下傳tesseract-3.02的資源包,http://download.csdn.net/download/lishuang1224/10012700裡面包含安裝的所有資源

一.安裝軟體和dll

1.下載下傳tesseract-3.02.02.exe,并安裝,我的安裝路徑為D:\Program Files (x86)\Tesseract-OCR

2.将第2個資源檔案中的tesseract-3.02.02-win32-lib-include-dirs.zip檔案解壓,将裡面的lib和include檔案夾複制到D:\Program Files (x86)\Tesseract-OCR目錄下

3.将上面資源中第3個檔案夾中的liblept168.dll,liblept168d.dll,libtesseract302d.dll複制到Tesseract-OCR\lib目錄下,并替換。

4.将第4個檔案夾下的chi_sim.traineddata,複制到D:\Program Files (x86)\Tesseract-OCR\tessdata下。

二.修改環境變量和配置環境

1.在系統PATH變量中增加D:\Program Files (x86)\Tesseract-OCR\lib。

2.配置vs2010的工程屬性

在包含目錄下新增:D:\Program Files (x86)\Tesseract-OCR\include\tesseract

在庫目錄下新增: C:\Program Files\Tesseract-OCR\lib

如圖:

tesseract OCR庫在vs2010中的調用

三.測試

建立vs2010工程:

#include "baseapi.h"    
#include "strngs.h" 
#include<iostream>
using namespace std;
#pragma comment(lib, "libtesseract302.lib") 

int main()    
{    
    const char * image = "2.png";    

    tesseract::TessBaseAPI  api;    
    api.Init(NULL, "eng", tesseract::OEM_DEFAULT);    
    api.SetVariable( "tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" );    

    STRING text_out;    
    if (!api.ProcessPages(image, NULL, , &text_out))    
    {    
        return ;    
    }    

    printf(text_out.string());  

    system("pause");

    return ;    
}
           

程式結果如下:

tesseract OCR庫在vs2010中的調用

原圖:

tesseract OCR庫在vs2010中的調用

繼續閱讀