天天看点

tesseract OCR库在vs2010中的调用

首先下载tesseract-3.02的资源包,http://download.csdn.net/download/lishuang1224/10012700里面包含安装的所有资源

一.安装软件和dll

1.下载tesseract-3.02.02.exe,并安装,我的安装路径为D:\Program Files (x86)\Tesseract-OCR

2.将第2个资源文件中的tesseract-3.02.02-win32-lib-include-dirs.zip文件解压,将里面的lib和include文件夹复制到D:\Program Files (x86)\Tesseract-OCR目录下

3.将上面资源中第3个文件夹中的liblept168.dll,liblept168d.dll,libtesseract302d.dll复制到Tesseract-OCR\lib目录下,并替换。

4.将第4个文件夹下的chi_sim.traineddata,复制到D:\Program Files (x86)\Tesseract-OCR\tessdata下。

二.修改环境变量和配置环境

1.在系统PATH变量中增加D:\Program Files (x86)\Tesseract-OCR\lib。

2.配置vs2010的工程属性

在包含目录下新增:D:\Program Files (x86)\Tesseract-OCR\include\tesseract

在库目录下新增: C:\Program Files\Tesseract-OCR\lib

如图:

tesseract OCR库在vs2010中的调用

三.测试

建立vs2010工程:

#include "baseapi.h"    
#include "strngs.h" 
#include<iostream>
using namespace std;
#pragma comment(lib, "libtesseract302.lib") 

int main()    
{    
    const char * image = "2.png";    

    tesseract::TessBaseAPI  api;    
    api.Init(NULL, "eng", tesseract::OEM_DEFAULT);    
    api.SetVariable( "tessedit_char_whitelist", "0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz" );    

    STRING text_out;    
    if (!api.ProcessPages(image, NULL, , &text_out))    
    {    
        return ;    
    }    

    printf(text_out.string());  

    system("pause");

    return ;    
}
           

程序结果如下:

tesseract OCR库在vs2010中的调用

原图:

tesseract OCR库在vs2010中的调用

继续阅读