利用Tess4J实现图片识别

2018-05-07 23:50:00

一、下载

1.进入官网下载页面

https://sourceforge.net/projects/tess4j/ 2.点击download

3.下载后解压，目录如下，圈出的三个文件夹是需要用到的

二、使用Tess4J

1.将dist和lib下的包导入java项目

2.将 tessdata 文件夹复制进项目的根目录

3.示范代码如下

public class OCRDemo {

    public static void main(String[] args) {
        try {
            double start=System.currentTimeMillis();
            File imageFile = new File("C:\\Users\\dan\\Desktop\\12345.png");//图片位置
            ITesseract instance = new Tesseract();
            //instance.setDatapath("");//设置tessdata位置
            instance.setLanguage("chi_sim");//选择字库文件
            String result = instance.doOCR(imageFile);//开始识别
            double end=System.currentTimeMillis();
            System.out.println(result);//打印图片内容
            System.out.println("耗时"+(end-start)/1000+" s");
        } catch (TesseractException e) {
            e.printStackTrace();
        }
    }

}

注意事项：

①如果tessdata没有放入根目录，务必设置teedata的位置

instance.setDatapath("");//设置tessdata位置

②选择字库文件不需要写上后缀，默认 tessdata 包中可能没有 chi_sim 这个中文包，需要自己下载

https://github.com/tesseract-ocr/tessdata

三、运行结果

官方字库识别率还是偏低的，如果对精度要求高的话需要自己训练字库了

利用Tess4J实现图片识别

继续阅读

关于Gradle配置的小结

Java小案例——随机数猜测随机数猜测

nginx location中斜线的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的简单使用

neo4j之cypher使用文档

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

mybatis_入门程序Mybatis入门

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

scala (3) Function 和 Method