Java使用Tess4J实现图像识别方式

 更新时间:2021年10月30日 08:57:14   作者:占位符号  
这篇文章主要介绍了Java使用Tess4J实现图像识别方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

Java Tess4J实现图像识别

最近需要用Java做一个图像识别的东西,查了一些资料,在此写一个基于Tess4J的教程,方便其他人参考和使用。

其实做图像识别,也可以使用TESSERACT-OCR来实现,但是该方式需要下载软件,在电脑上安装环境,移植性不高,使用Tess4J只需要下载相关Jar包,导入项目,再把项目封装好就可以处处运行了。

首先,下载Tess4J的相关资源(一个压缩包)

官网http://tess4j.sourceforge.net/codesample.html

解压,其中的目录结构如下:

需要用到其中圈起来的三个文件夹中的东西。lib文件夹下放的是需要用到的Jar包,tessdata下放的是语言库,默认的有英语库,中文库需要另外下载,下载地址:https://github.com/tesseract-ocr/tessdata/blob/master/chi_sim.traineddata。

新建一个Java项目,将lib文件夹和tessdata文件夹复制到项目的根目录下,找到dist文件夹下的tess4j.jar(名字可能有版本号),将该文件也复制到项目根目录下的lib文件夹下。

项目的的目录如下

lib中的文件如下(tess4J.jar也在该目录下)

再在eclipse中打开项目

在项目中导入lib文件夹中所有的jar包(Build path --> configure build path),导入后的结果如下:

这样前期准备工作就完成了,下面就剩下代码了。

Tess4J的代码比较简洁

如下:

Tess4JTest.java

package ocr; 
import net.sourceforge.tess4j.ITesseract;
import net.sourceforge.tess4j.Tesseract;
import net.sourceforge.tess4j.TesseractException;
import net.sourceforge.tess4j.util.LoadLibs; 
import java.io.File;
import java.io.IOException;
 
/**
 * Tess4J测试类
 */
public class Tess4JTest { 
    public static void main(String[] args){ 
    	String path = "D://Java//Tess4J";//我的项目存放路径    	
    	File file = new File(path + "//photo.jpg");
        ITesseract instance = new Tesseract();
 
        /**
         *  获取项目根路径,例如: D:\IDEAWorkSpace\tess4J
         */
        File directory = new File(path);
        String courseFile = null;
        try {
            courseFile = directory.getCanonicalPath();
        } catch (IOException e) {
            e.printStackTrace();
        }
 
        //设置训练库的位置
        instance.setDatapath(courseFile + "//tessdata"); 
        instance.setLanguage("eng");//chi_sim :简体中文, eng	根据需求选择语言库
        String result = null;
        try {
            long startTime = System.currentTimeMillis();
             result =  instance.doOCR(file);
            long endTime = System.currentTimeMillis();
            System.out.println("Time is:" + (endTime - startTime) + " 毫秒");
        } catch (TesseractException e) {
            e.printStackTrace();
        }
        
        System.out.println("result: ");
        System.out.println(result);
    } 
}

这样就搞定了。

效果如下

原图:

读取结果:

从结果来看准确率还有待提高,l 和 1分不清,0 和 O 也没有分清,汉字的准确率还要低一些,大家可以自行训练字体库优化。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Java几种分布式全局唯一ID生成方案

    Java几种分布式全局唯一ID生成方案

    本文主要介绍了聊聊几种分布式全局唯一ID生成方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-01-01
  • Lambda表达式的使用及注意事项

    Lambda表达式的使用及注意事项

    这篇文章主要介绍了Lambda表达式的使用及注意事项,主要围绕 Lambda表达式的省略模式 Lambda表达式和匿名内部类的区别的相关内容展开详情,感兴趣的小伙伴可以参考一下
    2022-06-06
  • Java微信授权登陆的实现示例

    Java微信授权登陆的实现示例

    微信授权登录,官方文档写的比较简洁。所以对于会的人一目了然,而对于新手刚入门的人来说是举步维艰。本文详细的介绍了Java微信授权登陆的实现示例,感兴趣的朋友可以了解一下
    2021-06-06
  • Java 时间转换的实例代码

    Java 时间转换的实例代码

    下面小编就为大家带来一篇Java 时间转换的实例代码。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-07-07
  • IntelliJ IDEA快速查看某个类/接口的子类或父类

    IntelliJ IDEA快速查看某个类/接口的子类或父类

    本文主要介绍了IntelliJ IDEA快速查看某个类/接口的子类或父类,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-07-07
  • 解决RedisTemplate的key默认序列化器的问题

    解决RedisTemplate的key默认序列化器的问题

    这篇文章主要介绍了解决RedisTemplate的key默认序列化器的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • 基于hashmap 的扩容和树形化全面分析

    基于hashmap 的扩容和树形化全面分析

    这篇文章主要介绍了hashmap 的扩容和树形化的使用,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-06-06
  • SpringBoot加载启动的源码解析

    SpringBoot加载启动的源码解析

    这篇文章主要介绍了SpringBoot加载启动的源码解析,@SpringBootApplication注解是Spring Boot的核心注解,它其实是一个组合注解,本身其实也是一个IoC容器的配置类,需要的朋友可以参考下
    2023-12-12
  • 使用ftpClient下载ftp上所有文件解析

    使用ftpClient下载ftp上所有文件解析

    最近项目需要写个小功能,需求就是实时下载ftp指定文件夹下的所有文件(包括子目录)到本地文件夹中,保留文件到目录路径不变。今天小编给大家分享使用ftpClient下载ftp上所有文件的方法,需要的的朋友参考下吧
    2017-04-04
  • Java编程打印购物小票实现代码

    Java编程打印购物小票实现代码

    这篇文章主要介绍了Java编程打印购物小票实现代码,具有一定参考价值,需要的朋友可以了解下。
    2017-11-11

最新评论