SpringBoot+Tess4j实现牛逼的OCR识别工具的示例代码

SpringBoot+Tess4j实现牛逼的OCR识别工具的示例代码

本文主要介绍SpringBoot Tess4j的示例代码,以实现令人敬畏的OCR识别工具。本文详细介绍了示例代码,对大家的学习或工作有一定的参考价值。下面让我们跟随边肖一起学习。

前言

“我等不及你的脸颊在风中。

眼泪很美,很和谐。

等不及要下雨了。

我的眼泪被你发现了”

听着循环的歌,写着久违的bug。好吧,还有一天。刚刚有个小伙伴说,要不要做个工具站来玩?随便找了一个工具站,看了一下,发现很多都有OCR识别功能。所以,我想起了之前知道的非常热门的开源OCR神级项目,Tesseract OCR。

简单介绍

官网如下图。

tesseract-ocr.github.io/

简洁明了,github上挂的网站。

就不详细介绍了。如果你有兴趣,你可以访问同性恋网站:https://github.com/tesseract-ocr/tesseract,观察和学习。

实操准备

如果要在开发中使用,还是需要访问相应的API。

对于开发人员来说,提供了许多包装器来实现Api调用。

对于一个Java的小开发者来说,tess4j还是作为Api使用的。官方网站如下:

tess4j.sourceforge.net/

可以直接下载jar包,也可以通过Maven依赖下载。

!-https://mvn repository . com/artifact/net . SourceForge . Tess 4j/Tess 4j-

属国

groupId net . SourceForge . tess4j/groupId

artifactIdtess4j/artifactId

版本4 . 5 . 3/版本

/依赖关系

开发实现

First 创建工程Second 添加依赖

?xml版本=1.0 编码=UTF-8 ?

项目xmlns= http://maven . Apache . org/POM/4 . 0 . 0

xmlns:xsi= http://www . w3 . org/2001/XML schema-instance

xsi:schema location= http://maven . Apache . org/POM/4 . 0 . 0 http://maven.apache.org/xsd/maven-4.0.0.xsd

型号版本4 . 0 . 0/型号版本

groupIdorg.example/groupId

artifactId test-text ocr/artifactId

1.0版-快照/版本

属国

!-https://mvn repository . com/artifact/net . SourceForge . Tess 4j/Tess 4j-

属国

groupId net . SourceForge . tess4j/groupId

artifactIdtess4j/artifactId

版本4 . 5 . 3/版本

/依赖关系

/依赖关系

/项目

Third 填写类文件

包装ocr

导入net . SourceForge . Tess 4j . itesseract;

导入net . SourceForge . Tess 4j . tesserac t;

导入net . SourceForge . Tess 4j . tesserac exception;

导入javax . imageio . imageio;

导入Java . awt . image . buffered image;

导入Java . io . io exception;

/**

* ocr测试。

*

* @作者huc_逆天

* @自2021/1/12 17:42

*/

公共类TestTextOcr {

公共静态void main(String[] args)引发IOException {

//创建一个实例

ITesseract instance=new tessera CT();

//设置识别语言

instance . set language( chi _ sim );

//设置识别引擎

instance . setocrenginemode(1);

//读取文件

buffered image image=imageio . read(testtextocr . class . getresourceasstream(/2 . jpg ));

尝试{

//识别

string result=instance . doocr(image);

System.out.println(结果);

} catch(tesserac exception e){

system . err . println(e . getmessage());

}

}

}

Fifth 添加训练语言环境配置

TESSDATA_PREFIX=F:tessdata,变量名,固定,值为官网下载文件的https://github.com/tesseract-ocr/tessdata

Sixth 运行

结果如下:

有可能识别出模式。不太合适。换一下。

instance . setocrenginemode(0);

是不是舒服多了,哈哈。识别率瞬间上升。

你可以自己测试一下。

总结

好了,今天就到这里。技术在于折腾。多学习,武装自己,变强。

以上就是本文关于SpringBoot Tess4j实现牛逼OCR识别工具的样例代码。有关SpringBoot Tess4j OCR识别的更多信息,请搜索我们以前的文章或继续浏览下面的相关文章。希望大家以后能多多支持我们!

SpringBoot+Tess4j实现牛逼的OCR识别工具的示例代码