本文主要介绍SpringBoot Tess4j的示例代码,以实现令人敬畏的OCR识别工具。本文详细介绍了示例代码,对大家的学习或工作有一定的参考价值。下面让我们跟随边肖一起学习。
前言
“我等不及你的脸颊在风中。
眼泪很美,很和谐。
等不及要下雨了。
我的眼泪被你发现了”
听着循环的歌,写着久违的bug。好吧,还有一天。刚刚有个小伙伴说,要不要做个工具站来玩?随便找了一个工具站,看了一下,发现很多都有OCR识别功能。所以,我想起了之前知道的非常热门的开源OCR神级项目,Tesseract OCR。
简单介绍
官网如下图。
tesseract-ocr.github.io/
简洁明了,github上挂的网站。
就不详细介绍了。如果你有兴趣,你可以访问同性恋网站:https://github.com/tesseract-ocr/tesseract,观察和学习。
实操准备如果要在开发中使用,还是需要访问相应的API。
对于开发人员来说,提供了许多包装器来实现Api调用。
对于一个Java的小开发者来说,tess4j还是作为Api使用的。官方网站如下:
tess4j.sourceforge.net/
可以直接下载jar包,也可以通过Maven依赖下载。
!-https://mvn repository . com/artifact/net . SourceForge . Tess 4j/Tess 4j-
属国
groupId net . SourceForge . tess4j/groupId
artifactIdtess4j/artifactId
版本4 . 5 . 3/版本
/依赖关系
开发实现
First 创建工程Second 添加依赖?xml版本=1.0 编码=UTF-8 ?
项目xmlns= http://maven . Apache . org/POM/4 . 0 . 0
xmlns:xsi= http://www . w3 . org/2001/XML schema-instance
xsi:schema location= http://maven . Apache . org/POM/4 . 0 . 0 http://maven.apache.org/xsd/maven-4.0.0.xsd
型号版本4 . 0 . 0/型号版本
groupIdorg.example/groupId
artifactId test-text ocr/artifactId
1.0版-快照/版本
属国
!-https://mvn repository . com/artifact/net . SourceForge . Tess 4j/Tess 4j-
属国
groupId net . SourceForge . tess4j/groupId
artifactIdtess4j/artifactId
版本4 . 5 . 3/版本
/依赖关系
/依赖关系
/项目
Third 填写类文件包装ocr
导入net . SourceForge . Tess 4j . itesseract;
导入net . SourceForge . Tess 4j . tesserac t;
导入net . SourceForge . Tess 4j . tesserac exception;
导入javax . imageio . imageio;
导入Java . awt . image . buffered image;
导入Java . io . io exception;
/**
* ocr测试。
*
* @作者huc_逆天
* @自2021/1/12 17:42
*/
公共类TestTextOcr {
公共静态void main(String[] args)引发IOException {
//创建一个实例
ITesseract instance=new tessera CT();
//设置识别语言
instance . set language( chi _ sim );
//设置识别引擎
instance . setocrenginemode(1);
//读取文件
buffered image image=imageio . read(testtextocr . class . getresourceasstream(/2 . jpg ));
尝试{
//识别
string result=instance . doocr(image);
System.out.println(结果);
} catch(tesserac exception e){
system . err . println(e . getmessage());
}
}
}
Fifth 添加训练语言环境配置TESSDATA_PREFIX=F:tessdata,变量名,固定,值为官网下载文件的https://github.com/tesseract-ocr/tessdata
Sixth 运行结果如下:
有可能识别出模式。不太合适。换一下。
instance . setocrenginemode(0);
是不是舒服多了,哈哈。识别率瞬间上升。
你可以自己测试一下。
总结好了,今天就到这里。技术在于折腾。多学习,武装自己,变强。
以上就是本文关于SpringBoot Tess4j实现牛逼OCR识别工具的样例代码。有关SpringBoot Tess4j OCR识别的更多信息,请搜索我们以前的文章或继续浏览下面的相关文章。希望大家以后能多多支持我们!