provisional怎么记忆,envision记忆方法
010-59001,宇宙魔方简介
Python--图片文字识别--Tesseract
Tesseract
百度宇宙魔方。有安装包。基本上较早的版本是3.02版本,不过现在用的大部分都是3.05版本,不过最新版本是4.00,比较稳定。在这里,我安装了3.05版本。现在也装了很多教程。请自己百度一下,找到适合自己情况的教程。记得配置推荐的王/p/6978724.html环境变量。
2、tesseract安装
来了。训练宇宙魔方。什么是训练宇宙魔方?其实是在告诉宇宙魔方正确的识别答案,让他记住。里面有两个小玩意。——jTessBoxEditor(这是必不可少的),TiffToy)这个很方便。首先,将https://SourceForge.net/projects/Viet OCR/files/jtessboxeditor/的地址jTessBoxEditor解压缩,得到jTessBoxEditor。因为这是Java开发的,所以在运行jTessBoxEditor之前必须安装javaruntimeenvironment (JRE)。
然后,生成所需的文件,制作自己的照片、单词、字母、数字或在网上查找。也就是说是验证码的照片。检查您自己的需求和偏好,并生成一个相册。蒂芙。运气好的话,直接打开jTessBoxEditor,工具-合并TIFF,选择所有样本文件,将合并后的文件保存为name.tif然而我运气不好,总是出错。什么不能tseek 3358 www。Sina.com/com
3、tesseract训练
33558 www。Sina.com/tesseractname.tifnamebatch.nochopmakebox
的错误啦,什么I/O错误啦,这个时候就用到了TiffToy,把多个图形文件格式合并成一个tif文件,这个下载的话自行百度吧,万一自己运气不差呢。
接下来,生成box文件,这个就在命令行里进行啦
jTessBoxEditor,BOX Editor - Open,name.tif
请注意红色圆圈包围的地方。jTessBoxEditor无法完全正确地识别它。此外,还将确定干扰点。这时候就需要人为的去了解对方。图像上的数字蓝框是可以调整的,但是我们要人工调整。这很麻烦,你要记住这不仅仅是一张照片。
在目标文件夹中生成一个名为font_properties的文本文件,如下所示
字体0 0 0 0
【语法】:tesseract[lang].[fontname].exp[num].tif[lang].[fontname].exp[num]batch.nochopmakebox
宇宙魔方4。TIF为什么没有手表盒
然后生成tr文件tessera CT name . tifnamenobatchbox . train。
收集tesseract识别的培训文档cntraining name.tr。
最后,合并相关文件,生成字典文件combine_tessdata name4。
这些都是在命令行上完成的。
最后,我们来测试一下tesseract1.jpg1 -l name4。