ctpn原理,ctpn训练自己的数据

  ctpn原理,ctpn训练自己的数据

  制作CTPN数据集

  需要注意的是,在制作CTPN数据集时,CTPN需要4个坐标和8个点。所以建议直接用labelimg获取xml格式进行后续操作。用labelme标注json文件需要去网上找代码,批量转换成xml。而且需要找到2个坐标和4个点才能把代码转换成4个坐标和8个点。

  标记数据集通过使用工具labelimg安装过程(假设安装了anaconda)创建一个单独的环境库使用命令conda Create-n labelimg python=3 . 6 . 6激活环境conda激活labelImg安装包pip安装labelImg输入命令labeli。mg labelimg界面打开如下:labelimg ctrl S的一些快捷键将所有图片保存在Ctrl u加载目录下,鼠标点击Open dir同功能Ctrl r改变默认的注释目录(保存xml文件的地址)W创建矩形框A上一张图片D下一张del删除选中的矩形框并将文件保存为xml格式如下

  Xml到txt参考博客:xml到txt

  取消34行和35行的注释,在37行加上另外两个点坐标,就可以得到四个点的位置。

  拆分拆分源代码

  使用split.py和utils.py文件,直接运行split.py文件即可。

  你需要修改DATA_FOLDER和OUTPUT的路径,输入输出路径对应自己的路径。注意,输入路径需要定义两个文件夹,image和label。

  比如我对应的split.py中的路径改为运行文件,下面的txt显示分段成功。到目前为止,CTPN要求的数据集格式已经制定。

ctpn原理,ctpn训练自己的数据