Windows下实现将Pascal VOC转化为TFRecords

时间：2020-08-13 python教程查看: 1515

前言

由于TensorFlow常用TFrecords作为输入格式，我们需要将制作好的Pascal VOC转为TFrecords格式。使用 object detection API 内提供的脚本。

TFRecords格式如下：

-uint64 length

-uint32 masked_crc32_of_length

-byte data[length]

-uint32 masked_crc32_of_data

前置要求：

Anaconda3（使用python3.x）

制作好的Pascal VOC数据集

1、配置protobuf

Google的protobuf是一种轻便高效的结构化数据存储格式，结构扩展性高，速度快，密度大。我们下载对应的protoc-3.4.0-win32.zip版本。解压之后的文件内容如下：

将bin文件夹所在路径添加到环境变量PATH，再将bin下的protoc.exe移动到C:\Windows\System32目录下。

cmd下进入~models/reseach目录下，输入：

protoc object_detection/protos/*.proto --python_out=.

2、设置搜索路径

Windows下的API使用时会出现图示bug，需要创建xx.pth文件，将以下两条路径添加进去：

~\models\research

~\models\research\slim

接着，将pth文件移动到python安装目录的site-packages下。

最后，我们利用cmd运行model_builder_test.py文件，测试环境是否搭建成功。

3、修改pascal_label_map.pbtxt

打开~models/research/object_detection/data/pascal_label_map.pbtxt，修改其中的name为自己的分类名。

如图所示，这里我要识别分类的是图片数字0~3，所以修改了对应的name。

4、修改create_pascal_tf_record.py文件

（1）47行：根据自己的VOC数据集格式，修改年份，如果是2007，则保持默认；

（2）49行：将data/pascal_label_map.pbtxt改为绝对路径

（3）81行：改为img_path = os.path.join('JPEGImages', data['filename'])

（4）82行：改为full_path =os.path.join(dataset_directory, 'VOC2012',img_path+'.jpg')

（5）163行 : 改为examples_path =os.path.join(data_dir, year, 'ImageSets', 'Main','xx' + FLAGES.set + '.txt')

xx里的内容是~VOCdevkit\VOC2012\ImageSets\Main目录下的文件前缀名称，如果没有，留空就可以。

5、运行

cmd下输入：

python ~/models/research/object_detection/dataset_tools/create_pascal_tf_record.py\

--data_dir=~/VOCdevkit \

--year=VOC2012 \

--output_path=~/xx.record

其中，波浪线的地方分别为自己的py文件位置、VOC数据位置、转换的record文件存储位置。

注：

1、protoc必须使用3.4版本而非3.5，否则会出现找不到*.proto的bug；

2、运行时出现很多bug，根据bug一步一步回推代码修改。

以上这篇Windows下实现将Pascal VOC转化为TFRecords就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持python博客。

展开全文