用PaddlePaddle 实现目标检测任务——Paddle Fluid v1.1深度测评

发布时间：2018-12-14 19:16:02 所属栏目：移动来源：睿博远航

导读：副标题#e# 【51CTO.com原创稿件】 1.前言 11月1日，百度发布了Paddle Fluid的1.1版本，作为国内首个深度学习框架，PaddlePaddle对中文社区非常友好，有完善的中文社区、项目为导向的中文教程，可以让更多中文使用者更方便地进行深度学习、机器学习相关的研

在PaddlePaddle的SSD模型中，可以使用eval.py脚本进行模型评估，可以选择11point、integral等方法来计算模型在验证集上的mAP。

python eval.py --dataset='pascalvoc' --model_dir='train_pascal_model/best_model' --data_dir='data/pascalvoc' --test_list='test.txt' --ap_version='11point' --nms_threshold=0.45

其中，model_dir是我们训练好的模型的保存目录，data_dir是数据集目录，test_list是作为验证集的文件列表（txt文件），前提是这些文件必须要有对应的标签文件，ap_version是计算mAP的方法，nms_threshold是分类阈值。最后我们得到PaddlePaddle SSD模型在Pascal VOC数据集上的mAP为73.32%^[2]

4.7模型预测及可视化

4.7.1模型预测

模型训练完成后，用test_program = fluid.default_main_program().clone(for_test=True)将Program转换到test模式，然后把要预测的数据feed进Executor执行Program就可以计算得到图像的分类标签、目标框的得分、xmin、ymin、xmax、ymax。具体过程如下：

test_program = fluid.default_main_program().clone(for_test=True)

image = fluid.layers.data(name='image', shape=image_shape, dtype='float32')

locs, confs, box, box_var = mobile_net(num_classes, image, image_shape)

nmsed_out = fluid.layers.detection_output(

locs, confs, box, box_var, nms_threshold=args.nms_threshold)

place = fluid.CUDAPlace(0) if args.use_gpu else fluid.CPUPlace()

exe = fluid.Executor(place)

nmsed_out_v, = exe.run(test_program,

feed=feeder.feed([[data]]),

fetch_list=[nmsed_out],

return_numpy=False)

nmsed_out_v = np.array(nmsed_out_v)

4.7.2预测结果可视化

对于目标检测任务，我们通常需要对预测结果进行可视化进而获得对结果的感性认识。我们可以编写一个程序，让它在原图像上画出预测框，核心代码如下：

def draw_bounding_box_on_image(image_path, nms_out, confs_threshold,

label_list):

image = Image.open(image_path)

draw = ImageDraw.Draw(image)

im_width, im_height = image.size

for dt in nms_out:

if dt[1] < confs_threshold:

continue

category_id = dt[0]

bbox = dt[2:]

xmin, ymin, xmax, ymax = clip_bbox(dt[2:])

(left, right, top, bottom) = (xmin * im_width, xmax * im_width,

ymin * im_height, ymax * im_height)

draw.line(

[(left, top), (left, bottom), (right, bottom), (right, top),

(left, top)],

width=4,

fill='red')

if image.mode == 'RGB':

draw.text((left, top), label_list[int(category_id)], (255, 255, 0))

image_name = image_path.split('/')[-1]

print("image with bbox drawed saved as {}".format(image_name))

image.save(image_name)

这样，我们可以很直观的看到预测结果：

用PaddlePaddle 实现目标检测任务——Paddle Fluid v1.1深度测评

令人欣喜的是，PaddlePaddle的SSD模型中帮我们实现了完整的一套预测流程，我们可以直接运行SSD model下的infer.py脚本使用训练好的模型对图片进行预测：

python infer.py --dataset='coco' --nms_threshold=0.45 --model_dir='pretrained/ssd_mobilenet_v1_coco' --image_path='./data/ pascalvoc/VOCdevkit/VOC2012/JPEGImages/2007_002216.jpg'

4.8模型部署

PaddlePaddle的模型部署需要先安装编译C++预测库，可以在http://www.paddlepaddle.org/documentation/docs/zh/1.1/user_guides/howto/inference/build_and_install_lib_cn.html下载安装。预测库中提供了Paddle的预测API，预测部署过程大致分为三个步骤：1.创建PaddlePredictor；2.创建PaddleTensor传入PaddlePredictor中；3.获取输出 PaddleTensor，输出结果。这部分操作也并不复杂，而且Paddle的教程中也提供了一份部署详细代码参考，大家可以很快地利用这个模板完成模型部署(https://github.com/PaddlePaddle/Paddle/tree/develop/paddle/fluid/inference/api/demo_ci)

5.使用感受

中文社区支持好

在搭建SSD过程中，遇到了一些问题，例如segmentation fault、NoneType等，笔者直接在paddle的GitHub上提了相关issue，很快就得到了contributor的回复，问题很快得到了解决。

教程完善

PaddlePaddle的官网上提供了非常详尽的中英文教程，相较于之前学TensorFlow的时候经常看文档看半天才能理解其中的意思，PaddlePaddle对于中文使用者真是一大福音。

相比较TensorFlow，整体架构简明清晰，没有太多难以理解的概念。
模型库丰富

内置了CV、NLP、Recommendation等多种任务常用经典的模型，可以快速开发迭代AI产品。

性能优越，生态完整

从这次实验的结果来看，PaddlePaddle在性能上与TensorFlow等主流框架的性能差别不大，训练速度、CPU/GPU占用率等方面均表现优异，而且PaddlePaddle已经布局了一套完整的生态，前景非常好。

6.总结

整体来说，PaddlePaddle是一个不错的框架。由于设计简洁加之文档、社区做的很好，非常容易上手，在使用过程中也没有非常难理解的概念，用fluid Program定义网络结构很方便，对于之前使用过TensorFlow的工程师来说可以比较快速的迁移到PaddlePaddle上。这次实验过程中，还是发现了一些PaddlePaddle的问题，训练过程如果意外终止，Paddle的训练任务并没有被完全kill掉，依然会占用CPU和GPU大量资源，内存和显存的管理还需要进一步的提高。不过，实验也证实了，正常情况下PaddlePaddle在SSD模型上的精度、速度等性能与TensorFlow差不多，在数据读取操作上比TensorFlow要更加简洁明了。

PaddlePaddle Fluid是2016年百度对原有PaddlePaddle的重构版本，如无特殊说明，本文中所述PaddlePaddle均指PaddlePaddle Fluid。
此处引用了官方的评估结果，数据来源：https://github.com/PaddlePaddle/models/blob/develop/fluid/PaddleCV/object_detection/README_cn.md#%E6%A8%A1%E5%9E%8B%E8%AF%84%E4%BC%B0

【51CTO原创稿件，合作站点转载请注明原文作者和出处为51CTO.com】

（编辑：PHP编程网 - 金华站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

6/7

首页

尾页

6000块的旗舰老出问题	小米MIX FOLD 2折叠屏
iQOO 10 Pro上线手机快	华硕官方泄露ZenFone