[LITE][PASS] Remove reshape2 / squeeze2 for tf_mobilenetv1/v2 !3773

Created by: ysh329

状态：等待review

内容：移除tf_mobilenetv1/v2的reshape2->squeeze2、resshape2的结构，目前仅限于tf_mobilenetv1/v2。tf模型的mobilenetv1/v2在这两个结构中仅仅做1001x1x1->1001的维度变化没有实际作用，对于gpu来说这种操作十分费时；
目的：benchmark。对opencl模型来说，可以移除掉11个op，其中包括原模型中的reshape2->squeeze2和最后的reshape2的3个原有op，以及与之带来的工具类op 8个（layout、io_copy），因为reshape2->squeeze2和reshape2中间有个cpu计算的squeeze2和softmax，而每次上传到gpu上都会有io_copy和layout转换操作。

注：由于担心该pass（在optimizer.h）的执行顺序的位置对其它target有影响，目前只对arm cpu和opencl开启。

注：这里使用test_model_bin测试（带log多少影响实际性能，实际性能表现后续由QA来测给出具体报告，这里只体现收益百分比），均为armv7。repeats=100,warmup=20；

下面表格为opencl的Profiler信息，conv2d后面为尾部结构：

OP	KernelPlace
conv2d	conv2d:opencl/float16/ImageDefault
layout	layout:opencl/any/NCHW
io_copy	io_copy:opencl/any/any
squeeze2	squeeze2:arm/float/NCHW
io_copy	io_copy:opencl/any/any
layout	layout:opencl/any/ImageDefault
reshape2	reshape2:opencl/float16/ImageDefault
layout	layout:opencl/any/NCHW
io_copy	io_copy:opencl/any/any
softmax	softmax:arm/float/NCHW
io_copy	io_copy:opencl/any/any
layout	layout:opencl/any/ImageDefault
reshape2	reshape2:opencl/float16/ImageDefault
layout	layout:opencl/any/NCHW
io_copy	io_copy:opencl/any/any

conv2d后面为尾部结构：该pass实现后，opencl模型减少11个op，arm cpu减少3个op（reshape2->squeeze2，reshape2）。

OP	KernelPlace
conv2d	conv2d:opencl/float16/ImageDefault
layout	layout:opencl/any/NCHW
io_copy	io_copy:opencl/any/any
softmax	softmax:arm/float/NCHW

上图是原模型（未加工具op如io_copy、layout、calib等），红框里的op全部优化掉：