Created by: ysh329
状态:等待review
主要内容
- opencl concat:
- 增加支持opencl concat的3inputs、4inputs的情况。其中,将paddle-mobile的部分实现迁入,并对其内的kernel实现变量名修正和优化;
- 修正buffer opencl concat实现的一处类型转换问题;
- image concat增加通用情况,即从opencl img的数据格式转换为buffer,以concat_buffer来做计算,最后再转换回来;
- 默认开启带group的conv3x3。之前默认因性能缘故没有打开,开启后当group>1时,才会执行;
- 整理./lite/kernels/opencl下的CMake文件中部分target的命令。先前buffer和image的实现,名字有重叠,现在以image和buffer后缀加以区别;
- 修改hard sigmoid的兼容性bug: 部分gpu不支持矢量和标量的乘法,所以改为kernel内标量scale强转(CL_DTYPE4)再做计算;
- 修复其它小问题。略;