Created by: xyoungli
- 去除int8计算 bias量化,mobilenetv1-int8数值误差在1e-6内;
- 增加kernel计算时感知shape变化的接口(kernel.h 添加init函数);
- 修改fp32 和int8 depthwise的实现,支持任意pad,性能下降10%,还可以再优化;
- 修改conv_direct, conv_gemmlike等,基类改成kernel;
- build脚本支持设置编译路径;
- cmake中支持测试文件的strip,减少文件大小
Created by: xyoungli