- 03 4月, 2020 4 次提交
-
-
由 Yuan Shuai 提交于
* split precision profiler from performance profiler. test=develop
-
由 Yuan Shuai 提交于
-
由 HappyAngel 提交于
* add conv_transpose+bn fusion. test=develop * delete note, test=develop * fix format space, test=develop * fix opt run error, test=develop
-
由 cc 提交于
-
- 31 3月, 2020 2 次提交
-
-
由 jackzhang235 提交于
-
由 huzhiqiang 提交于
-
- 29 3月, 2020 1 次提交
-
-
由 Yuan Shuai 提交于
* [LITE][OPENCL] Add ImageFree for Free in memory. test=develop * add initialize for cl_use_image2d_ when use buffer. test=develop
-
- 25 3月, 2020 3 次提交
-
-
由 xiaogang 提交于
test=develop
-
由 huzhiqiang 提交于
-
由 Yuan Shuai 提交于
* [LITE][OPENCL] enhance elemul, fix reshape for opencl. test=develop * comment loop test for pad2 opencl kernel. test=develop * [LITE][PROFILE] add sequnce statics for precision profiler. test=develop
-
- 24 3月, 2020 2 次提交
-
-
由 cc 提交于
-
由 zhupengyang 提交于
-
- 23 3月, 2020 1 次提交
-
-
由 zhupengyang 提交于
-
- 22 3月, 2020 1 次提交
-
-
由 Yuan Shuai 提交于
* [LITE][OPENCL] clean code for opencl. test=develop * [LITE][PROFILER] Enhance Precision Profiler. test=develop * delete useless var in profiler. test=develop * add ocl header. test=develop
-
- 20 3月, 2020 1 次提交
-
-
由 hong19860320 提交于
-
- 18 3月, 2020 3 次提交
-
-
由 Yuan Shuai 提交于
* Fix OpenCL kernel of exp, tanh, * Fix layout pass for opencl backend, * Add how to debug cl kernel. test=develop.
-
由 huzhiqiang 提交于
-
由 zhupengyang 提交于
This reverts commit 670fcc3c.
-
- 17 3月, 2020 3 次提交
-
-
由 zhupengyang 提交于
-
由 Wilber 提交于
- 增加cuda c++ demo. - 考虑到检测模型尾部一般是multiclass_nms,该kernel为host,如果fetch kernel为cuda的话,则会在此处插入无用的io_copy(host->cuda),由于该原因,注释掉fetch的cuda kernel. 默认使用host的fetch kernel. 此处暗中进行的行为:每次predictor run完,都会默认把数据从cuda拷贝到cpu
-
由 石晓伟 提交于
* feature: buffer sharing, test=develop * fix the warning of buffer.h, test=develop * test cuda only if necessary, test=develop
-
- 16 3月, 2020 3 次提交
-
-
由 hong19860320 提交于
-
由 zhupengyang 提交于
-
由 zhupengyang 提交于
* [NPU] subgraph's precision register to kAny
-
- 10 3月, 2020 2 次提交
-
-
由 hong19860320 提交于
-
由 石晓伟 提交于
-
- 09 3月, 2020 1 次提交
-
-
由 zhupengyang 提交于
-
- 07 3月, 2020 1 次提交
-
-
由 zhupengyang 提交于
* get the precision from the real tensor or tensor_array of base_scope in arena/framwork * register assign and assign_value to kAny
-
- 06 3月, 2020 2 次提交
-
-
由 zhangshijin 提交于
* [MLU] support resnet50 on MLU * [MLU] support resnet50 on MLU
-
由 xiaogang 提交于
* fix: fix nlp ops input and output type * fix: add elementwise x_dims>y_dims case
-
- 05 3月, 2020 2 次提交
-
-
由 zhupengyang 提交于
-
由 Yuan Shuai 提交于
* Fix memory_resuse for opencl. test=develop * remove useless code. test=develop
-
- 04 3月, 2020 1 次提交
-
-
由 huzhiqiang 提交于
* test=devellop * add cl file into resulted lib test=develop * test=develop * test=develop
-
- 03 3月, 2020 1 次提交
-
-
由 hong19860320 提交于
-
- 02 3月, 2020 1 次提交
-
-
由 Yuan Shuai 提交于
* [LITE][OPENCL] Support video-sr feature using OpenCL FP16 Image. test=develop * optimize image2d_to_buffer_with_post255. test=develop * add def debug in cl kernel. test=develop * remove conv image code in conv buffer. test=develop
-
- 01 3月, 2020 1 次提交
-
-
由 cc 提交于
-
- 29 2月, 2020 1 次提交
-
-
由 zhupengyang 提交于
-
- 28 2月, 2020 1 次提交
-
-
由 huzhiqiang 提交于
-
- 26 2月, 2020 2 次提交
-
-
由 石晓伟 提交于
-
由 huzhiqiang 提交于
-