- 01 4月, 2020 2 次提交
-
-
由 jackzhang235 提交于
outputs wrongly
-
由 zhaoying 提交于
1. disable conv activation pass by default 2. set fc_fuser'param with_relu false while mlu fc kernel does not support relu 3. change fc filter shape from 2 dim to 4 dim while input dim == 4 4. add ToFile func in mlu tensor for debug convenience 5. enable 4-dim input in elementwise_ops 6. add transpose2d in utility.cc
-
- 28 3月, 2020 3 次提交
-
-
由 jackzhang235 提交于
target -> subgraph -> target -> precision -> layout
-
由 jackzhang235 提交于
-
由 jackzhang235 提交于
-
- 26 3月, 2020 2 次提交
-
-
由 jackzhang235 提交于
-
由 jackzhang235 提交于
-
- 25 3月, 2020 3 次提交
-
-
由 xiaogang 提交于
test=develop
-
由 huzhiqiang 提交于
-
由 Yuan Shuai 提交于
* [LITE][OPENCL] enhance elemul, fix reshape for opencl. test=develop * comment loop test for pad2 opencl kernel. test=develop * [LITE][PROFILE] add sequnce statics for precision profiler. test=develop
-
- 24 3月, 2020 4 次提交
-
-
由 cc 提交于
-
由 jackzhang235 提交于
-
由 jackzhang235 提交于
-
由 zhupengyang 提交于
-
- 23 3月, 2020 1 次提交
-
-
由 zhupengyang 提交于
-
- 22 3月, 2020 1 次提交
-
-
由 Yuan Shuai 提交于
* [LITE][OPENCL] clean code for opencl. test=develop * [LITE][PROFILER] Enhance Precision Profiler. test=develop * delete useless var in profiler. test=develop * add ocl header. test=develop
-
- 20 3月, 2020 1 次提交
-
-
由 hong19860320 提交于
-
- 18 3月, 2020 7 次提交
-
-
由 Yuan Shuai 提交于
* Fix OpenCL kernel of exp, tanh, * Fix layout pass for opencl backend, * Add how to debug cl kernel. test=develop.
-
由 jackzhang235 提交于
-
由 jackzhang235 提交于
-
由 jackzhang235 提交于
-
由 jackzhang235 提交于
* fix some error when compiling with mlu-sdk1.2.5
-
由 huzhiqiang 提交于
-
由 zhupengyang 提交于
This reverts commit 670fcc3c.
-
- 17 3月, 2020 3 次提交
-
-
由 zhupengyang 提交于
-
由 Wilber 提交于
- 增加cuda c++ demo. - 考虑到检测模型尾部一般是multiclass_nms,该kernel为host,如果fetch kernel为cuda的话,则会在此处插入无用的io_copy(host->cuda),由于该原因,注释掉fetch的cuda kernel. 默认使用host的fetch kernel. 此处暗中进行的行为:每次predictor run完,都会默认把数据从cuda拷贝到cpu
-
由 石晓伟 提交于
* feature: buffer sharing, test=develop * fix the warning of buffer.h, test=develop * test cuda only if necessary, test=develop
-
- 16 3月, 2020 3 次提交
-
-
由 hong19860320 提交于
-
由 zhupengyang 提交于
-
由 zhupengyang 提交于
* [NPU] subgraph's precision register to kAny
-
- 10 3月, 2020 2 次提交
-
-
由 hong19860320 提交于
-
由 石晓伟 提交于
-
- 09 3月, 2020 1 次提交
-
-
由 zhupengyang 提交于
-
- 07 3月, 2020 1 次提交
-
-
由 zhupengyang 提交于
* get the precision from the real tensor or tensor_array of base_scope in arena/framwork * register assign and assign_value to kAny
-
- 06 3月, 2020 2 次提交
-
-
由 zhangshijin 提交于
* [MLU] support resnet50 on MLU * [MLU] support resnet50 on MLU
-
由 xiaogang 提交于
* fix: fix nlp ops input and output type * fix: add elementwise x_dims>y_dims case
-
- 05 3月, 2020 2 次提交
-
-
由 zhupengyang 提交于
-
由 Yuan Shuai 提交于
* Fix memory_resuse for opencl. test=develop * remove useless code. test=develop
-
- 04 3月, 2020 1 次提交
-
-
由 huzhiqiang 提交于
* test=devellop * add cl file into resulted lib test=develop * test=develop * test=develop
-
- 03 3月, 2020 1 次提交
-
-
由 hong19860320 提交于
-