1. 01 4月, 2020 2 次提交
    • J
      fix a bug in subgraph division: put all intermediate outputs to local · 26c8b551
      jackzhang235 提交于
      outputs wrongly
      26c8b551
    • Z
      (ref): · ef5c0165
      zhaoying 提交于
          1. disable conv activation pass by default
          2. set fc_fuser'param with_relu false while mlu fc kernel does not
          support relu
          3. change fc filter shape from 2 dim to 4 dim while input dim == 4
          4. add ToFile func in mlu tensor for debug convenience
          5. enable 4-dim input in elementwise_ops
          6. add transpose2d in utility.cc
      ef5c0165
  2. 28 3月, 2020 3 次提交
  3. 26 3月, 2020 2 次提交
  4. 25 3月, 2020 3 次提交
  5. 24 3月, 2020 4 次提交
  6. 23 3月, 2020 1 次提交
  7. 22 3月, 2020 1 次提交
  8. 20 3月, 2020 1 次提交
  9. 18 3月, 2020 7 次提交
  10. 17 3月, 2020 3 次提交
    • Z
      enhance shuffle-channel fuse pass (#3208) · 670fcc3c
      zhupengyang 提交于
      670fcc3c
    • W
      add cuda cxx demo (#3205) · f6461e39
      Wilber 提交于
      - 增加cuda c++ demo.
      - 考虑到检测模型尾部一般是multiclass_nms,该kernel为host,如果fetch kernel为cuda的话,则会在此处插入无用的io_copy(host->cuda),由于该原因,注释掉fetch的cuda kernel. 默认使用host的fetch kernel. 此处暗中进行的行为:每次predictor run完,都会默认把数据从cuda拷贝到cpu
      f6461e39
    • feature: buffer sharing, test=develop (#3161) · e04399ba
      石晓伟 提交于
      * feature: buffer sharing, test=develop
      
      * fix the warning of buffer.h, test=develop
      
      * test cuda only if necessary, test=develop
      e04399ba
  11. 16 3月, 2020 3 次提交
  12. 10 3月, 2020 2 次提交
  13. 09 3月, 2020 1 次提交
  14. 07 3月, 2020 1 次提交
  15. 06 3月, 2020 2 次提交
  16. 05 3月, 2020 2 次提交
  17. 04 3月, 2020 1 次提交
  18. 03 3月, 2020 1 次提交