1. 17 3月, 2020 1 次提交
    • W
      add cuda cxx demo (#3205) · 9098da7c
      Wilber 提交于
      - 增加cuda c++ demo.
      - 考虑到检测模型尾部一般是multiclass_nms,该kernel为host,如果fetch kernel为cuda的话,则会在此处插入无用的io_copy(host->cuda),由于该原因,注释掉fetch的cuda kernel. 默认使用host的fetch kernel. 此处暗中进行的行为:每次predictor run完,都会默认把数据从cuda拷贝到cpu
      9098da7c
  2. 20 2月, 2020 1 次提交