- 17 3月, 2020 1 次提交
-
-
由 Wilber 提交于
- 增加cuda c++ demo. - 考虑到检测模型尾部一般是multiclass_nms,该kernel为host,如果fetch kernel为cuda的话,则会在此处插入无用的io_copy(host->cuda),由于该原因,注释掉fetch的cuda kernel. 默认使用host的fetch kernel. 此处暗中进行的行为:每次predictor run完,都会默认把数据从cuda拷贝到cpu
-
- 20 2月, 2020 1 次提交
-
-
由 Wilber 提交于
Optimize cuda kernel and remove io_copy added by default due to missing fetch_cuda kernel
-