• W
    add cuda cxx demo (#3205) · f6461e39
    Wilber 提交于
    - 增加cuda c++ demo.
    - 考虑到检测模型尾部一般是multiclass_nms,该kernel为host,如果fetch kernel为cuda的话,则会在此处插入无用的io_copy(host->cuda),由于该原因,注释掉fetch的cuda kernel. 默认使用host的fetch kernel. 此处暗中进行的行为:每次predictor run完,都会默认把数据从cuda拷贝到cpu
    f6461e39
program.cc 10.4 KB