Created by: jiweibo
【说明】lite cuda集成nvtx,timeline中加入op信息,方便观察,简化调试。
【截图验证】 集成nvtx后,timeline如下图所示
【编译依赖条件】 依赖cuda 10.1版本,编译的时候需要打开LITE_WITH_NVTX和LITE_WITH_CUDA,如果cuda版本低于10.1,则强制关闭LITE_WITH_NVTX选项