{ "level":{ "level_0": [ "GPU架构及异构计算", "初识CUDA", "CUDA存储单元的使用", "多种CUDA存储单元详解", "利用共享存储单元优化应用", "统一内存" ], "level_1":[ "CUA错误检测与事件", "原子操作", "CUDA stream" ], "level_2": [ "CUDA 调试分析", "CUDA 优化", "CUDA 加速库" ] }, "tree": { "GPU架构及异构计算":[ "介绍GPU架构以及异构计算的基本原理", "介绍GPU硬件平台", "环境安装配置" ], "初识CUDA": [ "CUDA程序的编译", "GPU线程的调用", "GPU和CPU的通讯", "使用多个线程的核函数", "使用线程索引", "多维网络", "网格与线程块" ], "CUDA存储单元的使用": [ "设备初始化", "GPU的存储单元", "GPU存储单元的分配与释放", "数据的传输", "数据与线程之间的对应关系" ], "多种CUDA存储单元详解": [ "CUDA中的存储单元种类", "CUDA中的各种存储单元的使用方法", "CUDA中的各种存储单元的适用条件" ], "利用共享存储单元优化应用": [ "共享存储单元详解", "共享内存的Bank conflict", "利用共享存储单元进行矩阵转置和矩阵乘积" ], "统一内存": [ "统一内存的基本概念和使用" ], "CUA错误检测与事件": [ "CUDA应用程序运行时的错误检测", "CUDA中的事件" ], "原子操作": [ "CUDA中的原子操作", "原子操作的适用场景" ], "CUDA stream": [ "CUDA流的基本概念", "默认流与非默认流", "利用CUDA流重叠计算和数据传输" ], "CUDA 调试分析": [ "利用Nsight等分析工具对程序性能进行分析", "根据实际硬件调整程序" ], "CUDA 优化": [ "存储优化", "执行设置优化", "指令级优化", "控制流优化" ], "CUDA 加速库": [ "cuBLAS", "cuFFT", "cuRAND", "cuSPARSE", "cuDNN" ] } }