1. 05 6月, 2022 1 次提交
  2. 27 5月, 2022 1 次提交
  3. 16 3月, 2022 1 次提交
  4. 10 3月, 2022 1 次提交
  5. 02 3月, 2022 1 次提交
  6. 20 2月, 2022 1 次提交
  7. 11 2月, 2022 1 次提交
  8. 17 12月, 2021 1 次提交
    • Z
      add launch bound to limit the registers usage for volta architecture (#38113) · 18a59822
      zlsh80826 提交于
      From --ptxas-options=-v, SegmentOpsKernel uses 66 registers in a block.
      There are two ways to resolve this problem:
          Reduce the threads per block launch configuration
          add __launch_bound__ to give information to nvcc compiler for reducing registers usage
      this PR chooses __launch_bound__ solution because changing gpu_launch_config may affect other ops.
      18a59822
  9. 03 12月, 2021 1 次提交
  10. 27 4月, 2021 1 次提交
  11. 20 10月, 2020 1 次提交
  12. 26 9月, 2020 1 次提交
  13. 24 9月, 2020 1 次提交