1. 18 11月, 2021 1 次提交
    • Z
      Opt topk (#37256) · c4862d99
      zhangkaihuo 提交于
      topk中有cub和手写kernel两种实现,而cub是通过排序来获取topk,通过多组数据发现只有当input_width>=128且k超过input_width 75%的时候性能会比手写的更好。
      c4862d99
  2. 17 11月, 2021 16 次提交
  3. 16 11月, 2021 11 次提交
  4. 15 11月, 2021 12 次提交