- 03 12月, 2019 1 次提交
-
-
由 zhaoyuchen2018 提交于
* Improve argsort performance. - Give 200000 data to compute argsort on v100, can speed up ~190x before opt cost: 0.53s after opt cost:0.0027s - Add fp16 support * Refine error message * Refine code * Add descending sort test=develop Signed-off-by: Nzhaoyuchen <zhaoyuchen01@baidu.com>
-
- 13 6月, 2018 1 次提交
-
-
由 Yibing Liu 提交于
-
- 12 6月, 2018 1 次提交
-
-
由 Yibing Liu 提交于
-
- 05 6月, 2018 2 次提交
-
-
由 Yibing Liu 提交于
-
由 Yibing Liu 提交于
-