- 04 5月, 2018 16 次提交
-
-
由 chengduo 提交于
Wrap shfl_x_sync
-
由 chengduoZH 提交于
-
由 Yancey 提交于
* fix remove op * update
-
由 Yu Yang 提交于
Polish MatMul, clean copy & paste code
-
由 Xin Pan 提交于
Distributed survey
-
由 Tao Luo 提交于
tensorrt convert init
-
由 Qingsheng Li 提交于
* Added auto transform to beam_search_decode_op * Added some comment * Added unittest for beam_search_decode_op on GPU
-
由 Yi Wang 提交于
-
由 Abhinav Arora 提交于
* Fix CPPLint issyes in gru_kernel.h * Fix CPPLint issyes in gru_kernel.h * Fix Compile error
-
由 Yu Yang 提交于
-
由 Lei Wang 提交于
-
由 Kexin Zhao 提交于
-
由 Yancey 提交于
fix delete_ops
-
由 Kexin Zhao 提交于
-
由 Kexin Zhao 提交于
* add test float16 inference accuracy example * complete the test * clean code * add argument parse and refine tests * add shell script * add float16 benchmark code * refine code * prepare for contrib/float16 * put things in contrib float16 folder * update benchmark result * further update benchmark report * add float16 inference report * update report
-
由 Abhinav Arora 提交于
-
- 03 5月, 2018 24 次提交
-
-
由 Luo Tao 提交于
-
由 Yancey1989 提交于
-
由 Xin Pan 提交于
-
由 Yancey1989 提交于
-
由 Shan Yi 提交于
* update README.md * change to .html * use v2 api
-
-
由 Yu Yang 提交于
-
由 Xin Pan 提交于
-
由 chengduo 提交于
fix pool with mask layer bug
-
由 Xin Pan 提交于
-
由 Yu Yang 提交于
Feature/clean blas
-
由 chengduo 提交于
Wrap __shfl
-
由 chengduo 提交于
-
-
由 Abhinav Arora 提交于
* Add understand apiu with stacked lstm for new API * Complete exam
-
由 Yu Yang 提交于
-
由 chengduo 提交于
Fix __shfl and __shfl_down for CUDA9.0
-
-
由 Shan Yi 提交于
fix toctree in multi_cluster/index_en.rst
-
由 xzl 提交于
-
由 chengduoZH 提交于
-
由 Helin Wang 提交于
Improve trainer API
-
-
由 Yancey 提交于
Refine distribute transpiler api
-