- 24 1月, 2019 2 次提交
-
-
由 Yiqun Liu 提交于
* Refine the beam_search op and test. * A basic CUDA implementation of beam_search for small batch_size. * Implement CUDA kernel for beam_search_op. * Use multiple CUDA threads in the same block to select the top beam. * Update the python api of beam_search op. * Enable extend function in CPU kernel of beam_search op. * Unify the CUDA codes. test=develop * Unify the CPU kernel of beam_search op. * Ensure the seletced items of beam_search_op's CPU kernel sorted by scores. * Update the description of beam_search in API.spec. * Enable the use of CUDA kernel in beam_search op. * Exclude the beam_search's CUDA unittest when there is no CUDA gpu, and delete some debuging statements. test=develop * Follow comments. test=develop * Call the CPU kernel for beam_search op when batch_size > 4. test=develop * Remove the except of is_empty op in PrepareData. test=develop
-
由 sneaxiy 提交于
test=develop
-
- 04 12月, 2018 1 次提交
-
-
由 Wu Yi 提交于
* wip multi process multi gpu dist training * workable for p2p * update test=develop * change back env name test=develop * fix alloc init * fix cpu build test=devlop * fix mac tests test=develop * refine code * refine test=develop
-
- 27 11月, 2018 1 次提交
-
-
由 peizhilin 提交于
-
- 26 11月, 2018 2 次提交
- 22 11月, 2018 2 次提交
-
-
由 chengduo 提交于
* refine cublase test=develop * code refine * refine cublas * add GEMME_EX * add enable_cublas_tensor_op_math doc and add cublasCall test=develop * fix CublasCall for cuda version test=develop * fix error test=develop * fix GEMM_EX to be compatible with gcc 4.8 test=develop * add GEMM_EX test=develop * to compatiable with gcc4.8 test=develop
-
由 peizhilin 提交于
-
- 08 11月, 2018 1 次提交
-
-
由 minqiyang 提交于
Fix code to support cpplint syntax check test=develop
-
- 15 10月, 2018 1 次提交
-
-
由 chengduo 提交于
test=develop
-
- 08 10月, 2018 1 次提交
-
-
由 Xin Pan 提交于
test=develop
-
- 27 9月, 2018 1 次提交
-
-
由 typhoonzero 提交于
This reverts commit 1d91a49d.
-
- 26 9月, 2018 1 次提交
-
-
由 chengduo 提交于
* some trivial opt * remove the fix of lod_tensor and shrink_rnn_memory_op * refine ShrinkRNNMemoryOp test=develop
-
- 14 8月, 2018 1 次提交
-
-
由 chenweihang 提交于
-
- 08 8月, 2018 1 次提交
-
-
由 chenweihang 提交于
-
- 23 4月, 2018 1 次提交
-
-
由 fengjiayi 提交于
-
- 08 4月, 2018 1 次提交
-
-
由 Yi Wang 提交于
* Fix cpplint errors with paddle/fluid/platform/gpu_info.* * Update
-
- 10 3月, 2018 1 次提交
-
-
由 Kexin Zhao 提交于
-
- 03 3月, 2018 1 次提交
-
-
由 chengduoZH 提交于
-
- 12 2月, 2018 1 次提交
-
-
由 qingqing01 提交于
-
- 10 2月, 2018 2 次提交
- 10 1月, 2018 2 次提交
- 22 12月, 2017 1 次提交
-
-
由 dzhwinter 提交于
* "remove GPU Sync Interface" * "fix typo" * "fix type cast error" * "fix related Copy with stream" * "fix failed tests with DevicePool" * "fix stupid removed position error"
-
- 15 12月, 2017 1 次提交
-
-
由 Yu Yang 提交于
-
- 05 12月, 2017 1 次提交
-
-
由 QI JUN 提交于
-
- 01 12月, 2017 1 次提交
-
-
由 QI JUN 提交于
* change GPU memory allocating policy * fix potential overflow bug
-
- 16 11月, 2017 1 次提交
-
-
由 dzhwinter 提交于
* "fix accuracy kernel bug" * "relauch ci"
-
- 31 10月, 2017 1 次提交
-
-
由 QI JUN 提交于
* remove unused code * fix cmake file * fix build error
-
- 10 10月, 2017 1 次提交
-
-
由 Yang Yang 提交于
-
- 07 10月, 2017 1 次提交
-
-
由 qijun 提交于
-
- 05 10月, 2017 2 次提交
- 18 8月, 2017 1 次提交
-
-
由 liaogang 提交于
-
- 19 7月, 2017 1 次提交
-
-
由 liaogang 提交于
-
- 15 7月, 2017 1 次提交
-
-
由 liaogang 提交于
-
- 13 7月, 2017 1 次提交
-
-
由 liaogang 提交于
-
- 11 7月, 2017 1 次提交
-
-
由 liaogang 提交于
-
- 06 7月, 2017 1 次提交
-
-
由 liaogang 提交于
-