- 12 4月, 2018 2 次提交
-
-
由 Yiqun Liu 提交于
* Add USE_OP of all operators and kernels and remove ARCHIVE_START/END in CMakeLists.txt of inference unittests. * Remove ARCHIVE_START/END when linking inference shared library. * Disable some fluid related cmake operations for cross-compiling.
-
由 typhoonzero 提交于
-
- 11 4月, 2018 1 次提交
-
-
由 Luo Tao 提交于
-
- 10 4月, 2018 1 次提交
-
-
由 Yi Wang 提交于
-
- 08 4月, 2018 1 次提交
-
-
由 Yi Wang 提交于
* Update source files. * Update headers * Update * Update * Update * Update * Fix a CMake dependency
-
- 07 4月, 2018 1 次提交
-
-
由 Yi Wang 提交于
-
- 04 4月, 2018 1 次提交
-
-
由 qiaolongfei 提交于
-
- 22 3月, 2018 1 次提交
-
-
由 qiaolongfei 提交于
-
- 20 3月, 2018 1 次提交
-
-
由 sabreshao 提交于
1. Add option WITH_AMD_GPU. 2. Add cmake/hip.cmake for HIP toolchain. 3. Some external module such as eigen may need HIP port. 4. Add macro hip_library/hip_binary/hip_test to cmake/generic.cmake. 5. Add one HIP source concat.hip.cu as an example. Each .cu may have its corresponding .hip.cu.
-
- 16 3月, 2018 2 次提交
-
-
由 sabreshao 提交于
1. Add option WITH_AMD_GPU. 2. Add cmake/hip.cmake for HIP toolchain. 3. Some external module such as eigen may need HIP port. 4. Add macro hip_library/hip_binary/hip_test to cmake/generic.cmake. 5. Add one HIP source concat.hip.cu as an example. Each .cu may have its corresponding .hip.cu.
-
由 Yu Yang 提交于
-
- 13 3月, 2018 1 次提交
-
-
由 Luo Tao 提交于
-
- 08 3月, 2018 2 次提交
-
-
由 Luo Tao 提交于
-
由 Tao Luo 提交于
* compile and install the static library of fluid inference * fix dynload_cuda not in CPU mode * update shared library and adjust the deploy of openblas * adjust the deploy of openblas * * auto add all fluid modules for static library * use libprotobuf.a instead of libprotobuf-lite.a for profiler * use set_property to set the global varible instead of ENV * add gpu depends of fluid modules, auto add inference_lib_dist depends * change the condition of openblas_lib, and fix a typo
-
- 06 3月, 2018 2 次提交
-
-
由 qiaolongfei 提交于
-
由 Yu Yang 提交于
-
- 05 3月, 2018 1 次提交
-
-
由 dongzhihong 提交于
-
- 01 3月, 2018 1 次提交
-
-
由 Yiqun Liu 提交于
-
- 15 2月, 2018 1 次提交
-
-
由 Yi Wang 提交于
-
- 14 2月, 2018 1 次提交
-
-
由 Yang Yang 提交于
-
- 12 2月, 2018 2 次提交
-
-
由 Jacek Czaja 提交于
-
由 qingqing01 提交于
-
- 07 2月, 2018 1 次提交
-
-
由 Yu Yang 提交于
* It will sightly faster compile and make warpctc compile well on CUDA 9 and GCC 5.5
-
- 06 2月, 2018 1 次提交
-
-
由 Luo Tao 提交于
-
- 05 2月, 2018 1 次提交
-
-
由 Luo Tao 提交于
-
- 30 1月, 2018 1 次提交
-
-
由 Luo Tao 提交于
-
- 27 1月, 2018 1 次提交
-
-
由 yi.wu 提交于
-
- 25 1月, 2018 1 次提交
-
-
由 yi.wu 提交于
-
- 22 1月, 2018 2 次提交
-
-
由 dangqingqing 提交于
-
由 dangqingqing 提交于
-
- 20 1月, 2018 1 次提交
-
-
由 dangqingqing 提交于
-
- 19 1月, 2018 1 次提交
-
-
由 Luo Tao 提交于
-
- 16 1月, 2018 2 次提交
-
-
由 dangqingqing 提交于
-
由 Luo Tao 提交于
-
- 15 1月, 2018 1 次提交
-
-
由 gongweibao 提交于
Fix grpc bugs
-
- 09 1月, 2018 1 次提交
-
-
由 Yiqun Liu 提交于
* Add Seq2BatchFunctor, which will be used in WarpCTCOp. * Implement WrapCTCFunctor and WrapCTCKernel. * Add unittest of warpctc_op. * Modify the check_output inferface in python unittest framework to allow check a subset of outputs. * Use absolute offset lod in warpctc_op and related functors. * Refine the comments of warpctc_op. * The new python unittest supports checking a subset of the outputs, so revoke the previous change. * Rename the transform from LoDTensor to Tensor with shape [max_sequence_length, num_sequences, sequence_width] to PaddingSequenceFunctor. * Update to the newest codes. * Rename the PaddingSequenceFunctor to PaddingLoDTensorFunctor and remove the computation of dimensions out of the functos.
-
- 06 1月, 2018 1 次提交
-
-
由 tensor-tang 提交于
-
- 05 1月, 2018 1 次提交
-
-
由 tensor-tang 提交于
-
- 04 1月, 2018 1 次提交
-
-
由 tensor-tang 提交于
-
- 28 12月, 2017 1 次提交
-
-
由 Liu Yiqun 提交于
-