- 19 3月, 2018 2 次提交
- 12 3月, 2018 2 次提交
-
-
由 Kexin Zhao 提交于
-
由 Kexin Zhao 提交于
-
- 07 3月, 2018 1 次提交
-
-
由 pzelazko-intel 提交于
* MKLDNN conv2 OP kernel added * TODOs added * mkldnn conv2d OP refactor * CanCUDNNBeUsed and CanMKLDNNBeUsed moved
-
- 05 3月, 2018 1 次提交
-
-
由 chengduoZH 提交于
-
- 12 2月, 2018 1 次提交
-
-
由 qingqing01 提交于
-
- 10 2月, 2018 2 次提交
- 10 1月, 2018 1 次提交
-
-
由 dzhwinter 提交于
* "init use all default devices" * "fix init test"
-
- 05 1月, 2018 1 次提交
-
-
由 tensor-tang 提交于
-
- 04 1月, 2018 1 次提交
-
-
由 dzhwinter 提交于
* "remove cudnndevicecontext" * "remove unused init code" * "fix hash functions"
-
- 03 1月, 2018 3 次提交
-
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
由 tensor-tang 提交于
-
- 29 12月, 2017 1 次提交
-
-
由 dangqingqing 提交于
-
- 28 12月, 2017 1 次提交
-
-
由 Yang Yu 提交于
-
- 27 12月, 2017 5 次提交
-
-
由 Yu Yang 提交于
* Rename API of DeviceContext Make them as usual names. * Rename API of DeviceContext Make them as usual names. * Fix compile * Fix compile * Fix compile * Fix compile * Fix compile
-
由 Yang Yu 提交于
-
由 Yang Yu 提交于
Make them as usual names.
-
由 Yang Yu 提交于
Make them as usual names.
-
由 Yang Yu 提交于
Make them as usual names.
-
- 25 12月, 2017 2 次提交
- 24 12月, 2017 2 次提交
-
-
由 dzhwinter 提交于
-
由 dzhwinter 提交于
* "change operator interface" * "move devicepool to device_context" * "fix operator test" * "fix op_registry Run interface" * "net op passed. Need to fix nccl multi-Context" * "add nccl group function" * "add nccl group function" * "fix gpu count exceed 32 error" * "fix recurrent op, nccl op" * "change the other operators interface with Place" * "fix typo" * "fix pybind" * "fix device in python side" * "fix pybind failed" * "add init for test" * "fix CI"
-
- 21 12月, 2017 1 次提交
-
-
由 dzhwinter 提交于
-
- 18 12月, 2017 2 次提交
-
-
由 dangqingqing 提交于
-
由 QI JUN 提交于
* add more place_test and rename Cudnn to CUDNN * fix ci
-
- 14 12月, 2017 1 次提交
-
-
由 dzhwinter 提交于
* "derived cudnnDevice context" * "leave remove cudnn handle from CUDADeviceContext" * "fix math function error"
-
- 12 12月, 2017 1 次提交
-
-
由 QI JUN 提交于
There are mainly following fixes: - take `DeviceContext` as the template parameter of math functors and OpKernel instead of `Place` - remove `eigen_device` interface in base class `DeviceContext` - remove `GetEigenDevice` interface in `ExecutionContext` and base class `DeviceContext` - remove unused `platform::EigenDeviceConverter` - rename `REGISTER_OP_GPU_KERNEL` to `REGISTER_OP_CUDA_KERNEL` - rename `USE_GPU_ONLY_OP` to `USE_CUDA_ONLY_OP`
-
- 07 12月, 2017 1 次提交
-
-
由 Yang Yu 提交于
-
- 08 11月, 2017 1 次提交
-
-
由 qingqing01 提交于
-
- 05 10月, 2017 2 次提交
-
-
由 Yi Wang 提交于
-
由 Yu Yang 提交于
By shell command ```bash sed -i 's#ifdef PADDLE_ONLY_CPU#ifndef PADDLE_WITH_GPU#g' `find ./paddle/ -name '*.h' -o -name '*.cc' -o -name '*.cpp' -o -name '*.c' -o -name '*.cu'` sed -i 's#ifndef PADDLE_ONLY_CPU#ifdef PADDLE_WITH_GPU#g' `find ./paddle/ -name '*.h' -o -name '*.cc' -o -name '*.cpp' -o -name '*.c' -o -name '*.cu'` ```
-
- 29 9月, 2017 1 次提交
-
-
由 qijun 提交于
-
- 23 9月, 2017 1 次提交
-
-
由 Yu Yang 提交于
* Since GPU is an async device by default. We should sync computation when Python invoke `run`. So Python can get the correct computation result
-
- 19 9月, 2017 1 次提交
-
-
由 Yu Yang 提交于
* Also use `const DeviceContext&` all the time, to prevent `const_cast` Fix #4169 Fix #3468 Fix #3475
-
- 14 9月, 2017 1 次提交
-
-
由 qijun 提交于
-
- 13 9月, 2017 1 次提交
-
-
由 qijun 提交于
-