- 15 3月, 2018 1 次提交
-
-
由 dzhwinter 提交于
* "add softmax cudnn functor support" * "add testing" * "refine cmakelist" * "sequence softmax forward speed up" * "add softmax grad" * "fix sequence softmax test" * "add double precision' * "fix softmax test" * "add softmax cudnn support" * "fix softmax cudnn test" * "add softmax to nn.py" * "fix compile bug" * "refine cmakelist" * "fix ci" * "fix based on comment" * "fix based on comments" * "fix ci"
-
- 12 2月, 2018 1 次提交
-
-
由 qingqing01 提交于
-
- 10 2月, 2018 2 次提交
- 12 12月, 2017 1 次提交
-
-
由 QI JUN 提交于
There are mainly following fixes: - take `DeviceContext` as the template parameter of math functors and OpKernel instead of `Place` - remove `eigen_device` interface in base class `DeviceContext` - remove `GetEigenDevice` interface in `ExecutionContext` and base class `DeviceContext` - remove unused `platform::EigenDeviceConverter` - rename `REGISTER_OP_GPU_KERNEL` to `REGISTER_OP_CUDA_KERNEL` - rename `USE_GPU_ONLY_OP` to `USE_CUDA_ONLY_OP`
-
- 08 11月, 2017 1 次提交
-
-
由 dangqingqing 提交于
-
- 20 10月, 2017 1 次提交
-
-
由 Yu Yang 提交于
* Remove template parameter for Tensor methods * Also check the type is correct when data() * Simplize holder_ * Fix accuracy_op * Register Code
-
- 28 9月, 2017 1 次提交
-
-
由 Liu Yiqun 提交于
-
- 25 9月, 2017 1 次提交
-
-
由 Liu Yiqun 提交于
-
- 21 9月, 2017 1 次提交
-
-
由 Liu Yiqun 提交于
-
- 07 9月, 2017 1 次提交
-
-
由 qingqing01 提交于
-
- 17 8月, 2017 1 次提交
-
-
由 Yu Yang 提交于
-
- 11 8月, 2017 1 次提交
-
-
由 Yu Yang 提交于
-
- 09 8月, 2017 1 次提交
-
-
由 Yu Yang 提交于
* No POD instance is forbidden in global scope. See https://google.github.io/styleguide/cppguide.html#Static_and_Global_Variables
-
- 07 8月, 2017 1 次提交
-
-
由 dongzhihong 提交于
-
- 05 8月, 2017 1 次提交
-
-
由 Yi Wang 提交于
-
- 04 8月, 2017 2 次提交
- 03 8月, 2017 2 次提交
- 02 8月, 2017 3 次提交
- 01 8月, 2017 2 次提交
- 31 7月, 2017 1 次提交
-
-
由 liaogang 提交于
-
- 25 7月, 2017 1 次提交
-
-
由 Yu Yang 提交于
Make implement an operator less noisy.
-
- 19 7月, 2017 2 次提交
- 17 7月, 2017 3 次提交
-
-
由 qijun 提交于
-
由 Yan Chunwei 提交于
* add inputs * add ut for multiple inputs * fix AddToLayer * op_desc -> op_proto * CreateArgumentOffsetMap -> CreateInOutOffsetMap * move CreateInOutOffsetMap from OperatorBase to op registry * arg_idxs_ -> in_out_idxs_
-
由 qijun 提交于
-
- 14 7月, 2017 1 次提交
-
-
由 qijun 提交于
-
- 13 7月, 2017 2 次提交
-
-
由 Yu Yang 提交于
* Convert `op` --> `operators` * Remove AddType in OpProtoMaker, because type is part of registry. * Rename CPU_OR_GPU --> DEVICE_TYPE in registry macro.
-
由 Yu Yang 提交于
* Refine register methods, make Op can get rid of whole-archieve * `USE_OP` before a op is used. * Add unittest for add_op.
-