- 13 1月, 2022 1 次提交
-
-
由 jakpiase 提交于
* base changes for mul reimplementation * empty commit * tmp save * full implementation of mul bf16/fp32 fwd bwd * CI fix * CI rerun * changed unity build cmake to avoid gpu issues * removed mul mkldnn from unity build * added skipping tests if not cpu_bf16 * CI fix * CI fix * CI fix
-
- 09 7月, 2019 1 次提交
-
-
由 Physher 提交于
-
- 14 5月, 2019 1 次提交
-
-
由 Kaipeng Deng 提交于
* add double grad for mul_op. test=develop * fix format. test=develop * fix format. test=develop * fix format. test=develop * refine code. test=develop * remove setzero. test=develop * fix dx/dy init bug. test=develop * fix format. test=develop
-
- 22 8月, 2018 1 次提交
-
-
由 Yu Yang 提交于
-
- 04 5月, 2018 1 次提交
-
-
由 Yu Yang 提交于
-
- 03 5月, 2018 1 次提交
-
-
由 Yu Yang 提交于
-
- 15 3月, 2018 1 次提交
-
-
由 Kexin Zhao 提交于
* add fp16 mul op support * small fix * fix bug * small fix * fix PADDLE_WITH_CUDA compiling issue * reorg code * test for pybind * treate as float16 as uint16_t in pybind * bind np.float16 to paddle float16 * small fix * clean code * remove redundancy * fix mul_op test * address comments * small fix * add is_float16_supported func
-
- 12 2月, 2018 1 次提交
-
-
由 qingqing01 提交于
-
- 10 2月, 2018 2 次提交
- 26 12月, 2017 1 次提交
-
-
由 Luo Tao 提交于
-
- 12 12月, 2017 1 次提交
-
-
由 QI JUN 提交于
There are mainly following fixes: - take `DeviceContext` as the template parameter of math functors and OpKernel instead of `Place` - remove `eigen_device` interface in base class `DeviceContext` - remove `GetEigenDevice` interface in `ExecutionContext` and base class `DeviceContext` - remove unused `platform::EigenDeviceConverter` - rename `REGISTER_OP_GPU_KERNEL` to `REGISTER_OP_CUDA_KERNEL` - rename `USE_GPU_ONLY_OP` to `USE_CUDA_ONLY_OP`
-
- 09 11月, 2017 1 次提交
-
-
由 dangqingqing 提交于
-
- 08 11月, 2017 1 次提交
-
-
由 dangqingqing 提交于
-
- 24 10月, 2017 1 次提交
-
-
由 Yu Yang 提交于
* Correct mul_op implementation * Restore the origin shape after mul * Fix mul op * Do not touch math_function
-
- 20 10月, 2017 1 次提交
-
-
由 Yu Yang 提交于
* Remove template parameter for Tensor methods * Also check the type is correct when data() * Simplize holder_ * Fix accuracy_op * Register Code
-
- 28 9月, 2017 1 次提交
-
-
由 Yu Yang 提交于
-
- 19 9月, 2017 1 次提交
-
- 07 9月, 2017 2 次提交
- 06 9月, 2017 1 次提交
-
-
由 fengjiayi 提交于
-
- 05 9月, 2017 1 次提交
-
-
由 dangqingqing 提交于
-
- 04 9月, 2017 1 次提交
-
-
由 dangqingqing 提交于
-
- 19 8月, 2017 1 次提交
-
-
由 dongzhihong 提交于
-
- 18 8月, 2017 1 次提交
-
-
由 dongzhihong 提交于
-
- 14 8月, 2017 2 次提交
-
-
由 dongzhihong 提交于
-
由 dongzhihong 提交于
-
- 11 8月, 2017 1 次提交
-
-
由 Yu Yang 提交于
-
- 10 8月, 2017 1 次提交
-
-
由 dongzhihong 提交于
-
- 09 8月, 2017 1 次提交
-
-
由 qijun 提交于
-
- 08 8月, 2017 1 次提交
-
-
由 dongzhihong 提交于
-
- 07 8月, 2017 2 次提交
-
-
由 dongzhihong 提交于
-
由 qijun 提交于
-
- 05 8月, 2017 1 次提交
-
-
由 Yi Wang 提交于
-
- 03 8月, 2017 2 次提交
- 02 8月, 2017 2 次提交
- 01 8月, 2017 1 次提交
-
-
由 Qiao Longfei 提交于
* use operator context * optimize code * update net infershape * update InferShape * disable override InferShape(scope) in OperatorBase * change InferShapeImpl to InferShape * add template to OperatorContext Input/Output * merge Input InputVar, Output OutputVar * change Inputs to MultiInput * fix conflict * fix MultiInput bugs and add unit test * rename KernelContext to ExecutionContext * clean code * change InferShape to protected * fix template bug * refine code * use InputVar instead of Input<Variable> * typo * optimize code
-
- 25 7月, 2017 1 次提交
-
-
由 Yu Yang 提交于
Make implement an operator less noisy.
-