- 06 1月, 2020 1 次提交
-
-
由 Pei Yang 提交于
* add gelu plugin * align trt bert with gpu * add support for fused fc with relu, * add unittest for bert trt
-
- 22 11月, 2019 1 次提交
-
-
由 Yihua Xu 提交于
* Fix the crash issue when scale or bias was null-pointer. test=develop * Add the error message for passing CI. test=develop
-
- 19 11月, 2019 1 次提交
-
-
由 danleifeng 提交于
-
- 20 3月, 2019 1 次提交
-
-
由 sneaxiy 提交于
test=develop
-
- 08 3月, 2019 1 次提交
-
-
由 tensor-tang 提交于
test=develop
-
- 07 3月, 2019 1 次提交
-
-
由 tensor-tang 提交于
test=develop
-
- 20 12月, 2018 1 次提交
-
-
由 tensor-tang 提交于
test=develop
-
- 18 12月, 2018 1 次提交
-
-
由 tensor-tang 提交于
-
- 17 12月, 2018 1 次提交
-
-
由 tensor-tang 提交于
-
- 19 11月, 2018 1 次提交
-
-
由 Yihua Xu 提交于
* Optimize layer_norm operator with AVX intrinsic functions * Revert the wrong modifications * Implement the jit kernel for layer_norm operator * Add math headfile to fix the compile issue (test=develop) * Add math headfile to fix the compile issue (test=develop) * Fixed the intrinsic headfile issue (test=develop) * Fix the conflicts (test=develop) * Revert for CUDA compiler (test=develop) * Fixed the cuda depency (test=develop) * Fix the marco issues (test=develop)
-
- 16 11月, 2018 1 次提交
-
-
由 Wu Yi 提交于
* wip simplify operator framework * wip * wip * done test=develop * clean test=develop * fix test=develop * fix deps test=develop * fix cpu build test=develop * fix tensorrt build test=develop * fix tests test=develop * fix test=develop * fix cpu build test=develop
-
- 04 5月, 2018 1 次提交
-
-
由 Yu Yang 提交于
-
- 25 3月, 2018 2 次提交
- 15 2月, 2018 1 次提交
-
-
由 Yi Wang 提交于
* Update tensor_util.h * Update with moved TensorDesc * Fix tensur_utils.cu * Update * Update * Update * Update * Make tensor_util.cu a symbolic link
-
- 12 2月, 2018 1 次提交
-
-
由 qingqing01 提交于
-
- 10 2月, 2018 2 次提交
- 05 2月, 2018 3 次提交
-
-
由 chengduoZH 提交于
-
由 chengduoZH 提交于
-
由 chengduoZH 提交于
-
- 03 2月, 2018 1 次提交
-
-
由 chengduoZH 提交于
-
- 24 1月, 2018 1 次提交
-
-
由 chengduoZH 提交于
-
- 22 12月, 2017 1 次提交
-
-
由 QI JUN 提交于
* add data layout * fix ci
-
- 12 12月, 2017 1 次提交
-
-
由 QI JUN 提交于
There are mainly following fixes: - take `DeviceContext` as the template parameter of math functors and OpKernel instead of `Place` - remove `eigen_device` interface in base class `DeviceContext` - remove `GetEigenDevice` interface in `ExecutionContext` and base class `DeviceContext` - remove unused `platform::EigenDeviceConverter` - rename `REGISTER_OP_GPU_KERNEL` to `REGISTER_OP_CUDA_KERNEL` - rename `USE_GPU_ONLY_OP` to `USE_CUDA_ONLY_OP`
-
- 25 10月, 2017 1 次提交
-
-
由 Qiao Longfei 提交于
* init batch norm op * prepare input output * compute mean_out var_out save_mean save_var on CPU * active is test * use eigen to do computation * complete batch norm forward * set default momentum to 0.9 * add batch norm grad op in CPU * add tensor_format and NHWC support, add python test * add test training * add batch norm gradient test * improve comment, fix foward Python UnitTest * add gradient test * fix eigen warning * follow name style * fix a bug * change float to T * add simple forward test * test with different place * add backward test * refine python test * remove old python test code * code clean * follow code style * update comment
-
- 10 10月, 2017 1 次提交
-
-
由 Abhinav Arora 提交于
-
- 28 9月, 2017 1 次提交
-
-
由 Yu Yang 提交于
-
- 20 9月, 2017 1 次提交
-
-
由 dangqingqing 提交于
-
- 23 8月, 2017 1 次提交
-
-
由 dangqingqing 提交于
-
- 11 8月, 2017 1 次提交
-
-
由 Yu Yang 提交于
-
- 08 8月, 2017 1 次提交
-
-
由 fengjiayi 提交于
-
- 07 8月, 2017 1 次提交
-
-
由 dongzhihong 提交于
-
- 05 8月, 2017 1 次提交
-
-
由 Yi Wang 提交于
-
- 02 8月, 2017 1 次提交
-
-
由 fengjiayi 提交于
-
- 01 8月, 2017 1 次提交
-
-
由 Yu Yang 提交于
-
- 26 7月, 2017 1 次提交
-
-
由 fengjiayi 提交于
-
- 25 7月, 2017 1 次提交
-
-
由 Yu Yang 提交于
Make implement an operator less noisy.
-
- 19 7月, 2017 2 次提交