- 20 12月, 2021 1 次提交
-
-
由 Feng Xing 提交于
softmax_with_cross_entropy optimization with soft label. This PR includes optimization of "SoftmaxWithCrossEntropySoftLabel" : compute log_softmax and then compute loss. "CrossEntropySoftLabel" : compute loss with softmax as input. These optimization includes following technics: read data to buffer with vectorization compute max and sum in warp fixed loop size with macro Performance (computation time): softmax_with_cross_entropy_0 (forward) : -40.1% softmax_with_cross_entropy_0 (backward): -41%
-
- 03 12月, 2021 1 次提交
-
-
由 ronnywang 提交于
* refine structure for cuda and rocm * update * update * update * update
-
- 01 11月, 2021 1 次提交
-
-
由 Feng Xing 提交于
-
- 11 9月, 2021 1 次提交
-
-
由 Feng Xing 提交于
-
- 10 9月, 2021 2 次提交
- 05 6月, 2021 1 次提交
-
- 21 5月, 2021 1 次提交
-
-
由 Feng Xing 提交于
* optimize softmax with cross entropy hard label * label ignore_index cleaning
-
- 06 5月, 2021 1 次提交
-
-
由 chajchaj 提交于
-
- 02 4月, 2021 1 次提交
-
-
由 ronnywang 提交于
-
- 16 3月, 2021 1 次提交
-
-
由 ronnywang 提交于
-
- 11 3月, 2021 1 次提交
-
-
由 chajchaj 提交于
* add softmax_switch for softmax_with_cross_entropy_op, test=develop * delete using EigenMatrix in softmax_with_cross_entropy_op.h, test=develop * add REGISTER_OP_VERSION for softmax_switch attr of softmax_with_cross_entropy_op, test=develop
-
- 10 3月, 2021 1 次提交
-
-
由 Qi Li 提交于
-
- 03 3月, 2021 1 次提交
-
-
由 Qi Li 提交于
-
- 25 2月, 2021 1 次提交
-
-
由 Guanghua Yu 提交于
-
- 23 2月, 2021 2 次提交
-
-
由 Guanghua Yu 提交于
-
由 Zhong Hui 提交于
[BUG FIX] Fix softmax cross entropy overflow problem.
-
- 16 11月, 2020 1 次提交
-
-
由 Guo Sheng 提交于
* Fix gradients with ignore_idx in softmax_with_cross_entropy. test=develop * Fix gradients with ignore_idx in softmax_with_cross_entropy on cpu. Remove softmax_with_cross_entropy from op_threshold_white_list. test=develop * Fix test_softmax_cross_entropy_op.py. test=develop
-
- 12 10月, 2020 1 次提交
-
-
由 Guanghua Yu 提交于
* error message optimization in softmax_with_cross_entropy_op * fix some unsuited comment
-
- 16 7月, 2020 1 次提交
-
-
由 hong 提交于
-
- 11 7月, 2020 1 次提交
-
-
由 Chen Weihang 提交于
* fix softmax_with_cross_entropy cuda kernel overflow bug, test=develop * replace old macro & for condition, test=develop * polish details, test=develop
-
- 23 2月, 2020 1 次提交
-
-
由 tianshuo78520a 提交于
-
- 20 12月, 2019 1 次提交
-
-
由 Chen Weihang 提交于
-
- 03 12月, 2019 1 次提交
-
-
由 Leo Chen 提交于
-
- 18 11月, 2019 1 次提交
-
-
由 WangXi 提交于
-
- 09 5月, 2019 1 次提交
-
-
由 Zeng Jinle 提交于
-
- 07 5月, 2019 1 次提交
-
-
由 Kaipeng Deng 提交于
* add attr axis infershape. test=develop * add CUDA kernel. test=develop * fix unittest. test=develop * fix unittest for soft_label. test=develop * fix fp16 unittest. test=develop * remove comment code. test=develop * refine test for axis. test=develop * add python api. test=develop * fix doc. test=develop * fix fp16 unittest. test=develop * fix ngraph test. test=develop * fix ENFORCE for test_imperative_transformer. test=develop * fit for ngraph test. test=develop * fix after rebase develop. test=develop * fix doc. test=develop * fix API.spec. test=develop * fix test_layers. test=develop * fix format. test=develop
-
- 06 5月, 2019 1 次提交
-
-
由 Zeng Jinle 提交于
* add use_cuda to inplace pass,test=develop * add test softmax_with_xe_inplace test,test=develop
-
- 21 4月, 2019 1 次提交
-
-
由 Zeng Jinle 提交于
* speedup gc and inplace softmax_with_cross_entropy_grad test=develop * refine models gpu mem Merge skip vars and warning messages of mem opt remove relu mem opt test=develop * follow comments test=develop
-
- 11 4月, 2019 1 次提交
-
-
由 phlrain 提交于
test=develop
-
- 03 4月, 2019 1 次提交
-
-
由 minqiyang 提交于
-
- 02 4月, 2019 1 次提交
-
-
由 minqiyang 提交于
test=develop
-
- 19 3月, 2019 1 次提交
-
-
由 zhhsplendid 提交于
test=develop
-
- 17 3月, 2019 1 次提交
-
-
由 chengduo 提交于
test=develop
-
- 10 1月, 2019 1 次提交
-
-
由 Wu Yi 提交于
* clip softmax for fp16 * updates * fuse xent support fp16 test=develop * wip * wip * add simple row reduce * wip fp16 accurate softmax * add accurate softmax kernel for fp16 test=develop * update test=develop * fix cpu build test=develop * update api.spec test=develop * follow comments test=develop * fix build test=develop * fix trt build test=develop * fix inference build test=develop * fix merge test=develop * update test=develop * try fix build test=develop * fix build test=develop * rename real_exp test=develop * fortest * remove hacky kernels test=develop * clean up test=develop
-
- 11 12月, 2018 1 次提交
-
-
由 Yu Yang 提交于
The macro should be defined by compiler rather than by source. test=develop
-
- 30 10月, 2018 1 次提交
-
-
由 sneaxiy 提交于
-
- 13 9月, 2018 1 次提交
-
-
由 Bai Yifan 提交于
-
- 11 9月, 2018 1 次提交
-
-
由 Bai Yifan 提交于
* add ignore index * update api.spec * enhance softmax_with_cross_entropy
-
- 08 8月, 2018 1 次提交
-
-
由 sneaxiy 提交于
-