1. 19 11月, 2018 1 次提交
    • Y
      Optimize the layer_norm operator with AVX intrinsic function (#14417) · f4c869d8
      Yihua Xu 提交于
      * Optimize layer_norm operator with AVX intrinsic functions
      
      * Revert the wrong modifications
      
      * Implement the jit kernel for layer_norm operator
      
      * Add math headfile to fix the compile issue (test=develop)
      
      * Add math headfile to fix the compile issue (test=develop)
      
      * Fixed the intrinsic headfile issue (test=develop)
      
      * Fix the conflicts (test=develop)
      
      * Revert for CUDA compiler (test=develop)
      
      * Fixed the cuda depency (test=develop)
      
      * Fix the marco issues (test=develop)
      f4c869d8
  2. 17 11月, 2018 1 次提交
  3. 16 11月, 2018 3 次提交
  4. 15 11月, 2018 3 次提交
  5. 12 11月, 2018 1 次提交
  6. 08 11月, 2018 2 次提交
  7. 06 11月, 2018 2 次提交
  8. 01 11月, 2018 2 次提交
  9. 26 10月, 2018 1 次提交
  10. 22 10月, 2018 1 次提交
  11. 19 10月, 2018 1 次提交
  12. 17 10月, 2018 1 次提交
  13. 12 10月, 2018 1 次提交
  14. 11 10月, 2018 1 次提交
  15. 08 10月, 2018 3 次提交
  16. 30 9月, 2018 1 次提交
  17. 29 9月, 2018 3 次提交
  18. 28 9月, 2018 2 次提交
  19. 27 9月, 2018 1 次提交
  20. 26 9月, 2018 5 次提交
  21. 27 8月, 2018 2 次提交
  22. 22 8月, 2018 1 次提交
  23. 15 8月, 2018 1 次提交