1. 19 11月, 2018 1 次提交
    • Y
      Optimize the layer_norm operator with AVX intrinsic function (#14417) · f4c869d8
      Yihua Xu 提交于
      * Optimize layer_norm operator with AVX intrinsic functions
      
      * Revert the wrong modifications
      
      * Implement the jit kernel for layer_norm operator
      
      * Add math headfile to fix the compile issue (test=develop)
      
      * Add math headfile to fix the compile issue (test=develop)
      
      * Fixed the intrinsic headfile issue (test=develop)
      
      * Fix the conflicts (test=develop)
      
      * Revert for CUDA compiler (test=develop)
      
      * Fixed the cuda depency (test=develop)
      
      * Fix the marco issues (test=develop)
      f4c869d8
  2. 16 11月, 2018 2 次提交
  3. 15 11月, 2018 3 次提交
  4. 12 11月, 2018 1 次提交
  5. 08 11月, 2018 2 次提交
  6. 06 11月, 2018 2 次提交
  7. 01 11月, 2018 2 次提交
  8. 26 10月, 2018 1 次提交
  9. 22 10月, 2018 1 次提交
  10. 19 10月, 2018 1 次提交
  11. 17 10月, 2018 1 次提交
  12. 12 10月, 2018 1 次提交
  13. 11 10月, 2018 1 次提交
  14. 08 10月, 2018 3 次提交
  15. 30 9月, 2018 1 次提交
  16. 29 9月, 2018 3 次提交
  17. 28 9月, 2018 2 次提交
  18. 27 9月, 2018 1 次提交
  19. 26 9月, 2018 5 次提交
  20. 27 8月, 2018 2 次提交
  21. 22 8月, 2018 1 次提交
  22. 15 8月, 2018 2 次提交
  23. 08 5月, 2018 1 次提交
    • Y
      Clean OpProtoAndCheckerMaker · 0e78cb69
      Yu Yang 提交于
      Do not use ctor
      
      * Reduce line of codes.
      * We can use virtual function for Maker now.
      * The implementation does not care what maker holds, it is easier to
      refactor later.
      0e78cb69