- 01 3月, 2022 1 次提交
- 
- 
由 niuliling123 提交于* Add function description for Kernel Primitive API 1. Set cumsum and sort share memory size = 1024 2.sort and cumsum api limitation : blockDim.x must be less than 512 (blockDim.x <= 512) 
 
- 
- 22 2月, 2022 2 次提交
- 
- 
由 Zhang Zheng 提交于* Modify the implementation of BlockYReduce to fit more scenes * fix * fix 
- 
由 niuliling123 提交于* Add Sort API for Kernel Primitive API * update & -> ptr 
 
- 
- 20 2月, 2022 1 次提交
- 
- 
由 Chen Weihang 提交于* rename pten dir to phi * rename namespace to phi * rename infrt pten dir to phi * resolve conflict * rename pten to phi in cmake * revert all infrt change * change needed files * fix infrt failed * fix inference failed 
 
- 
- 17 2月, 2022 1 次提交
- 
- 
由 niuliling123 提交于
 
- 
- 09 2月, 2022 2 次提交
- 
- 
由 Zhang Zheng 提交于
- 
由 niuliling123 提交于
 
- 
- 08 2月, 2022 1 次提交
- 
- 
由 niuliling123 提交于* Replace clip, bce_loss, full and full_like with elementwise 
 
- 
- 26 1月, 2022 1 次提交
- 
- 
由 YuanRisheng 提交于* move kernel_primitives * use pten's errors 
 
- 
- 03 12月, 2021 1 次提交
- 
- 
由 ronnywang 提交于* refine structure for cuda and rocm * update * update * update * update 
 
- 
- 21 10月, 2021 1 次提交
- 
- 
由 niuliling123 提交于* Update the implement of reduceAnyKernel according to kernel primitive api * Fix a bug in ReadData, ReadDataBc and ReadDataReduce when NX != 1 
 
- 
- 26 9月, 2021 1 次提交
- 
- 
由 niuliling123 提交于
 
- 
- 14 9月, 2021 1 次提交
- 
- 
由 Yiqun Liu 提交于Implement FunctionTraits to support two kinds of elementwise functor and remove some old codes for broadcast. (#35688) 
 
- 
- 13 9月, 2021 2 次提交
- 08 9月, 2021 1 次提交
- 
- 
由 niuliling123 提交于
 
- 
- 01 9月, 2021 1 次提交
- 
- 
由 niuliling123 提交于* add ElementwiseTernary, Reduce, ReadDataStride 
 
- 
- 10 8月, 2021 1 次提交
- 
- 
由 niuliling123 提交于添加Kernel primitives api: ReadData, WriteData ComputeFunctor 
 
- 
- 27 7月, 2021 1 次提交
- 
- 
由 Feng Xing 提交于This PR add some primitives api related files. Those files are almost empty for the moment, but will be filled later. 
 
- 
- 25 4月, 2021 1 次提交
- 
- 
由 denglin-github 提交于* Add dlnne engine runtime * Fix log * Remove <const_cast> and remove unrelated modify with dlnne, +clang-format * Fix CMakeList format error * Add copyright message * Fix dlnne CMakeList.txt * Add some paddlepaddle_pass to support more networks * Fix some format bug 
 
- 
- 19 3月, 2019 1 次提交
- 
- 
由 zhhsplendid 提交于test=develop 
 
- 
- 21 1月, 2019 1 次提交
- 
- 
由 flame 提交于add python inference api 
 
- 
- 10 1月, 2019 1 次提交
- 
- 
由 flame 提交于
 
- 
- 13 12月, 2018 1 次提交
- 
- 
由 sneaxiy 提交于fix cmake again test=develop 
 
- 
- 10 12月, 2018 1 次提交
- 
- 
由 sneaxiy 提交于
 
- 
- 10 9月, 2018 1 次提交
- 
- 
由 Yan Chunwei 提交于
 
- 
- 18 6月, 2018 1 次提交
- 
- 
由 Yan Chunwei 提交于
 
- 
- 24 5月, 2018 1 次提交
- 
- 
由 Yan Chunwei 提交于
 
- 
- 23 5月, 2018 1 次提交
- 
- 
由 Yan Chunwei 提交于Add the demo of subgraph splitter 
 
- 
- 22 3月, 2018 1 次提交
- 
- 
由 Yu Yang 提交于
 
- 
- 07 3月, 2018 2 次提交
- 06 3月, 2018 2 次提交
- 15 2月, 2018 1 次提交
- 
- 
由 Yi Wang 提交于* Update tensor_util.h * Update with moved TensorDesc * Fix tensur_utils.cu * Update * Update * Update * Update * Make tensor_util.cu a symbolic link 
 
- 
- 10 2月, 2018 2 次提交
- 07 2月, 2018 1 次提交
- 
- 
由 fengjiayi 提交于
 
- 
- 06 2月, 2018 2 次提交
