- 25 3月, 2018 1 次提交
-
-
由 Xin Pan 提交于
transfomer on a single device step time reduces from 0.157 to 0.125
-
- 19 3月, 2018 8 次提交
-
-
由 Xin Pan 提交于
Enable P2P memory copy
-
由 Xin Pan 提交于
-
由 Xin Pan 提交于
On k40 with 4 devices, time reduces from ~4.0 to ~3.8+, should be more obvious on better hardware
-
由 fengjiayi 提交于
move two images
-
由 fengjiayi 提交于
-
由 Tao Luo 提交于
Limit the symbol table of fluid shared library.
-
由 Qiao Longfei 提交于
Add distributed lookup table design
-
由 Tao Luo 提交于
Remove unnecessary clone of program in C++ Executor.Run
-
- 18 3月, 2018 1 次提交
-
-
由 Kexin Zhao 提交于
Add float16 support for pool 2d operator
-
- 17 3月, 2018 5 次提交
-
-
由 Kexin Zhao 提交于
-
由 Kexin Zhao 提交于
-
由 Kexin Zhao 提交于
Add float16 support for cast op
-
由 Kexin Zhao 提交于
-
由 Darcy 提交于
add gserver to capi dep
-
- 16 3月, 2018 25 次提交
-
-
由 Qiao Longfei 提交于
rm unused private field in profiler
-
由 Qiao Longfei 提交于
fix regularizer when gradient is None
-
由 Liu Yiqun 提交于
-
由 qiaolongfei 提交于
-
由 Liu Yiqun 提交于
-
由 qiaolongfei 提交于
-
由 fengjiayi 提交于
Update cpp reader doc
-
由 Shan Yi 提交于
delete unused images
-
由 ranqiu 提交于
-
由 Kexin Zhao 提交于
Add float16 support for cudnn conv2d
-
由 Kexin Zhao 提交于
-
由 Shan Yi 提交于
remove legacy design image
-
由 Kexin Zhao 提交于
-
由 Xin Pan 提交于
Fix a program copy regression.
-
由 typhoonzero 提交于
-
由 Tao Luo 提交于
fix AttributeError: 'module' object has no attribute 'framework_pb2'
-
-
由 Tao Luo 提交于
add math_function to selected_rows_functor dependency list
-
由 Tao Luo 提交于
change the dir of docs
-
由 Xin Pan 提交于
Single device on se-resnet reduce from 0.56 to 0.50
-
由 qingqing01 提交于
-
由 Kexin Zhao 提交于
-
由 Kexin Zhao 提交于
-
由 Xi Chen 提交于
-
由 Varun Arora 提交于
* New test for testing channels / concurrency * Formatting fix
-