Created by: hjchen2
移动端使用多线程Eigen,加速inference。下图为不同线程数下MobileNet的测试结果(测试机为标准版小米MI5,其中两个cpu核锁频到1363MHz,另外两个cpu核锁频到1401MHz):
framework | speed | cpu | memory | size |
---|---|---|---|---|
paddlepaddle | 353ms | 25% | 210M | 3M |
paddlepaddle(2 threads) | 290ms | 42% | 210M | 3M |
paddlepaddle(4 threads) | 253ms | 50% | 210M | 3M |
非deepwise卷积使用Eigen两线程加速比2x左右,四线程加速3x左右,但由于有将近140ms被batch normalization消耗,所以总体加速不是很高。