Created by: zhaoyang-star
[内容] 更新pixel_shuffle
算子的 ARM NEON 实现(upscale_factor
为 2, 3, 4 是最常见的设置,设为其他值会执行 native c++ implementation)。
[效果] 图像修复模型pixel_shuffle
算子(共 7 个),NEON 实现(2.257 ms)native c++ 实现(7.803 ms),速度提升至之前的 3.46 倍。详细测试结果表明当输入 feature_map 越大,NEON 提升效果越明显。