Created by: chenjiaoAngel
修改Ch_in <= 4 * w_in 条件限制,这个只有在输入channel比较大,输入图像宽相对小的时,这个控制才有效:C4 的conv_dw性能优于普通实现