fix input_grad not set zero. test=develop

71101c9c · dengkaipeng · c9e0ade5 · 71101c9c · 71101c9c
Showing with 4 addition and 0 deletion

paddle/fluid/operators/temporal_shift_op.cu paddle/fluid/operators/temporal_shift_op.cu +3 -0

paddle/fluid/operators/temporal_shift_op.h paddle/fluid/operators/temporal_shift_op.h +1 -0

未找到文件。
--- a/paddle/fluid/operators/temporal_shift_op.cu
+++ b/paddle/fluid/operators/temporal_shift_op.cu
@@ -129,6 +129,9 @@ class TemporalShiftGradOpCUDAKernel : public framework::OpKernel<T> {
    const T* output_grad_data = output_grad->data<T>();
    T* input_grad_data = input_grad->mutable_data<T>({nt, c, h, w}, ctx.GetPlace());
+    math::SetConstant<platform::CUDADeviceContext, T>()(
+        ctx.template device_context<platform::CUDADeviceContext>(), input_grad,
+        static_cast<T>(0));
    int pixelNum = nt * chw;
    int grid_dim = (pixelNum + 512 - 1) / 512;

--- a/paddle/fluid/operators/temporal_shift_op.h
+++ b/paddle/fluid/operators/temporal_shift_op.h
@@ -88,6 +88,7 @@ class TemporalShiftGradKernel : public framework::OpKernel<T> {
    const T* output_grad_data = output_grad->data<T>();
    T* input_grad_data = input_grad->mutable_data<T>({nt, c, h, w}, ctx.GetPlace());
+    memset(input_grad_data, 0, input_grad->numel() * sizeof(T));
    int src_it = 0;
    for (int i = 0; i < output_grad->numel(); i++) {