/** * \file dnn/src/naive/warp_perspective/opr_impl.cpp * MegEngine is Licensed under the Apache License, Version 2.0 (the "License") * * Copyright (c) 2014-2020 Megvii Inc. All rights reserved. * * Unless required by applicable law or agreed to in writing, * software distributed under the License is distributed on an * "AS IS" BASIS, WITHOUT ARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. */ #include "src/naive/warp_perspective/opr_impl.h" #include "src/naive/warp_perspective/warp_perspective_cv.h" #include #include #include "midout.h" #include "src/common/cv/helper.h" #include "src/common/utils.h" #include "src/common/warp_common.h" #include "src/naive/handle.h" MIDOUT_DECL(megdnn_naive_warpperspective) using namespace megdnn; using namespace naive; template void WarpPerspectiveForwardImpl::kern_naive( const KernParam& kern_param, size_t task_id) { MEGDNN_MARK_USED_VAR(kern_param); MIDOUT_BEGIN(megdnn_naive_warpperspective, ctype, mtype, midout_iv(0)) { UNPACK_WARP_PERSPECTIVE_FWD_KERN_PARAM(kern_param); MEGDNN_MARK_USED_VAR(N_MAT); //! strides of C, H, W on src and dst size_t sstrd[3], dstrd[3]; auto set_sstrd = [&](size_t s0, size_t s1, size_t s2) { sstrd[0] = s0; sstrd[1] = s1; sstrd[2] = s2; }; auto set_dstrd = [&](size_t s0, size_t s1, size_t s2) { dstrd[0] = s0; dstrd[1] = s1; dstrd[2] = s2; }; switch (kern_param.format) { case Format::NCHW: case Format::NCHW4: set_sstrd(IH * IW, IW, 1); set_dstrd(OH * OW, OW, 1); break; case Format::NHWC: set_sstrd(1, IW * C, C); set_dstrd(1, OW * C, C); break; default: megdnn_throw("bad format"); } bool is_nchw4 = kern_param.format == Format::NCHW4; auto visit_src = [&sptr, sstrd, is_nchw4](size_t c, int h, int w) -> float { if (!is_nchw4) return sptr[sstrd[0] * c + sstrd[1] * h + sstrd[2] * w]; else return sptr[((sstrd[0] * (c >> 2) + sstrd[1] * h + sstrd[2] * w) << 2) + (c & 0b11)]; }; auto visit_src_bd = [&sptr, sstrd, border_val, is_nchw4]( size_t c, int h, int w) -> float { if (h != -1 && w != -1) { if (!is_nchw4) { return sptr[sstrd[0] * c + sstrd[1] * h + sstrd[2] * w]; } else { return sptr[((sstrd[0] * (c >> 2) + sstrd[1] * h + sstrd[2] * w) << 2) + (c & 0b11)]; } } else return border_val; }; auto visit_dst = [&dptr, dstrd, is_nchw4](size_t c, int h, int w) -> ctype& { if (!is_nchw4) return dptr[dstrd[0] * c + dstrd[1] * h + dstrd[2] * w]; else return dptr[((dstrd[0] * (c >> 2) + dstrd[1] * h + dstrd[2] * w) << 2) + (c & 0b11)]; }; rounding::RoundingConverter output_converter; auto orig_sptr = sptr; size_t n = task_id / OH; size_t oh = task_id % OH; mptr = mptr + n * 3 * 3; dptr = dptr + n * C * OH * OW; if (midx_ptr) { size_t idx = midx_ptr[n]; megdnn_assert( idx < N_SRC, "mat_idx out of bound: mat_idx[%zu]=%zu src_batch=%zu", n, idx, N_SRC); sptr = orig_sptr + idx * (C * IH * IW); } else if (n) { sptr += n * C * IH * IW; } rep(ow, OW) { float numeratorw = mptr[0] * ow + mptr[1] * oh + mptr[2]; float numeratorh = mptr[3] * ow + mptr[4] * oh + mptr[5]; float denominator = mptr[6] * ow + mptr[7] * oh + mptr[8]; float alphaw = numeratorw / denominator; float alphah = numeratorh / denominator; int iw0 = get_real_coord(std::floor(alphaw) + 0, IW); int iw1 = get_real_coord(std::floor(alphaw) + 1, IW); int ih0 = get_real_coord(std::floor(alphah) + 0, IH); int ih1 = get_real_coord(std::floor(alphah) + 1, IH); alphaw -= floor(alphaw); alphah -= floor(alphah); if (bmode != BorderMode::CONSTANT) { rep(c, C) { visit_dst(c, oh, ow) = output_converter( visit_src(c, ih0, iw0) * (1.0f - alphaw) * (1.0f - alphah) + visit_src(c, ih0, iw1) * alphaw * (1.0f - alphah) + visit_src(c, ih1, iw0) * (1.0f - alphaw) * alphah + visit_src(c, ih1, iw1) * alphaw * alphah); } } else { rep(c, C) { auto val = visit_src_bd(c, ih0, iw0) * (1.0f - alphaw) * (1.0f - alphah) + visit_src_bd(c, ih0, iw1) * alphaw * (1.0f - alphah) + visit_src_bd(c, ih1, iw0) * (1.0f - alphaw) * alphah + visit_src_bd(c, ih1, iw1) * alphaw * alphah; visit_dst(c, oh, ow) = output_converter( std::isfinite(val) ? val : border_val); } } } } MIDOUT_END(); } #define INST(ctype, mtype) \ template void WarpPerspectiveForwardImpl::kern_naive( \ const KernParam&, size_t); INST(float, float); #if !MEGDNN_DISABLE_FLOAT16 INST(dt_float16, float); INST(dt_float16, dt_float16); INST(dt_bfloat16, float); INST(dt_bfloat16, dt_bfloat16); #endif INST(int8_t, float); INST(uint8_t, float); #undef INST template void WarpPerspectiveForwardImpl::kern_naive_nhwcd4( const KernParam& kern_param, size_t task_id) { MIDOUT_BEGIN(megdnn_naive_warpperspective, ctype, mtype, midout_iv(1)) { auto get_index = [](size_t h, size_t w, size_t c, size_t W, size_t C) -> size_t { size_t idx = h * (C / 4) * W * 4 + (c / 4) * W * 4 + w * 4 + (c % 4); return idx; }; rounding::RoundingConverter output_converter; UNPACK_WARP_PERSPECTIVE_FWD_KERN_PARAM(kern_param); MEGDNN_MARK_USED_VAR(N_MAT); size_t n = task_id / OH; size_t oh = task_id % OH; auto orig_sptr = sptr; mptr = mptr + n * 3 * 3; dptr = dptr + n * OH * (C / 4) * OW * 4; if (midx_ptr) { size_t idx = midx_ptr[n]; megdnn_assert( idx < N_SRC, "mat_idx out of bound: mat_idx[%zu]=%zu src_batch=%zu", n, idx, N_SRC); sptr = orig_sptr + idx * IH * (C / 4) * IW * 4; } else if (n) { sptr += n * IH * (C / 4) * IW * 4; } rep(ow, OW) { float numeratorw = mptr[0] * ow + mptr[1] * oh + mptr[2]; float numeratorh = mptr[3] * ow + mptr[4] * oh + mptr[5]; float denominator = mptr[6] * ow + mptr[7] * oh + mptr[8]; float alphaw = numeratorw / denominator; float alphah = numeratorh / denominator; int iw0 = get_real_coord(std::floor(alphaw) + 0, IW); int iw1 = get_real_coord(std::floor(alphaw) + 1, IW); int ih0 = get_real_coord(std::floor(alphah) + 0, IH); int ih1 = get_real_coord(std::floor(alphah) + 1, IH); alphaw -= floor(alphaw); alphah -= floor(alphah); if (bmode != BorderMode::CONSTANT) { rep(c, C) { dptr[get_index(oh, ow, c, OW, C)] = output_converter( sptr[get_index(ih0, iw0, c, IW, C)] * (1.0f - alphaw) * (1.0f - alphah) + sptr[get_index(ih0, iw1, c, IW, C)] * alphaw * (1.0f - alphah) + sptr[get_index(ih1, iw0, c, IW, C)] * (1.0f - alphaw) * alphah + sptr[get_index(ih1, iw1, c, IW, C)] * alphaw * alphah); } } else { rep(c, C) { const float b = border_val; auto val = (ih0 != -1 && iw0 != -1 ? sptr[get_index(ih0, iw0, c, IW, C)] : b) * (1.0f - alphaw) * (1.0f - alphah) + (ih0 != -1 && iw1 != -1 ? sptr[get_index(ih0, iw1, c, IW, C)] : b) * alphaw * (1.0f - alphah) + (ih1 != -1 && iw0 != -1 ? sptr[get_index(ih1, iw0, c, IW, C)] : b) * (1.0f - alphaw) * alphah + (ih1 != -1 && iw1 != -1 ? sptr[get_index(ih1, iw1, c, IW, C)] : b) * alphaw * alphah; dptr[get_index(oh, ow, c, OW, C)] = output_converter(std::isfinite(val) ? val : b); } } } } MIDOUT_END(); } void WarpPerspectiveForwardImpl::exec(_megdnn_tensor_in src, _megdnn_tensor_in mat, _megdnn_tensor_in mat_idx, _megdnn_tensor_out dst, _megdnn_workspace workspace) { check_exec_allow_nhwc_mat_idx(src.layout, mat.layout, mat_idx.layout, dst.layout, workspace.size); size_t batch = dst.layout[0]; #define cb(dt, ct, mct) \ case DTypeTrait

::enumv: { \ auto kparam = KernParam::from_tensors( \ param().format, param().bmode, param().border_val, src, mat, \ mat_idx, dst, workspace); \ auto run = [kparam, this](size_t index, size_t) { \ kern_naive(kparam, index); \ }; \ MEGDNN_DISPATCH_MULTI_THREAD_CPU_KERN_OPR(run, kparam.oh* batch); \ return; \ } #define KERN_CD4(ct, mct) \ auto kparam = KernParam::from_tensors( \ param().format, param().bmode, param().border_val, src, mat, \ mat_idx, dst, workspace); \ auto run = [kparam, this](size_t index, size_t) { \ kern_naive_nhwcd4(kparam, index); \ }; \ MEGDNN_DISPATCH_MULTI_THREAD_CPU_KERN_OPR(run, batch* oh); #define KERN(ct, mct) \ auto kparam = KernParam::from_tensors( \ param().format, param().bmode, param().border_val, src, mat, \ mat_idx, dst, workspace); \ auto run = [kparam, this](size_t index, size_t) { \ kern_naive(kparam, index); \ }; \ MEGDNN_DISPATCH_MULTI_THREAD_CPU_KERN_OPR(run, kparam.oh* batch); #define DISPATCH_ST(dt, ct, mct, kern) \ if (src.layout.dtype.enumv() == DTypeTrait

::enumv) { \ kern(ct, mct); \ return; \ } #define DISPATCH_ST_MT(dt, ct, kern) \ if (src.layout.dtype.enumv() == DTypeTrait

::enumv) { \ if (mat.layout.dtype.enumv() == DTypeTrait::enumv) { \ kern(ct, float); \ return; \ } else { \ kern(ct, ct); \ return; \ } \ } if (param().format == Format::NHWCD4) { size_t oh = dst.layout[1]; DISPATCH_ST(dtype::Float32, float, float, KERN_CD4); DISPATCH_ST(dtype::Quantized8Asymm, uint8_t, float, KERN_CD4); DISPATCH_ST(dtype::QuantizedS8, int8_t, float, KERN_CD4); MEGDNN_INC_FLOAT16( DISPATCH_ST_MT(dtype::Float16, dt_float16, KERN_CD4)); MEGDNN_INC_FLOAT16( DISPATCH_ST_MT(dtype::BFloat16, dt_bfloat16, KERN_CD4)); megdnn_throw(ssprintf("Unsupported input DType in " "WarpPerspective: %s", src.layout.dtype.name()) .c_str()); } if (warp::is_cv_available(src.layout, mat.layout, dst.layout, param().imode, param().format)) { MIDOUT_BEGIN(megdnn_naive_warpperspective, void) { warp_perspective_cv_exec(src, mat, mat_idx, dst, param().border_val, param().bmode, param().imode, handle()); } MIDOUT_END(); } else { megdnn_assert(warp::is_dnn_available(src.layout, mat.layout, dst.layout, param().imode, param().format)); /*! * We currently use floating point for all WarpPerspective computation, * so even if the input ctype is one of the integer type, mtype should * always be float32. * * \warning It's different with \c WarpAffine, with mtype be float16 if * input type is float16. */ DISPATCH_ST(dtype::Float32, float, float, KERN); DISPATCH_ST(dtype::Int8, int8_t, float, KERN); DISPATCH_ST(dtype::QuantizedS8, int8_t, float, KERN); DISPATCH_ST(dtype::Uint8, uint8_t, float, KERN); DISPATCH_ST(dtype::Quantized8Asymm, uint8_t, float, KERN); MEGDNN_INC_FLOAT16(DISPATCH_ST_MT(dtype::Float16, dt_float16, KERN)); MEGDNN_INC_FLOAT16(DISPATCH_ST_MT(dtype::BFloat16, dt_bfloat16, KERN)); megdnn_throw(ssprintf("Unsupported input DType in " "WarpPerspective: %s", src.layout.dtype.name()) .c_str()); } #undef DISPATCH_ST_MT #undef DISPATCH_ST #undef KERN #undef KERN_CD4 } template void WarpPerspectiveBackwardDataImpl::kern_naive(const KernParam& kern_param) { const int N = kern_param.n, C = kern_param.c, IH = kern_param.ih, IW = kern_param.iw; const int OH = kern_param.oh, OW = kern_param.ow; const ctype* hptr_ = kern_param.hptr; const mtype* mptr_ = kern_param.mptr; ctype* sptr_ = kern_param.sptr; auto hptr = hptr_; auto mptr = mptr_; auto sptr = sptr_; std::memset(sptr, 0, sizeof(ctype) * N * C * IH * IW); rep(n, N) { rep(oh, OH) rep(ow, OW) { float numeratorw = mptr[0] * ow + mptr[1] * oh + mptr[2]; float numeratorh = mptr[3] * ow + mptr[4] * oh + mptr[5]; float denominator = mptr[6] * ow + mptr[7] * oh + mptr[8]; float alphaw = numeratorw / denominator; float alphah = numeratorh / denominator; int iw0 = get_real_coord(std::floor(alphaw) + 0, IW); int iw1 = get_real_coord(std::floor(alphaw) + 1, IW); int ih0 = get_real_coord(std::floor(alphah) + 0, IH); int ih1 = get_real_coord(std::floor(alphah) + 1, IH); alphaw -= floor(alphaw); alphah -= floor(alphah); rep(c, C) { float hidden = hptr[c * OH * OW + oh * OW + ow]; if (iw0 != -1 && ih0 != -1) { sptr[c * IH * IW + ih0 * IW + iw0] += (1.0f - alphaw) * (1.0f - alphah) * hidden; } if (iw0 != -1 && ih1 != -1) { sptr[c * IH * IW + ih1 * IW + iw0] += (1.0f - alphaw) * alphah * hidden; } if (iw1 != -1 && ih0 != -1) { sptr[c * IH * IW + ih0 * IW + iw1] += alphaw * (1.0f - alphah) * hidden; } if (iw1 != -1 && ih1 != -1) { sptr[c * IH * IW + ih1 * IW + iw1] += alphaw * alphah * hidden; } } } sptr += C * IH * IW; hptr += C * OH * OW; mptr += 3 * 3; } } void WarpPerspectiveBackwardDataImpl::exec(_megdnn_tensor_in mat, _megdnn_tensor_in diff, _megdnn_tensor_out grad, _megdnn_workspace workspace) { check_exec(mat.layout, diff.layout, grad.layout, workspace.size); megdnn_assert(param().format == param::WarpPerspective::Format::NCHW, "invalid warp_perspective format"); #define DISPATCH_ST_MT(dt, ct) \ if (diff.layout.dtype.enumv() == DTypeTrait

::enumv) { \ if (mat.layout.dtype.enumv() == DTypeTrait::enumv) { \ auto kparam = KernParam::from_tensors(mat, diff, grad); \ MEGDNN_DISPATCH_CPU_KERN_OPR(kern_naive(kparam)); \ return; \ } else { \ auto kparam = KernParam::from_tensors(mat, diff, grad); \ MEGDNN_DISPATCH_CPU_KERN_OPR(kern_naive(kparam)); \ return; \ } \ } DISPATCH_ST_MT(dtype::Float32, dt_float32); MEGDNN_INC_FLOAT16(DISPATCH_ST_MT(dtype::BFloat16, dt_bfloat16)); megdnn_throw(ssprintf("Unsupported input DType in " "WarpPerspective: %s", diff.layout.dtype.name()) .c_str()); #undef DISPATCH_ST_MT } template void WarpPerspectiveBackwardMatImpl::kern_naive( const KernParam& kern_param) { const int N = kern_param.n, C = kern_param.c, IH = kern_param.ih, IW = kern_param.iw; const int OH = kern_param.oh, OW = kern_param.ow; auto hptr = kern_param.hptr; auto sptr = kern_param.sptr; auto mptr = kern_param.mptr; auto res = kern_param.res; auto border_val = kern_param.border_val; std::memset(res, 0, sizeof(float) * N * 3 * 3); rep(n, N) { rep(oh, OH) rep(ow, OW) { float numeratorw = mptr[0] * ow + mptr[1] * oh + mptr[2]; float numeratorh = mptr[3] * ow + mptr[4] * oh + mptr[5]; float denominator = mptr[6] * ow + mptr[7] * oh + mptr[8]; float denominator2 = denominator * denominator; float alphaw = numeratorw / denominator; float alphah = numeratorh / denominator; int iw0 = get_real_coord(std::floor(alphaw) + 0, IW); int iw1 = get_real_coord(std::floor(alphaw) + 1, IW); int ih0 = get_real_coord(std::floor(alphah) + 0, IH); int ih1 = get_real_coord(std::floor(alphah) + 1, IH); alphaw -= floor(alphaw); alphah -= floor(alphah); rep(c, C) { float b = border_val; float hidden = hptr[c * OH * OW + oh * OW + ow]; float dalphaw = 0; dalphaw -= ((ih0 != -1 && iw0 != -1) ? sptr[c * IH * IW + ih0 * IW + iw0] : b) * (1.0f - alphah); dalphaw += ((ih0 != -1 && iw1 != -1) ? sptr[c * IH * IW + ih0 * IW + iw1] : b) * (1.0f - alphah); dalphaw -= ((ih1 != -1 && iw0 != -1) ? sptr[c * IH * IW + ih1 * IW + iw0] : b) * alphah; dalphaw += ((ih1 != -1 && iw1 != -1) ? sptr[c * IH * IW + ih1 * IW + iw1] : b) * alphah; float dalphah = 0; dalphah -= ((ih0 != -1 && iw0 != -1) ? sptr[c * IH * IW + ih0 * IW + iw0] : b) * (1.0f - alphaw); dalphah -= ((ih0 != -1 && iw1 != -1) ? sptr[c * IH * IW + ih0 * IW + iw1] : b) * alphaw; dalphah += ((ih1 != -1 && iw0 != -1) ? sptr[c * IH * IW + ih1 * IW + iw0] : b) * (1.0f - alphaw); dalphah += ((ih1 != -1 && iw1 != -1) ? sptr[c * IH * IW + ih1 * IW + iw1] : b) * alphaw; // printf("dalphaw=%f dalphah=%f\n", dalphaw, dalphaw); float dw[9], dh[9]; // dw[i] = d(iw)/d(mat[i]) dw[0] = ow / denominator; dw[1] = oh / denominator; dw[2] = 1.0f / denominator; dw[3] = 0.0f; dw[4] = 0.0f; dw[5] = 0.0f; float ddenominatorw = -numeratorw / denominator2; dw[6] = ow * ddenominatorw; dw[7] = oh * ddenominatorw; dw[8] = 1.0f * ddenominatorw; // dh[i] = d(ih)/d(mat[i]) dh[0] = 0.0f; dh[1] = 0.0f; dh[2] = 0.0f; dh[3] = ow / denominator; dh[4] = oh / denominator; dh[5] = 1.0f / denominator; float ddenominatorh = -numeratorh / denominator2; dh[6] = ow * ddenominatorh; dh[7] = oh * ddenominatorh; dh[8] = 1.0f * ddenominatorh; rep(i, 9) { float delta = hidden * dalphaw * dw[i] + hidden * dalphah * dh[i]; if (std::isfinite(delta)) res[i] += delta; } } } hptr += C * OH * OW; sptr += C * IH * IW; mptr += 3 * 3; res += 3 * 3; } } void WarpPerspectiveBackwardMatImpl::exec(_megdnn_tensor_in src, _megdnn_tensor_in mat, _megdnn_tensor_in diff, _megdnn_tensor_out grad, _megdnn_workspace workspace) { check_exec(src.layout, mat.layout, diff.layout, grad.layout, workspace.size); #define DISPATCH_ST_MT(dt, ct) \ if (src.layout.dtype.enumv() == DTypeTrait

::enumv) { \ if (mat.layout.dtype.enumv() == DTypeTrait::enumv) { \ auto kparam = KernParam::from_tensors( \ param().border_val, src, mat, diff, grad); \ MEGDNN_DISPATCH_CPU_KERN_OPR(kern_naive(kparam)); \ return; \ } else { \ auto kparam = KernParam::from_tensors( \ param().border_val, src, mat, diff, grad); \ MEGDNN_DISPATCH_CPU_KERN_OPR(kern_naive(kparam)); \ return; \ } \ } DISPATCH_ST_MT(dtype::Float32, dt_float32); MEGDNN_INC_FLOAT16(DISPATCH_ST_MT(dtype::BFloat16, dt_bfloat16)); megdnn_throw(ssprintf("Unsupported input DType in " "WarpPerspective: %s", diff.layout.dtype.name()) .c_str()); #undef DISPATCH_ST_MT } // vim: syntax=cpp.doxygen