update fetch kernel file in FPGA V2 track and test for refork, test=mobile

08066659 · qnqinan · d4739621 · 08066659
隐藏空白更改
内联并排

Showing with 4 addition and 3 deletion

mobile/src/operators/kernel/fpga/V2/fetch_kernel.cpp mobile/src/operators/kernel/fpga/V2/fetch_kernel.cpp +4 -3

未找到文件。
--- a/mobile/src/operators/kernel/fpga/V2/fetch_kernel.cpp
+++ b/mobile/src/operators/kernel/fpga/V2/fetch_kernel.cpp
@@ -85,12 +85,13 @@ void FetchKernel<FPGA, float>::Compute(const FetchParam<FPGA> &param) {
  }
  auto input_address = input->data<int8_t>();
  float Si = input->scale[0];
+  float scale = Si / 127.0f;

  const int num_th = 32;
  fpga::fpga_invalidate(input_address, (input->fpga_data_num) * sizeof(int8_t));
  if (input->fpga_data_num < num_th) {
    for (int idx = 0; idx < product(input->dims()); ++idx) {
-      outdata_ptr[idx] = input_address[idx] / 127.0 * Si;
+      outdata_ptr[idx] = input_address[idx] * scale;
    }
    fpga::fpga_flush(outdata_ptr, product(input->dims()) * sizeof(float));
    return;
@@ -101,14 +102,14 @@ void FetchKernel<FPGA, float>::Compute(const FetchParam<FPGA> &param) {
    auto aligned_ptr = aligned_out->data<float>();
    fpga::fpga_invalidate(aligned_ptr, (input->fpga_data_num) * sizeof(float));
    for (int idx = 0; idx < input->fpga_data_num; ++idx) {
-      aligned_ptr[idx] = input_address[idx] / 127.0 * Si;
+      aligned_ptr[idx] = input_address[idx] * scale;
    }
    dealign(aligned_ptr, outdata_ptr, outC, outH, outW);
    fpga::fpga_flush(outdata_ptr, outC * outH * outW * sizeof(float));
    return;
  }
  for (int idx = 0; idx < input->fpga_data_num; ++idx) {
-    outdata_ptr[idx] = input_address[idx] / 127.0 * Si;
+    outdata_ptr[idx] = input_address[idx] * scale;
  }
  fpga::fpga_flush(outdata_ptr, outC * outH * outW * sizeof(float));
 }