modify requantize for s8 u8 reorder

c167474c · xiaolil1 · edc53a0d · c167474c
隐藏空白更改
内联并排

Showing with 12 addition and 3 deletion

paddle/fluid/operators/requantize_op.cc paddle/fluid/operators/requantize_op.cc +12 -3

未找到文件。
--- a/paddle/fluid/operators/requantize_op.cc
+++ b/paddle/fluid/operators/requantize_op.cc
@@ -35,6 +35,7 @@ template <typename T>
 class ReQuantOpKernel : public framework::OpKernel<T> {
 public:
  void Compute(const framework::ExecutionContext& ctx) const override {
+//std::cout<<"this is requant op!!!!!"<<std::endl;
    auto* input = ctx.Input<Tensor>("Input");
    //auto* scale = ctx.Input<Tensor>("Scale");
    auto* output = ctx.Output<Tensor>("Output");
@@ -74,12 +75,20 @@ class ReQuantOpKernel : public framework::OpKernel<T> {
    auto reorder_pd = std::shared_ptr<reorder::primitive_desc>(
        new reorder::primitive_desc(src_pd, dst_pd, attri));   
-    auto reorder_p= std::shared_ptr<reorder>(new reorder(*reorder_pd, *src_memory_p, dst_memory));
-    pipeline.push_back(*reorder_p);
+    int is_sum = ctx.Attr<int>("is_sum");
-    stream(stream::kind::eager).submit(pipeline).wait();
+    if(is_sum){
+//std::cout<<"is_sum == true"<<std::endl;
+        memcpy(output_data, input_data, sizeof(uint8_t) * input->numel());
+    } else{
+        auto reorder_p= std::shared_ptr<reorder>(new reorder(*reorder_pd, *src_memory_p, dst_memory));
+        pipeline.push_back(*reorder_p);
+        stream(stream::kind::eager).submit(pipeline).wait();
+    }
    output->set_layout(DataLayout::kMKLDNN);
    output->set_format(GetMKLDNNFormat(dst_memory));
+//std::cout<<"requant op end!!!!!"<<std::endl;
  }
 };