diff --git a/docs/user_guide/op_lists.rst b/docs/user_guide/op_lists.rst
index 860c2f5fcaf35181e8caeb3f5ce5798c5b026a00..63a033467c7ac3856aecbff3ed7d9c4ceafeea8e 100644
--- a/docs/user_guide/op_lists.rst
+++ b/docs/user_guide/op_lists.rst
@@ -12,7 +12,7 @@ Operator lists
     "BIAS_ADD","Y",""
     "CAST","Y","Only CPU and TensorFlow model is supported."
     "CHANNEL_SHUFFLE","Y",""
-    "CONCATENATION","Y","Only support channel axis concatenation."
+    "CONCATENATION","Y","For GPU only support channel axis concatenation."
     "CONV_2D","Y","Fusion with BN and activation layer is supported."
     "CROP","Y","Only Caffe's crop layer is supported (in GPU, offset on channel-dim should be dividable by 4)."
     "DECONV_2D","Y","Supports Caffe's Deconvolution and TensorFlow's tf.layers.conv2d_transpose."
@@ -20,7 +20,7 @@ Operator lists
     "DEPTH_TO_SPACE","Y",""
     "DEQUANTIZE","Y","Model quantization will be supported later."
     "ELEMENT_WISE","Y","ADD/MUL/DIV/MIN/MAX/NEG/ABS/SQR_DIFF/POW/RSQRT/EQUAL"
-    "EMBEDDING_LOOKUP","Y","Only support channel axis concatenation."
+    "EMBEDDING_LOOKUP","Y",""
     "FULLY_CONNECTED","Y",""
     "GROUP_CONV_2D","","Caffe model with group count = channel count is supported."
     "IDENTITY","Y","Only TensorFlow model is supported."
@@ -44,7 +44,7 @@ Operator lists
     "SHAPE","Y","Only CPU and TensorFlow is supported."
     "STACK","Y","Only CPU and TensorFlow is supported."
     "STRIDEDSLICE","Y","Only CPU and TensorFlow is supported."
-    "SLICE","Y","In TensorFlow, this op is equivalent to SPLIT; Only support channel axis slice."
+    "SPLIT","Y","In Caffe, this op is equivalent to SLICE; For GPU only support channel axis slice."
     "SOFTMAX","Y",""
     "SPACE_TO_BATCH_ND", "Y",""
     "SPACE_TO_DEPTH","Y",""
diff --git a/mace/core/runtime/opencl/opencl_allocator.cc b/mace/core/runtime/opencl/opencl_allocator.cc
index 7dda80e62fd4ca66cf4f2e109e4ab0f5653ae05d..86b0138d727da41171c315fde3e121d88877fb04 100644
--- a/mace/core/runtime/opencl/opencl_allocator.cc
+++ b/mace/core/runtime/opencl/opencl_allocator.cc
@@ -70,7 +70,7 @@ MaceStatus OpenCLAllocator::New(size_t nbytes, void **result) const {
 MaceStatus OpenCLAllocator::NewImage(const std::vector<size_t> &image_shape,
                                      const DataType dt,
                                      void **result) const {
-  MACE_CHECK(image_shape.size() == 2) << "Image shape's size must equal 2";
+  MACE_CHECK(image_shape.size() == 2, "Image shape's size must equal 2");
   VLOG(3) << "Allocate OpenCL image: " << image_shape[0] << ", "
           << image_shape[1];
 
@@ -134,7 +134,7 @@ void *OpenCLAllocator::Map(void *buffer, size_t offset, size_t nbytes) const {
 void *OpenCLAllocator::MapImage(void *buffer,
                                 const std::vector<size_t> &image_shape,
                                 std::vector<size_t> *mapped_image_pitch) const {
-  MACE_CHECK(image_shape.size() == 2) << "Just support map 2d image";
+  MACE_CHECK(image_shape.size() == 2, "Just support map 2d image");
   auto cl_image = static_cast<cl::Image2D *>(buffer);
   std::array<size_t, 3> origin = {0, 0, 0};
   std::array<size_t, 3> region = {image_shape[0], image_shape[1], 1};
diff --git a/mace/core/types.cc b/mace/core/types.cc
index 05b6acb3c5af3072c774f6620b6d4f9077a72b8b..8f29bcc0d61bc9c20f7fe68947ae9b56153f9333 100644
--- a/mace/core/types.cc
+++ b/mace/core/types.cc
@@ -39,7 +39,7 @@ std::string DataTypeToString(const DataType dt) {
 #endif
       {DT_UINT8, "DT_UINT8"},
       {DT_INT32, "DT_UINT32"}};
-  MACE_CHECK(dt != DT_INVALID) << "Not support Invalid data type";
+  MACE_CHECK(dt != DT_INVALID, "Not support Invalid data type");
   return dtype_string_map[dt];
 }
 
diff --git a/mace/kernels/fill.h b/mace/kernels/fill.h
index 5e172c3fa31dbbe46afd871b4ec80b759afdbdc9..b534a1839c77d183441e9cff74c1de6a917fa648 100644
--- a/mace/kernels/fill.h
+++ b/mace/kernels/fill.h
@@ -26,41 +26,39 @@
 namespace mace {
 namespace kernels {
 
-struct FillBase {
-  explicit FillBase(float value) : value_(value) {}
-
-  int value_;
-};
-
 template <DeviceType D, class T>
 struct FillFunctor;
 
 template <>
-struct FillFunctor<DeviceType::CPU, float> : FillBase {
-  explicit FillFunctor(float value) : FillBase(value) {}
+struct FillFunctor<DeviceType::CPU, float> {
+  FillFunctor() {}
 
   MaceStatus operator()(const Tensor *shape,
+                        const Tensor *value,
                         Tensor *output,
                         StatsFuture *future) {
     MACE_UNUSED(future);
 
-    MACE_CHECK(shape->dim_size() == 1) << "Shape must be 1-D";
+    MACE_CHECK(shape->dim_size() == 1, "Shape must be 1-D");
     const index_t num_dims = shape->dim(0);
     Tensor::MappingGuard shape_guard(shape);
     const int32_t *shape_data = shape->data<int32_t>();
 
     std::vector<index_t> output_shape;
     for (index_t i = 0; i < num_dims; ++i) {
-      MACE_CHECK(shape_data[i] > 0) << "Shape must be non-negative: "
-        << shape_data[i];
+      MACE_CHECK(shape_data[i] > 0, "Shape must be non-negative: ",
+                 shape_data[i]);
       output_shape.push_back(shape_data[i]);
     }
 
+    Tensor::MappingGuard value_guard(value);
+    const float *value_data = value->data<float>();
+
     MACE_RETURN_IF_ERROR(output->Resize(output_shape));
     Tensor::MappingGuard output_guard(output);
     float *output_data = output->mutable_data<float>();
 
-    std::fill(output_data, output_data + output->size(), value_);
+    std::fill(output_data, output_data + output->size(), *value_data);
 
     return MACE_SUCCESS;
   }
diff --git a/mace/kernels/opencl/helper.h b/mace/kernels/opencl/helper.h
index 22d9f1cc548c8691b313db12f6693a86bdbf957b..5d4bf4104172ac093212fcb023941e9bb0015b6c 100644
--- a/mace/kernels/opencl/helper.h
+++ b/mace/kernels/opencl/helper.h
@@ -58,7 +58,7 @@ namespace kernels {
   if (runtime->IsOutOfRangeCheckEnabled()) {                               \
     (kernel_error)->Map(nullptr);                                          \
     char *kerror_code = (kernel_error)->mutable_data<char>();              \
-    MACE_CHECK(*kerror_code == 0) << "Kernel error code: " << *kerror_code;\
+    MACE_CHECK(*kerror_code == 0, "Kernel error code: ", *kerror_code);\
     (kernel_error)->UnMap();                                               \
   }
 
diff --git a/mace/ops/concat_test.cc b/mace/ops/concat_test.cc
index 9076aa2768157da4f42adf0ac39cba0fed4ba751..f8b6b42a7824d3ee2824ca60fffd585e0daf864c 100644
--- a/mace/ops/concat_test.cc
+++ b/mace/ops/concat_test.cc
@@ -55,10 +55,10 @@ TEST_F(ConcatOpTest, CPUSimpleHorizon) {
 
   const float *output_ptr = output->data<float>();
   for (auto f : input0) {
-    ASSERT_EQ(f, *output_ptr++);
+    EXPECT_EQ(f, *output_ptr++);
   }
   for (auto f : input1) {
-    ASSERT_EQ(f, *output_ptr++);
+    EXPECT_EQ(f, *output_ptr++);
   }
 }
 
@@ -93,10 +93,10 @@ TEST_F(ConcatOpTest, CPUSimpleVertical) {
   const float *output_ptr = output->data<float>();
   for (int i = 0; i < 4; ++i) {
     for (int j = 0; j < 4; ++j) {
-      ASSERT_EQ(input0[i * 4 + j], *output_ptr++);
+      EXPECT_EQ(input0[i * 4 + j], *output_ptr++);
     }
     for (int j = 0; j < 4; ++j) {
-      ASSERT_EQ(input1[i * 4 + j], *output_ptr++);
+      EXPECT_EQ(input1[i * 4 + j], *output_ptr++);
     }
   }
 }
diff --git a/mace/ops/fill.h b/mace/ops/fill.h
index 3e2c6df7d27835081349885c18cbccba75e07ddb..a8b55dbe8984f2d6f87e39e1d39373e9ad909b58 100644
--- a/mace/ops/fill.h
+++ b/mace/ops/fill.h
@@ -28,18 +28,19 @@ class FillOp : public Operator<D, T> {
  public:
   FillOp(const OperatorDef &operator_def, Workspace *ws)
       : Operator<D, T>(operator_def, ws),
-        functor_(OperatorBase::GetOptionalArg<float>("value", 0.0f)) {}
+        functor_() {}
 
   MaceStatus Run(StatsFuture *future) override {
     const Tensor *shape = this->Input(SHAPE);
+    const Tensor *value = this->Input(VALUE);
     Tensor *output = this->Output(OUTPUT);
-    return functor_(shape, output, future);
+    return functor_(shape, value, output, future);
   }
 
  private:
   kernels::FillFunctor<D, T> functor_;
 
-  MACE_OP_INPUT_TAGS(SHAPE);
+  MACE_OP_INPUT_TAGS(SHAPE, VALUE);
   MACE_OP_OUTPUT_TAGS(OUTPUT);
 };
 
diff --git a/mace/ops/fill_test.cc b/mace/ops/fill_test.cc
index bc3a33638f34cccd83bdce0bcc51e034a5284328..1808b0b52bbbe2ab9ac46246b63a83477292895e 100644
--- a/mace/ops/fill_test.cc
+++ b/mace/ops/fill_test.cc
@@ -28,7 +28,7 @@ void TestFill(const std::vector<int32_t> &shape,
   OpsTestNet net;
   OpDefBuilder("Fill", "FillTest")
       .Input("Shape")
-      .AddFloatArg("value", static_cast<float>(value))
+      .Input("Value")
       .Output("Output")
       .Finalize(net.NewOperatorDef());
 
@@ -38,19 +38,21 @@ void TestFill(const std::vector<int32_t> &shape,
       {static_cast<index_t>(shape.size())},
       shape);
 
+  net.AddInputFromArray<DeviceType::CPU, float>("Value", {}, {value});
+
   // Run
   net.RunOp();
 
   auto output = net.GetTensor("Output");
 
   for (index_t i = 0; i < output->dim_size(); ++i) {
-    ASSERT_EQ(output->dim(i), shape[i]);
+    EXPECT_EQ(output->dim(i), shape[i]);
   }
 
   const float *output_ptr = output->data<float>();
   const index_t size = output->size();
   for (index_t i = 0; i < size; ++i) {
-    ASSERT_EQ(output_ptr[i], value);
+    EXPECT_EQ(output_ptr[i], value);
   }
 }
 }  // namespace
diff --git a/mace/ops/identity_test.cc b/mace/ops/identity_test.cc
index 26d835ce4d2260eb3f5aa95d57ab79f86523e357..988ce760c56d96a79f14520a857ce300e4869b00 100644
--- a/mace/ops/identity_test.cc
+++ b/mace/ops/identity_test.cc
@@ -46,7 +46,7 @@ void TestIdentity(const std::vector<index_t> &shape) {
   const float *output_ptr = output->data<float>();
   const int size = output->size();
   for (int i = 0; i < size; ++i) {
-    ASSERT_EQ(input_ptr[i], output_ptr[i]);
+    EXPECT_EQ(input_ptr[i], output_ptr[i]);
   }
 }
 }  // namespace
diff --git a/mace/ops/reshape.h b/mace/ops/reshape.h
index 90a443144bb87d32f8d99d722ef75554195772a8..c47e6cb1791e2fbd3e1fa1aa0506d9189f6dd0f1 100644
--- a/mace/ops/reshape.h
+++ b/mace/ops/reshape.h
@@ -42,12 +42,12 @@ class ReshapeOp : public Operator<D, T> {
 
     for (int i = 0; i < num_dims; ++i) {
       if (shape_data[i] == -1) {
-        MACE_CHECK(unknown_idx == -1) << "Only one input size may be -1";
+        MACE_CHECK(unknown_idx == -1, "Only one input size may be -1");
         unknown_idx = i;
         out_shape.push_back(1);
       } else {
-        MACE_CHECK(shape_data[i] >= 0) << "Shape must be non-negative: "
-                                   << shape_data[i];
+        MACE_CHECK(shape_data[i] >= 0, "Shape must be non-negative: ",
+                   shape_data[i]);
         out_shape.push_back(shape_data[i]);
         product *= shape_data[i];
       }
diff --git a/mace/ops/reshape_test.cc b/mace/ops/reshape_test.cc
index 91c0f82b7ae24c7da41ca5e504fa3aace600f29f..947e968b9dac4d7f163a635a56da14b619f883ce 100644
--- a/mace/ops/reshape_test.cc
+++ b/mace/ops/reshape_test.cc
@@ -53,7 +53,7 @@ void TestReshape(const std::vector<index_t> &org_shape,
   const float *output_ptr = output->data<float>();
   const int size = output->size();
   for (int i = 0; i < size; ++i) {
-    ASSERT_EQ(input_ptr[i], output_ptr[i]);
+    EXPECT_EQ(input_ptr[i], output_ptr[i]);
   }
 }
 }  // namespace
diff --git a/mace/ops/squeeze_test.cc b/mace/ops/squeeze_test.cc
index 35f224c9a901dab81de1469c9218a0bb3b7debd8..fba5a37d245ea1c878753a96d39c2bf820af071e 100644
--- a/mace/ops/squeeze_test.cc
+++ b/mace/ops/squeeze_test.cc
@@ -49,7 +49,7 @@ void TestSqueeze(const std::vector<index_t> &org_shape,
   const float *output_ptr = output->data<float>();
   const int size = output->size();
   for (int i = 0; i < size; ++i) {
-    ASSERT_EQ(input_ptr[i], output_ptr[i]);
+    EXPECT_EQ(input_ptr[i], output_ptr[i]);
   }
 }
 }  // namespace
diff --git a/mace/python/tools/converter_tool/tensorflow_converter.py b/mace/python/tools/converter_tool/tensorflow_converter.py
index be4678ed8768663f572d379cac9841bb36aadbdd..9583d0e163be75b3a0e92afdfcb5a994bc59c5a6 100644
--- a/mace/python/tools/converter_tool/tensorflow_converter.py
+++ b/mace/python/tools/converter_tool/tensorflow_converter.py
@@ -464,10 +464,6 @@ class TensorflowConverter(base_converter.ConverterInterface):
         op = self.convert_general_op(tf_op)
         op.type = MaceOp.Fill.name
 
-        value_arg = op.arg.add()
-        value_arg.name = MaceKeyword.mace_value_str
-        value_arg.f = tf_op.inputs[1].eval()
-
     def convert_fused_batchnorm(self, tf_op):
         op = self.convert_general_op(tf_op)
         op.type = MaceOp.FoldedBatchNorm.name
diff --git a/mace/test/mace_api_mt_test.cc b/mace/test/mace_api_mt_test.cc
index 27c601fe8410d57adef4a0179d70f14e8d8ade4e..e2a09fec8d3991fd8dad65b8427ae61ea35b8c3a 100644
--- a/mace/test/mace_api_mt_test.cc
+++ b/mace/test/mace_api_mt_test.cc
@@ -342,7 +342,7 @@ void MaceRunFunc(const int in_out_size) {
   MaceEngine engine(device);
   MaceStatus status = engine.Init(net_def.get(), input_names, output_names,
       reinterpret_cast<unsigned char *>(data.data()));
-  ASSERT_EQ(status, MaceStatus::MACE_SUCCESS);
+  EXPECT_EQ(status, MaceStatus::MACE_SUCCESS);
 
   std::map<std::string, mace::MaceTensor> inputs;
   std::map<std::string, mace::MaceTensor> outputs;
diff --git a/mace/test/mace_api_test.cc b/mace/test/mace_api_test.cc
index 46bd9fe1f9306325f3b82a35ab877c89e7af7162..6b1f353eb8f7a3d77e59b84f23fcf3141bfef148 100644
--- a/mace/test/mace_api_test.cc
+++ b/mace/test/mace_api_test.cc
@@ -336,7 +336,7 @@ void MaceRun(const int in_out_size,
   MaceEngine engine(device);
   MaceStatus status = engine.Init(net_def.get(), input_names, output_names,
       reinterpret_cast<unsigned char *>(data.data()));
-  ASSERT_EQ(status, MaceStatus::MACE_SUCCESS);
+  EXPECT_EQ(status, MaceStatus::MACE_SUCCESS);
 
   std::map<std::string, mace::MaceTensor> inputs;
   std::map<std::string, mace::MaceTensor> outputs;