diff --git a/tutorials/article-implementation/initializer.md b/tutorials/article-implementation/initializer.md
new file mode 100644
index 0000000000000000000000000000000000000000..422df8dff3a70aa1b10ae7570489ee769d3b1827
--- /dev/null
+++ b/tutorials/article-implementation/initializer.md
@@ -0,0 +1,248 @@
+
+# æ¨¡åž‹å‚æ•°åˆå§‹åŒ–å¯¹é½æ–¹æ³•
+
+# 1. èƒŒæ™¯
+
+Paddleæä¾›äº†å¤§é‡çš„åˆå§‹åŒ–æ–¹æ³•ï¼ŒåŒ…æ‹¬`Constant`, `KaimingUniform`, `KaimingNormal`,  `TruncatedNormal`,  `Uniform`,  `XavierNormal`, `XavierUniform`ç‰ï¼Œåˆé€‚çš„åˆå§‹åŒ–æ–¹æ³•èƒ½å¤Ÿå¸®åŠ©æ¨¡åž‹å¿«é€Ÿåœ°æ”¶æ•›æˆ–è€…è¾¾åˆ°æ›´é«˜çš„ç²¾åº¦ã€‚
+
+è®ºæ–‡å¤çŽ°çš„è¿‡ç¨‹ä¸ï¼Œåœ¨è®ç»ƒå¯¹é½çŽ¯èŠ‚ï¼Œéœ€è¦ä¿è¯Paddleçš„å¤çŽ°ä»£ç å’Œå‚è€ƒä»£ç ä¿æŒä¸€è‡´ï¼Œä»Žè€Œå®žçŽ°å®Œå…¨å¯¹é½ã€‚ç„¶è€Œç”±äºŽä¸åŒæ¡†æž¶çš„å·®å¼‚æ€§ï¼Œéƒ¨åˆ†APIä¸å‚æ•°æä¾›çš„é»˜è®¤åˆå§‹åŒ–æ–¹æ³•æœ‰åŒºåˆ«ï¼Œè¯¥æ–‡æ¡£ä»¥`nn.Conv2D`ä»¥åŠ`nn.Linear`è¿™ä¸¤ä¸ªæœ€å¸¸ç”¨çš„APIä¸ºä¾‹ï¼Œä»‹ç»æ€Žæ ·å®žçŽ°å¯¹é½ã€‚
+
+**æ›´å¤šå‚è€ƒé“¾æŽ¥ï¼š**
+
+* Paddleåˆå§‹åŒ–ç›¸å…³APIé“¾æŽ¥ï¼š[åˆå§‹åŒ–APIå®˜ç½‘æ–‡æ¡£](https://www.paddlepaddle.org.cn/documentation/docs/zh/api/paddle/nn/Overview_cn.html#chushihuaxiangguan)
+* Paddleæä¾›çš„åˆå§‹åŒ–æ–¹å¼ä¸ºç›´æŽ¥ä¿®æ”¹APIçš„`ParamAttr`ï¼Œä¸Ž`torch.nn.init`ç‰ç³»åˆ—APIçš„ä½¿ç”¨æ–¹å¼ä¸åŒï¼ŒPaddleDetectionä¸å®žçŽ°äº†ä¸Ž`torch.nn.init`ç³»åˆ—APIå®Œå…¨å¯¹é½çš„åˆå§‹åŒ–APIï¼ŒåŒ…æ‹¬`uniform_`, `normal_`, `constant_`, `ones_`, `zeros_`, `xavier_uniform_`, `xavier_normal_`, `kaiming_uniform_`, `kaiming_normal_`, `linear_init_`, `conv_init_`ï¼Œå¯ä»¥å‚è€ƒ[initializer.py](https://github.com/PaddlePaddle/PaddleDetection/blob/develop/ppdet/modeling/initializer.py)ï¼ŒæŸ¥çœ‹æ›´å¤šçš„å®žçŽ°ç»†èŠ‚ã€‚
+
+
+# 2. ä¸åŒæ¡†æž¶çš„åˆå§‹åŒ–å·®å¼‚
+
+## 2.1 é»˜è®¤åˆå§‹åŒ–çš„å¯¹é½æ–¹æ³•
+
+åœ¨æ¤æƒ…å†µä¸‹ï¼Œä¸€èˆ¬éœ€è¦æŸ¥çœ‹æ–‡æ¡£ï¼Œäº†è§£å‚è€ƒä»£ç çš„åˆå§‹åŒ–æ–¹æ³•ï¼Œä»Žè€Œé€šè¿‡ä¿®æ”¹åˆå§‹åŒ–æ–¹æ³•ï¼Œå®žçŽ°åˆå§‹åŒ–çš„å¯¹é½ã€‚
+
+ä¸‹é¢ä»¥`nn.Conv2D` APIä¸ºä¾‹è¿›è¡Œè¯´æ˜Žã€‚
+
+* **Step1ï¼š** åŸºäºŽPaddleä¸Žtorchï¼Œå®šä¹‰2ä¸ªå·ç§¯æ“ä½œï¼Œç»˜åˆ¶å…¶weightå‚æ•°çš„ç›´æ–¹å›¾ï¼Œå¦‚ä¸‹æ‰€ç¤ºã€‚
+
+```python
+import paddle
+import torch
+import numpy as np
+import matplotlib.pyplot as plt
+%matplotlib inline
+
+conv2d_pd = paddle.nn.Conv2D(4096, 512, 3)
+conv2d_pt = torch.nn.Conv2d(4096, 512, 3)
+
+conv2d_pd_weight = conv2d_pd.weight.numpy().reshape((-1, ))
+conv2d_pt_weight = conv2d_pt.weight.detach().numpy().reshape((-1, ))
+plt.figure(figsize=(10, 6))
+temp = plt.hist([conv2d_pd_weight, conv2d_pt_weight], bins=100, rwidth=0.8, histtype="step")
+plt.xlabel("value")
+plt.ylabel("count")
+plt.legend({"paddle.nn.Conv2D weight", "torch.nn.Conv2d weight"})
+```
+
+<div align="center">
+<img src="https://paddle-model-ecology.bj.bcebos.com/images/initializer/conv2d_weight_default_diff.jpeg"  width = "600" />
+</div>
+
+ç»“åˆ[paddleæ–‡æ¡£](https://www.paddlepaddle.org.cn/documentation/docs/zh/api/paddle/ParamAttr_cn.html#paramattr)å’Œ[torchæ–‡æ¡£](https://pytorch.org/docs/stable/generated/torch.nn.Conv2d.html?highlight=conv2d#torch.nn.Conv2d)å¯çŸ¥ï¼Œpaddleçš„åˆå§‹åŒ–æ˜¯`XavierNormal`ï¼Œtorchçš„åˆå§‹åŒ–æ˜¯`uniform`ï¼Œåˆå§‹åŒ–æ–¹æ³•è¾¹ç•Œå€¼æ˜¯`(-sqrt(groups/(in_channels*prod(*kernal_size))), sqrt(groups/(in_channels*prod(*kernal_size))))`ã€‚
+
+
+* **Step2ï¼š** ç”±ä¸Šè¿°åˆ†æžï¼ŒåŸºäºŽ`paddle.nn.initializer.Uniform` APIï¼Œè‡ªå®šä¹‰Paddleä¸Conv2Dçš„åˆå§‹åŒ–ï¼Œä»£ç å¦‚ä¸‹æ‰€ç¤ºï¼š
+
+```python
+import paddle
+import torch
+import numpy as np
+import matplotlib.pyplot as plt
+import paddle.nn.initializer as init
+%matplotlib inline
+# è¯¥ä¾‹åä¸ï¼Œå¯¹åº”ä¸Šè¿°å…¬å¼çš„group=1ï¼Œin_channels=4096ï¼Œkernal_size=3,ç”±äºŽäºŒç»´å·ç§¯çš„å·ç§¯æ ¸æ˜¯äºŒç»´çš„ï¼Œæ‰€ä»¥æ¤å¤„çš„ç»“æžœä¸º4096*3*3
+conv2d_pd = paddle.nn.Conv2D(4096, 512, 3,
+            init.Uniform(-1/math.sqrt(4096*3*3), 1/math.sqrt(4096*3*3)))
+conv2d_pt = torch.nn.Conv2d(4096, 512, 3)
+
+conv2d_pd_weight = conv2d_pd.weight.numpy().reshape((-1, ))
+conv2d_pt_weight = conv2d_pt.weight.detach().numpy().reshape((-1, ))
+plt.figure(figsize=(10, 6))
+temp = plt.hist([conv2d_pd_weight, conv2d_pt_weight], bins=100, rwidth=0.8, histtype="step")
+plt.xlabel("value")
+plt.ylabel("count")
+plt.legend({"paddle.nn.Conv2D weight", "torch.nn.Conv2d weight"})
+```
+
+<div align="center">
+<img src="https://paddle-model-ecology.bj.bcebos.com/images/initializer/conv2d_weight_fixed_diff.jpeg"  width = "600" />
+</div>
+
+ä»Žå›¾ä¸å¯çŸ¥ï¼ŒäºŒè€…çš„åˆå§‹åŒ–å‚æ•°åˆ†å¸ƒå®žçŽ°ä¸€è‡´ã€‚
+
+
+## 2.2 è‡ªå®šä¹‰åˆå§‹åŒ–çš„å¯¹é½æ–¹æ³•
+
+
+éƒ¨åˆ†å‚è€ƒä»£ç ä¸ï¼Œåˆå§‹åŒ–çš„æ–¹æ³•æ˜¯é€šè¿‡ä½¿ç”¨`torch.nn.init`ç³»åˆ—APIå®žçŽ°ï¼Œå¯ä»¥è®¤ä¸ºæ˜¯è‡ªå®šä¹‰åˆå§‹åŒ–ã€‚ä¾‹å¦‚ï¼š[resnet](https://github.com/pytorch/vision/blob/ec1c2a12cf00c6df83c7fb88f75b8117cda2f970/torchvision/models/resnet.py#L208)ä¸ä½¿ç”¨çš„`kaiming_normal_`ä¼ å…¥äº†`mode`å’Œ`nonlinearity`ä¸¤ä¸ªå‚æ•°ï¼š
+
+```python
+if isinstance(m, nn.Conv2d):
+    nn.init.kaiming_normal_(m.weight, mode="fan_out", nonlinearity="relu")
+```
+
+åœ¨è¿™ç±»é—®é¢˜ä¸ï¼Œå¯ä»¥å…ˆå°è¯•ä½¿ç”¨`2.1`ç« èŠ‚ä¸çš„`Step1`ï¼ŒæŸ¥çœ‹ä½¿ç”¨PaddleåŒååˆå§‹åŒ–æ–¹å¼çš„é»˜è®¤å‚æ•°æ˜¯å¦èƒ½å¤Ÿå¯¹é½ã€‚å¦‚æžœæ— æ³•å¯¹é½ï¼Œå¯ä»¥æŸ¥é˜…[initializer.py](https://github.com/PaddlePaddle/PaddleDetection/blob/develop/ppdet/modeling/initializer.py)ï¼Œä½¿ç”¨è¯¥æ–‡ä»¶ä¸çš„åˆå§‹åŒ–å‡½æ•°ï¼Œå®žçŽ°å¯¹é½ã€‚
+
+ä¸åŒæ¡†æž¶çš„åˆå§‹åŒ–æ–¹æ³•æœ‰æ‰€ä¸åŒï¼Œå¼€å‘è€…è®ºæ–‡å¤çŽ°è¿‡ç¨‹ä¸éš¾ä»¥æŽ’æŸ¥ï¼Œå› æ¤ä¸‹é¢ç¬¬3ç« ä»‹ç»é€šè¿‡è‡ªå®šä¹‰åˆå§‹åŒ–çš„æ–¹å¼ï¼Œå®žçŽ°ä¸åŒæ¡†æž¶çš„å‚æ•°åˆå§‹åŒ–åˆ†å¸ƒä¸€è‡´ï¼Œæœ€ç»ˆå¸®åŠ©å¤§å®¶æ›´åŠ é¡ºåˆ©åœ°å®Œæˆè®ºæ–‡å¤çŽ°ã€‚
+
+**æ³¨æ„ï¼š** BatchNorm2Dç‰å¤§å¤šæ•°çš„APIä¸ï¼Œå¯å¦ä¹ å‚æ•°çš„åˆå§‹åŒ–åˆ†å¸ƒç›¸åŒï¼Œåœ¨æ¤ä¸ºè¿›ä¸€æ¥å¯¹æ¯”ï¼Œä¹Ÿç»™å‡ºå…¶æƒé‡çš„å¯è§†åŒ–å¯¹æ¯”å›¾åƒã€‚
+
+# 3. åˆå§‹åŒ–å‚æ•°åˆ†å¸ƒå¯¹æ¯”
+
+## 3.1 é»˜è®¤åˆå§‹åŒ–ä¸åŒçš„APIæƒé‡ç›´æ–¹å›¾å¯¹æ¯”
+
+| Paddle API | torch API  | é»˜è®¤åˆå§‹åŒ–æ–¹æ³•çš„å‚æ•°åˆ†å¸ƒå¯¹æ¯”å›¾ | ä¿®æ”¹åˆå§‹åŒ–å‚æ•°æ–¹æ³• | ä¿®æ”¹ä¹‹åŽçš„å‚æ•°åˆ†å¸ƒå¯¹æ¯” |
+|:---------:|:------------------:|:------------:|:------------:|:------------:|
+| `paddle.nn.Conv2D` weightå‚æ•° | `torch.nn.Conv2d` weightå‚æ•° | ![](https://paddle-model-ecology.bj.bcebos.com/images/initializer/conv2d_weight_default_diff.jpeg) | è§é™„å½•`4.1`  | ![](https://paddle-model-ecology.bj.bcebos.com/images/initializer/conv2d_weight_fixed_diff.jpeg) |
+| `paddle.nn.Conv2D` biaså‚æ•° | `torch.nn.Conv2d` biaså‚æ•° | ![](https://paddle-model-ecology.bj.bcebos.com/images/initializer/conv2d_bias_default_diff.jpeg) | è§é™„å½•`4.1`  | ![](https://paddle-model-ecology.bj.bcebos.com/images/initializer/conv2d_bias_fixed_diff.jpeg) |
+| `paddle.nn.Linear` weightå‚æ•° | `torch.nn.Linear` weightå‚æ•° | ![](https://paddle-model-ecology.bj.bcebos.com/images/initializer/linear_weight_default_diff.jpeg) | è§é™„å½•`4.2`  | ![](https://paddle-model-ecology.bj.bcebos.com/images/initializer/linear_weight_fixed_diff.jpeg) |
+| `paddle.nn.Linear` biaså‚æ•° | `torch.nn.Linear` biaså‚æ•° | ![](https://paddle-model-ecology.bj.bcebos.com/images/initializer/linear_bias_default_diff.jpeg) | è§é™„å½•`4.2`  | ![](https://paddle-model-ecology.bj.bcebos.com/images/initializer/linear_bias_fixed_diff.jpeg) |
+
+
+
+## 3.2 é»˜è®¤åˆå§‹åŒ–ç›¸åŒçš„APIæƒé‡ç›´æ–¹å›¾å¯¹æ¯”
+
+| Paddle API | torch API  | é»˜è®¤åˆå§‹åŒ–æ–¹æ³•çš„å‚æ•°åˆ†å¸ƒå¯¹æ¯”å›¾ |
+|:---------:|:------------------:|:------------:|
+| `paddle.nn.BatchNorm2D` weightå‚æ•° | `torch.nn.BatchNorm2d` weightå‚æ•° | ![](https://paddle-model-ecology.bj.bcebos.com/images/initializer/bn_weight_default_diff.jpeg) |
+| `paddle.nn.BatchNorm2D` biaså‚æ•° | `torch.nn.BatchNorm2d` biaså‚æ•° | ![](https://paddle-model-ecology.bj.bcebos.com/images/initializer/bn_bias_default_diff.jpeg) |
+
+# 4. é™„å½•
+
+## 4.1 åˆå§‹åŒ–å¯¹é½ä»£ç 
+
+### 4.1.1 paddle.nn.Conv2D
+
+* é»˜è®¤åˆå§‹åŒ–ä»¥åŠå¯è§†åŒ–ä»£ç 
+
+```python
+import paddle
+import torch
+import numpy as np
+import matplotlib.pyplot as plt
+%matplotlib inline
+
+conv2d_pd = paddle.nn.Conv2D(4096, 512, 3)
+conv2d_pt = torch.nn.Conv2d(4096, 512, 3)
+
+conv2d_pd_weight = conv2d_pd.weight.numpy().reshape((-1, ))
+conv2d_pd_bias = conv2d_pd.bias.numpy().reshape((-1, ))
+conv2d_pt_weight = conv2d_pt.weight.detach().numpy().reshape((-1, ))
+conv2d_pt_bias = conv2d_pd.bias.numpy().reshape((-1, ))
+plt.figure(figsize=(10, 6))
+temp = plt.hist([conv2d_pd_weight, conv2d_pt_weight], bins=100, rwidth=0.8, histtype="step")
+plt.xlabel("value")
+plt.ylabel("count")
+plt.legend({"paddle.nn.Conv2D weight", "torch.nn.Conv2d weight"})
+
+plt.figure(figsize=(10, 6))
+temp = plt.hist([conv2d_pd_bias, conv2d_pt_bias], bins=50, rwidth=0.8, histtype="step")
+plt.xlabel("value")
+plt.ylabel("count")
+plt.legend({"paddle.nn.Conv2D bias", "torch.nn.Conv2d bias"})
+```
+
+
+
+* ä¿®æ£åŽåˆå§‹åŒ–ä»¥åŠå¯è§†åŒ–ä»£ç 
+
+```python
+import paddle
+import torch
+import numpy as np
+import matplotlib.pyplot as plt
+import paddle.nn.initializer as init
+%matplotlib inline
+
+conv2d_pd = paddle.nn.Conv2D(4096, 512, 3,
+            weight_attr=init.Uniform(-1/math.sqrt(4096*3*3), 1/math.sqrt(4096*3*3)),
+            bias_attr=init.Uniform(-1/math.sqrt(4096*3*3), 1/math.sqrt(4096*3*3)))
+conv2d_pt = torch.nn.Conv2d(4096, 512, 3)
+
+conv2d_pd_weight = conv2d_pd.weight.numpy().reshape((-1, ))
+conv2d_pd_bias = conv2d_pd.bias.numpy().reshape((-1, ))
+conv2d_pt_weight = conv2d_pt.weight.detach().numpy().reshape((-1, ))
+conv2d_pt_bias = conv2d_pd.bias.numpy().reshape((-1, ))
+plt.figure(figsize=(10, 6))
+temp = plt.hist([conv2d_pd_weight, conv2d_pt_weight], bins=100, rwidth=0.8, histtype="step")
+plt.xlabel("value")
+plt.ylabel("count")
+plt.legend({"paddle.nn.Conv2D weight", "torch.nn.Conv2d weight"})
+
+plt.figure(figsize=(10, 6))
+temp = plt.hist([conv2d_pd_bias, conv2d_pt_bias], bins=50, rwidth=0.8, histtype="step")
+plt.xlabel("value")
+plt.ylabel("count")
+plt.legend({"paddle.nn.Conv2D bias", "torch.nn.Conv2d bias"})
+```
+
+
+### 4.1.2 paddle.nn.Linear
+
+* é»˜è®¤åˆå§‹åŒ–ä»¥åŠå¯è§†åŒ–ä»£ç 
+
+```python
+import paddle
+import torch
+import numpy as np
+import matplotlib.pyplot as plt
+%matplotlib inline
+
+linear_pd = paddle.nn.Linear(4096, 512)
+linear_pt = torch.nn.Linear(4096, 512)
+
+linear_pd_weight = linear_pd.weight.numpy().reshape((-1, ))
+linear_pd_bias = linear_pd.bias.numpy().reshape((-1, ))
+linear_pt_weight = linear_pt.weight.detach().numpy().reshape((-1, ))
+linear_pt_bias = linear_pt.bias.numpy().reshape((-1, ))
+plt.figure(figsize=(10, 6))
+temp = plt.hist([linear_pd_weight, linear_pt_weight], bins=100, rwidth=0.8, histtype="step")
+plt.xlabel("value")
+plt.ylabel("count")
+plt.legend({"paddle.nn.Linear weight", "torch.nn.Linear weight"})
+
+plt.figure(figsize=(10, 6))
+temp = plt.hist([linear_pd_bias, linear_pt_bias], bins=50, rwidth=0.8, histtype="step")
+plt.xlabel("value")
+plt.ylabel("count")
+plt.legend({"paddle.nn.Linear bias", "torch.nn.Linear bias"})
+```
+
+* ä¿®æ£åŽåˆå§‹åŒ–ä»¥åŠå¯è§†åŒ–ä»£ç 
+
+```python
+import paddle
+import torch
+import numpy as np
+import matplotlib.pyplot as plt
+%matplotlib inline
+# linearçš„åˆå§‹åŒ–æ–¹æ³•åŒæ ·é€‚ç”¨äºŽ2.1èŠ‚ä¸çš„å…¬å¼ï¼Œæ¤å¤„çš„kernal_sizeç‰ä»·äºŽ1ã€‚
+linear_pd = paddle.nn.Linear(4096, 512,
+            weight_attr=init.Uniform(-1/math.sqrt(4096), 1/math.sqrt(4096)),
+            bias_attr=init.Uniform(-1/math.sqrt(4096), 1/math.sqrt(4096)))
+linear_pt = torch.nn.Linear(4096, 512)
+
+linear_pd_weight = linear_pd.weight.numpy().reshape((-1, ))
+linear_pd_bias = linear_pd.bias.numpy().reshape((-1, ))
+linear_pt_weight = linear_pt.weight.detach().numpy().reshape((-1, ))
+linear_pt_bias = linear_pt.bias.numpy().reshape((-1, ))
+plt.figure(figsize=(10, 6))
+temp = plt.hist([linear_pd_weight, linear_pt_weight], bins=100, rwidth=0.8, histtype="step")
+plt.xlabel("value")
+plt.ylabel("count")
+plt.legend({"paddle.nn.Linear weight", "torch.nn.Linear weight"})
+
+plt.figure(figsize=(10, 6))
+temp = plt.hist([linear_pd_bias, linear_pt_bias], bins=50, rwidth=0.8, histtype="step")
+plt.xlabel("value")
+plt.ylabel("count")
+plt.legend({"paddle.nn.Linear bias", "torch.nn.Linear bias"})
+```