From cfd13bc3f217787fd7fd1ecdcd980efec5d0103d Mon Sep 17 00:00:00 2001
From: SunAhong1993 <48579383+SunAhong1993@users.noreply.github.com>
Date: Wed, 10 Apr 2019 20:23:42 +0800
Subject: [PATCH] Update SofmaxWithLoss.md

---
 caffe2fluid/doc/SofmaxWithLoss.md | 8 +++++++-
 1 file changed, 7 insertions(+), 1 deletion(-)

diff --git a/caffe2fluid/doc/SofmaxWithLoss.md b/caffe2fluid/doc/SofmaxWithLoss.md
index e00af97..750f4a2 100644
--- a/caffe2fluid/doc/SofmaxWithLoss.md
+++ b/caffe2fluid/doc/SofmaxWithLoss.md
@@ -9,6 +9,9 @@ layer {
     bottom: "logits"
     bottom: "label"
     top: "loss"
+    softmax_param {
+        axis: 1
+    }
     loss_param {
 	ignore_label: -1
 	normalize: 0
@@ -31,8 +34,11 @@ paddle.fluid.layers.softmax_with_cross_entropy(
 ```  
 
 ### 功能差异
+#### 输入数据
+Caffe：输入数据（`x`）的维度最大是4维(`N*C*H*W`)；                 
+PaddlePaddle：输入数据(`x`和`label`)的维度只能是2维（`N*K`）。
 #### 输入格式
-Caffe: 采用硬标签方式输入，同时进行预处理操作；  
+Caffe: 采用硬标签方式输入，同时进行预处理操作(为了避免上溢出和下溢出，对输入的每个值减去batch中该位置上的最大值)。  
 PaddlePaddle：通过参数`soft_label`的设定，支持硬标签和软标签两种输入。  
 > 计算softmax的loss时，根据每个样本是否被分配至多个类别中可以分为两类——硬标签和软标签  
 > **硬标签：** 即one-hot label，每个样本仅分到一个类别中。在硬标签中，根据是否对未初始化的log概率进行预处理，又可以分为两类，预处理主要是完成对每个样本中的每个log概率减去该样本中的最大的log概率  
-- 
GitLab