未验证 提交 a7554d2b 编写于 作者: A Aurelius84 提交者: GitHub

add Categorical and MultivariateNormalDiag doc (#1517) (#1536)

上级 0fd78ab1
...@@ -42,6 +42,7 @@ fluid.layers ...@@ -42,6 +42,7 @@ fluid.layers
layers_cn/brelu_cn.rst layers_cn/brelu_cn.rst
layers_cn/BeamSearchDecoder_cn.rst layers_cn/BeamSearchDecoder_cn.rst
layers_cn/cast_cn.rst layers_cn/cast_cn.rst
layers_cn/Categorical_cn.rst
layers_cn/ceil_cn.rst layers_cn/ceil_cn.rst
layers_cn/center_loss_cn.rst layers_cn/center_loss_cn.rst
layers_cn/chunk_eval_cn.rst layers_cn/chunk_eval_cn.rst
...@@ -176,6 +177,7 @@ fluid.layers ...@@ -176,6 +177,7 @@ fluid.layers
layers_cn/multi_box_head_cn.rst layers_cn/multi_box_head_cn.rst
layers_cn/multiclass_nms_cn.rst layers_cn/multiclass_nms_cn.rst
layers_cn/multiplex_cn.rst layers_cn/multiplex_cn.rst
layers_cn/MultivariateNormalDiag_cn.rst
layers_cn/natural_exp_decay_cn.rst layers_cn/natural_exp_decay_cn.rst
layers_cn/nce_cn.rst layers_cn/nce_cn.rst
layers_cn/noam_decay_cn.rst layers_cn/noam_decay_cn.rst
......
.. _cn_api_fluid_layers_Categorical:
Categorical
-------------------------------
.. py:class:: paddle.fluid.layers.Categorical(logits)
类别分布是一种离散概率分布,其随机变量可以取K个相互独立类别的其中一个。
概率质量函数(pmf)为:
.. math::
pmf(k; p_i) =\prod_{i=1}^{k} p_i^{[x=i]}
上面公式中:
- :math:`[x = i]` 表示:如果 :math:`x==i` ,则表达式取值为1,否则取值为0。
参数:
- **logits** (list|numpy.ndarray|Variable) - 类别分布对应的logits。数据类型为float32。
**代码示例**:
.. code-block:: python
import numpy as np
from paddle.fluid import layers
from paddle.fluid.layers import Categorical
a_logits_npdata = np.array([-0.602,-0.602], dtype="float32")
a_logits_tensor = layers.create_tensor(dtype="float32")
layers.assign(a_logits_npdata, a_logits_tensor)
b_logits_npdata = np.array([-0.102,-0.112], dtype="float32")
b_logits_tensor = layers.create_tensor(dtype="float32")
layers.assign(b_logits_npdata, b_logits_tensor)
a = Categorical(a_logits_tensor)
b = Categorical(b_logits_tensor)
a.entropy()
# [0.6931472] with shape: [1]
b.entropy()
# [0.6931347] with shape: [1]
a.kl_divergence(b)
# [1.2516975e-05] with shape: [1]
.. py:function:: kl_divergence(other)
相对于另一个类别分布的KL散度
参数:
- **other** (Categorical) - 输入的另一个类别分布。数据类型为float32。
返回:相对于另一个类别分布的KL散度, 数据类型为float32
返回类型:Variable
.. py:function:: entropy()
信息熵
返回:类别分布的信息熵, 数据类型为float32
返回类型:Variable
.. _cn_api_fluid_layers_MultivariateNormalDiag:
MultivariateNormalDiag
-------------------------------
.. py:class:: paddle.fluid.layers.MultivariateNormalDiag(loc, scale)
多元高斯分布
概率密度函数(pdf)为:
.. math::
pdf(x; loc, scale) = \frac{e^{-\frac{||y||^2}{2}}}{Z}
y = inv(scale) @ (x - loc)
Z = (2\pi )^{0.5k} |det(scale)|
上面公式中:
- :math:`inv` 表示: 对矩阵求逆
- :math:`@` 表示:矩阵相乘
- :math:`det` 表示:求行列式的值
参数:
- **loc** (list|numpy.ndarray|Variable) - 形状为 :math:`[k]` 的多元高斯分布的均值列表。数据类型为float32。
- **scale** (list|numpy.ndarray|Variable) - 形状为 :math:`[k, k]` 的多元高斯分布的对角协方差矩阵,且除对角元素外,其他元素取值均为0。数据类型为float32。
**代码示例**:
.. code-block:: python
import numpy as np
from paddle.fluid import layers
from paddle.fluid.layers import MultivariateNormalDiag
a_loc_npdata = np.array([0.3,0.5],dtype="float32")
a_loc_tensor = layers.create_tensor(dtype="float32")
layers.assign(a_loc_npdata, a_loc_tensor)
a_scale_npdata = np.array([[0.4,0],[0,0.5]],dtype="float32")
a_scale_tensor = layers.create_tensor(dtype="float32")
layers.assign(a_scale_npdata, a_scale_tensor)
b_loc_npdata = np.array([0.2,0.4],dtype="float32")
b_loc_tensor = layers.create_tensor(dtype="float32")
layers.assign(b_loc_npdata, b_loc_tensor)
b_scale_npdata = np.array([[0.3,0],[0,0.4]],dtype="float32")
b_scale_tensor = layers.create_tensor(dtype="float32")
layers.assign(b_scale_npdata, b_scale_tensor)
a = MultivariateNormalDiag(a_loc_tensor, a_scale_tensor)
b = MultivariateNormalDiag(b_loc_tensor, b_scale_tensor)
a.entropy()
# [2.033158] with shape: [1]
b.entropy()
# [1.7777451] with shaoe: [1]
a.kl_divergence(b)
# [0.06542051] with shape: [1]
.. py:function:: kl_divergence(other)
计算相对于另一个多元高斯分布的KL散度
参数:
- **other** (MultivariateNormalDiag) - 输入的另一个多元高斯分布。数据类型为float32。
返回:相对于另一个多元高斯分布的KL散度,数据类型为float32
返回类型:Variable
.. py:function:: entropy()
信息熵
返回:多元高斯分布的信息熵,数据类型为float32
返回类型:Variable
Markdown is supported
0% .
You are about to add 0 people to the discussion. Proceed with caution.
先完成此消息的编辑!
想要评论请 注册