diff --git a/machine_translation/README.md b/machine_translation/README.md index b9479ad0de4e92e1a07281cd90cd1b7cfa3a9e0b..fe6d887df90958e4a789f3ab8037036847668dcd 100644 --- a/machine_translation/README.md +++ b/machine_translation/README.md @@ -472,7 +472,7 @@ settings( - context通过调用`simple_attention`函数,实现公式$c_i=\sum {j=1}^{T}a_{ij}h_j$。其中,enc_vec是$h_j$,enc_proj是$h_j$的映射(见3.1),权重$a_{ij}$的计算已经封装在`simple_attention`函数中。 - decoder_inputs融合了$c_i$和当前目标词current_word(即$u_i$)的表示。 - gru_step通过调用`gru_step_layer`函数,在decoder_inputs和decoder_mem上做了激活操作,即实现公式$z_{i+1}=\phi _{\theta '}\left ( c_i,u_i,z_i \right )$。 - - 最后,使用softmax归一化计算单词的概率,将out结果返回,即实现公式$p\left ( u_i|u_{