【Question】关于embedding_layer和table_projection的联系与区别,以及LSTM单元的疑问
Created by: pkuyym
- embedding_layer和table_projection都可以把离散值转换为稠密实数向量,请问这两个layer有什么不同?
- 在RNN配置里面的simple_attention样例里面有这样的逻辑:
decoder_inputs = mixed_layer(inputs = [full_matrix_projection(context), full_matrix_projection(current_word)], size = decoder_size * 3) gru_step = gru_step_layer(name='gru_decoder', input=decoder_inputs, output_mem=decoder_mem, size=decoder_size)
decoder_inputs的size为什么是3倍的decoder_size,同时在simple_lstm里面
with mixed_layer( name=fc_name, size=size * 4, act=IdentityActivation(), layer_attr=mixed_layer_attr, bias_attr=False) as m: m += full_matrix_projection(input, param_attr=mat_param_attr)
这个size是4倍的输入的size 请问这里面的逻辑?