体验新版 GitCode,发现更多精彩内容 >>
Created by: 131250208
每次进dynamic LSTM前都要进一个fc,这相当于每一层都要多训练一个fc呀,这样做的意义是什么?看文档说线性变换是为了提高效率,为什么这样可以提高效率呢?为什么不直接扩展4份一样的x输入而要通过fc来线性变换呢。还是说进入LSTM以后就不用再做线性变换了,相当于手动进行了四个Wx的过程?