Created by: hanguantianxia
请问如果有一个encoder-decoder模型,现在先把encoder和decoder作为独立的program进行分别单独的预训练,在fine-tuning时候现在想把它们连接在一起,有什么办法吗?