Created by: rulai-huiyingl
两个数据不同的task共享网络的底层参数,但是有不同的上层和损失函数. 能否做到,在每一个batch,sample一个task,用这个task的batch数据update底层共享和上层独有的参数. 也就是每一个batch的训练数据,loss和要update的参数都可能是不一样的. 谢谢!