Created by: colin1988
将L1DecayRegularizer用于大规模稀疏表,是否能自动去掉作用较小的id特征,更确切的说是在id对应embedding的每个维度做L1正则还是在整个id对应的embedding向量上作分组L1正则?
另外,求简要介绍大规模稀疏表的正则化实现策略。