Created by: zhizunbao-y
该计算中对于模型中bn层,除了scale和offset外,将mean和variance也统计为了参数量,后两者没有经过优化算法优化过,不是学习到的 ,是否应该算作参数量?