y_hat = weight*X + bias # 这是向量化运算实现的假设函数 loss = y_hat-y # 这是中间过程, 求得的是假设函数预测的y'和真正的y值之间的差值 derivative_wight = X.T.dot(loss)/len(X) # 对权重求导, len(X)就是样本总数 derivative_bias = sum(loss)*1/len(X) # 对偏置求导, len(X)就是样本总数