diff --git a/docs/11&12.md b/docs/11&12.md index a81b3e19143559d17732e4ee6475c311b30571b9..5dff3d9fcb0b569a285f0708b1bc91f723b4a014 100644 --- a/docs/11&12.md +++ b/docs/11&12.md @@ -166,4 +166,6 @@ $$ **算法 1** -类似的方法也适用于单位方差高斯 MAB。经过时间 $t$ 后,对于动作 $k$ 的后验值为 $N(\mu_{k},\frac{1}{S_k+F_k+1})$,这里 $\mu_k$ 为经验性的奖励。作为练习,请证明这一结论。 \ No newline at end of file +类似的方法也适用于单位方差高斯 MAB。经过时间 $t$ 后,对于动作 $k$ 的后验值为 $N(\mu_{k},\frac{1}{S_k+F_k+1})$,这里 $\mu_k$ 为经验性的奖励。作为练习,请证明这一结论。 + +### 2.5 \ No newline at end of file