L1_homework
第一题
证明高斯分布积分为1,即 1 = ∫ − ∞ + ∞ 1 2 π δ 2 e x p ( − ( x − μ ) 2 2 δ 2 ) d x 1=\int^{+\infty}_{-\infty}\frac{1}{\sqrt{2\pi\delta ^ {2}}}exp\big(-\frac{(x-\mu)^2}{2\delta ^2}\big)dx 1=∫−∞+∞2πδ21exp(−2δ2(x−μ)2)dx
证:
设
I
=
∫
−
∞
+
∞
1
2
π
δ
2
e
x
p
(
−
(
x
−
μ
x
)
2
2
δ
2
)
d
x
设I=\int^{+\infty}_{-\infty}\frac{1}{\sqrt{2\pi\delta ^ {2}}}exp\big(-\frac{(x-\mu_x)^2}{2\delta ^2}\big)dx
设I=∫−∞+∞2πδ21exp(−2δ2(x−μx)2)dx
= ∫ − ∞ + ∞ 1 2 π δ 2 e x p ( − ( y − μ y ) 2 2 δ 2 ) d y =\int^{+\infty}_{-\infty}\frac{1}{\sqrt{2\pi\delta ^ {2}}}exp\big(-\frac{(y-\mu_y)^2}{2\delta ^2}\big)dy =∫−∞+∞2πδ21exp(−2δ2(y−μy)2)dy
则:
I
2
=
1
2
π
δ
2
∫
−
∞
+
∞
∫
−
∞
+
∞
e
x
p
(
−
1
2
δ
2
[
(
x
−
μ
x
)
2
+
(
y
−
μ
y
)
2
]
)
d
x
d
y
I^2=\frac{1}{2\pi\delta ^ {2}}\int^{+\infty}_{-\infty}\int^{+\infty}_{-\infty}exp\big(-\frac{1}{2\delta^2}\big[(x-\mu_x)^2+(y-\mu_y)^2\big]\big)dxdy
I2=2πδ21∫−∞+∞∫−∞+∞exp(−2δ21[(x−μx)2+(y−μy)2])dxdy
令:
x
−
μ
x
=
r
cos
θ
,
y
−
μ
y
=
r
sin
θ
x-\mu_x=r\cos{\theta} , y-\mu_y=r\sin{\theta}
x−μx=rcosθ,y−μy=rsinθ
则有:
d
x
d
y
=
det
∣
J
∣
d
r
d
θ
dxdy=\det |J| d{r}d{\theta}
dxdy=det∣J∣drdθ
det ∣ J ∣ = ∣ cos θ sin θ − r sin θ r cos θ ∣ = r \det|J| =\big|\begin{matrix}\cos{\theta}&\sin{\theta}\\-r\sin{\theta}&r\cos{\theta}\end{matrix} \big|=r det∣J∣=∣∣cosθ−rsinθsinθrcosθ∣∣=r
带入前式:
I
2
=
1
2
π
δ
2
∫
0
2
π
∫
0
+
∞
e
x
p
(
−
r
2
2
δ
2
)
r
d
r
d
θ
I^2=\frac{1}{2\pi\delta ^ {2}}\int^{2\pi}_{0}\int^{+\infty}_{0}exp\big(-\frac{r^2}{2\delta^2}\big)rdrd{\theta}
I2=2πδ21∫02π∫0+∞exp(−2δ2r2)rdrdθ
= 1 2 π δ 2 ∗ δ 2 ∫ 0 2 π d θ = 1 =\frac{1}{2\pi\delta ^ {2}} * \delta^2 \int^{2\pi}_{0}d{\theta}=1 =2πδ21∗δ2∫02πdθ=1
则 ∫ − ∞ + ∞ 1 2 π δ 2 e x p ( − ( x − μ ) 2 2 δ 2 ) d x = I = 1 \int^{+\infty}_{-\infty}\frac{1}{\sqrt{2\pi\delta ^ {2}}}exp\big(-\frac{(x-\mu)^2}{2\delta ^2}\big)dx = I=1 ∫−∞+∞2πδ21exp(−2δ2(x−μ)2)dx=I=1
第二题
假设 u , v u,v u,v时两个相同维度的列向量,请证明等式: u T v = t r ( v u T ) u^Tv=tr(vu^T) uTv=tr(vuT)
证:
设
u
=
[
x
1
x
2
⋯
x
n
]
,
v
=
v
=
[
y
1
y
2
⋯
y
n
]
u=\left[\begin{matrix}x_1\\x_2\\\cdots\\x_n\end{matrix}\right] , v=v=\left[\begin{matrix}y_1\\y_2\\\cdots\\y_n\end{matrix}\right]
u=⎣⎢⎢⎡x1x2⋯xn⎦⎥⎥⎤,v=v=⎣⎢⎢⎡y1y2⋯yn⎦⎥⎥⎤
则 u T v = [ x 1 x 2 ⋯ x n ] [ y 1 y 2 ⋯ y n ] = x 1 y 1 + x 2 y 2 + ⋯ + x n y n u^Tv=\left[\begin{matrix}x_1&x_2&\cdots&x_n\end{matrix}\right] \left[\begin{matrix}y_1\\y_2\\\cdots\\y_n\end{matrix}\right]=x_1y_1+x_2y_2+\cdots+x_ny_n uTv=[x1x2⋯xn]⎣⎢⎢⎡y1y2⋯yn⎦⎥⎥⎤=x1y1+x2y2+⋯+xnyn
v u T = [ y 1 y 2 ⋯ y n ] [ x 1 x 2 ⋯ x n ] = [ x 1 y 1 x 2 y 1 ⋯ x n y 1 x 1 y 2 x 2 y 2 … x n y 2 ⋮ ⋮ ⋱ ⋮ x 1 y 3 x 2 y 3 ⋯ x n y n ] vu^T=\left[\begin{matrix}y_1\\y_2\\\cdots\\y_n\end{matrix}\right]\left[\begin{matrix}x_1&x_2&\cdots&x_n\end{matrix}\right]=\left[\begin{matrix}x_1y_1&x_2y_1&\cdots&x_ny_1\\x_1y_2&x_2y_2&\dots&x_ny_2\\\vdots&\vdots&\ddots&\vdots\\x_1y_3&x_2y_3&\cdots&x_ny_n\end{matrix}\right] vuT=⎣⎢⎢⎡y1y2⋯yn⎦⎥⎥⎤[x1x2⋯xn]=⎣⎢⎢⎢⎡x1y1x1y2⋮x1y3x2y1x2y2⋮x2y3⋯…⋱⋯xny1xny2⋮xnyn⎦⎥⎥⎥⎤
t r ( v u T ) = x 1 y 1 + x 2 y 2 + ⋯ + x n y n = u T v tr(vu^T)=x_1y_1+x_2y_2+\cdots+x_ny_n=u^Tv tr(vuT)=x1y1+x2y2+⋯+xnyn=uTv
第三题
对于高斯分布的随机变量, x ~ N ( μ , Σ ) x~N(\mu , \Sigma) x~N(μ,Σ),请证明等式: μ = E [ x ] = ∫ − ∞ + ∞ x p ( x ) d x \mu=E[x]=\int^{+\infty}_{-\infty}xp(x)dx μ=E[x]=∫−∞+∞xp(x)dx
证:
∫
−
∞
+
∞
x
p
(
x
)
d
x
=
1
2
π
δ
2
∫
−
∞
+
∞
x
e
x
p
(
−
(
x
−
μ
)
2
2
δ
2
)
d
x
\int^{+\infty}_{-\infty}xp(x)dx=\frac{1}{\sqrt{2\pi\delta ^ {2}}}\int^{+\infty}_{-\infty}xexp\big(-\frac{(x-\mu)^2}{2\delta ^2}\big)dx
∫−∞+∞xp(x)dx=2πδ21∫−∞+∞xexp(−2δ2(x−μ)2)dx
= 1 2 π δ 2 ( − δ 2 e x p ( − ( x − μ ) 2 2 δ 2 ) ∣ − ∞ + ∞ + ∫ − ∞ + ∞ μ e x p ( − ( x − μ ) 2 2 δ 2 ) d x ) =\left .\frac{1}{\sqrt{2\pi\delta ^ {2}}}\big(-\delta^2exp\big(-\frac{(x-\mu)^2}{2\delta ^2}\big)\right|^{+\infty}_{-\infty}+\int^{+\infty}_{-\infty}\mu exp\big(-\frac{(x-\mu)^2}{2\delta ^2}\big)dx\big) =2πδ21(−δ2exp(−2δ2(x−μ)2)∣∣∣∣−∞+∞+∫−∞+∞μexp(−2δ2(x−μ)2)dx)
=
0
+
μ
=
μ
=
E
[
x
]
=0+\mu=\mu=E[x]
=0+μ=μ=E[x]
注:此题直接使用到第一题的结论。
第四题
对于高斯分布的随机变量,
x
N
(
μ
,
Σ
)
x~N(\mu , \Sigma)
x N(μ,Σ),请证明如下等式:
Σ
=
E
[
(
x
−
μ
)
(
x
−
μ
)
T
]
=
∫
−
∞
+
∞
(
x
−
μ
)
(
x
−
μ
)
T
p
(
x
)
d
x
\Sigma = E[(x-\mu)(x-\mu)^T]=\int^{+\infty}_{-\infty}(x-\mu)(x-\mu)^Tp(x)dx
Σ=E[(x−μ)(x−μ)T]=∫−∞+∞(x−μ)(x−μ)Tp(x)dx
证:
令
X
=
x
−
μ
X=x-\mu
X=x−μ,则:
∫
−
∞
+
∞
(
x
−
μ
)
(
x
−
μ
)
T
p
(
x
)
d
x
=
1
2
π
Σ
∫
−
∞
+
∞
X
2
e
x
p
(
−
X
2
2
Σ
)
d
X
\int^{+\infty}_{-\infty}(x-\mu)(x-\mu)^Tp(x)dx=\frac{1}{\sqrt{2\pi\Sigma}}\int^{+\infty}_{-\infty}X^2exp\big(-\frac{X^2}{2\Sigma}\big)dX
∫−∞+∞(x−μ)(x−μ)Tp(x)dx=2πΣ1∫−∞+∞X2exp(−2ΣX2)dX
= 1 2 π Σ [ − Σ X e x p ( − X 2 2 Σ ) + Σ ∫ e x p ( − X 2 2 Σ ) ) ] ∣ − ∞ + ∞ =\left .\frac{1}{\sqrt{2\pi\Sigma}}\left[-\Sigma X exp\big(-\frac{X^2}{2\Sigma}\big)+\Sigma\int exp(-\frac{X^2}{2\Sigma}))\right]\right|^{+\infty}_{-\infty} =2πΣ1[−ΣXexp(−2ΣX2)+Σ∫exp(−2ΣX2))]∣∣∣∣−∞+∞
= 1 2 π Σ ( 0 + Σ ∫ − ∞ + ∞ e x p ( − X 2 2 Σ ) ) = 1 2 π Σ ∗ Σ ∗ 2 π Σ = Σ =\frac{1}{\sqrt{2\pi\Sigma}} \left(0+\Sigma \int^{+\infty}_{-\infty}exp \big(-\frac{X^2}{2\Sigma}\big)\right)=\frac{1}{\sqrt{2\pi\Sigma}}*\Sigma*\sqrt{2\pi\Sigma}=\Sigma =2πΣ1(0+Σ∫−∞+∞exp(−2ΣX2))=2πΣ1∗Σ∗2πΣ=Σ
注:此题使用部分积分,并直接使用到第一题的结论。
第五题
对于K个相互独立的高斯变量,
x
k
N
(
μ
k
,
Σ
k
)
x_k ~ N(\mu_k , \Sigma_k)
xk N(μk,Σk),请证明他们的归一化积仍然是高斯分布:
e
x
p
(
−
1
2
(
x
−
μ
)
T
Σ
−
1
(
x
−
μ
)
)
=
η
∏
k
=
1
K
e
x
p
(
−
1
2
(
x
k
−
μ
k
)
T
Σ
k
−
1
(
x
k
−
μ
k
)
)
exp \left(-\frac{1}{2}\big(x-\mu\big)^T\Sigma^{-1}\big(x-\mu\big)\right)=\eta \prod^K_{k=1}exp\big(-\frac{1}{2}\big(x_k-\mu_k\big)^T\Sigma^{-1}_k\big(x_k-\mu_k\big)\big)
exp(−21(x−μ)TΣ−1(x−μ))=ηk=1∏Kexp(−21(xk−μk)TΣk−1(xk−μk))
其中:
Σ
−
1
=
∑
k
=
1
K
Σ
k
−
1
,
Σ
−
1
μ
=
∑
k
=
1
K
Σ
k
−
1
μ
k
\Sigma^{-1}=\sum_{k=1}^K\Sigma^{-1}_k,\Sigma^{-1}\mu=\sum_{k=1}^K\Sigma^{-1}_k\mu_k
Σ−1=k=1∑KΣk−1,Σ−1μ=k=1∑KΣk−1μk
η
\eta
η为归一化因子。
证:
∏
k
=
1
K
1
2
π
Σ
k
e
x
p
(
−
1
2
(
x
k
−
μ
k
)
T
Σ
k
−
1
(
x
k
−
μ
k
)
)
\prod^K_{k=1}\frac{1}{\sqrt{2\pi\Sigma_k}}exp\big(-\frac{1}{2}\big(x_k-\mu_k\big)^T\Sigma^{-1}_k\big(x_k-\mu_k\big)\big)
k=1∏K2πΣk1exp(−21(xk−μk)TΣk−1(xk−μk))
= ∏ k = 1 K 1 2 π Σ k ∗ e x p ( ∑ k = 1 K − 1 2 ( x k − μ k ) T Σ k − 1 ( x k − μ k ) ) =\prod^K_{k=1}\frac{1}{\sqrt{2\pi\Sigma_k}}*exp(\sum_{k=1}^K-\frac{1}{2}\big(x_k-\mu_k\big)^T\Sigma^{-1}_k\big(x_k-\mu_k\big)) =k=1∏K2πΣk1∗exp(k=1∑K−21(xk−μk)TΣk−1(xk−μk))
= ∏ k = 1 K 1 2 π Σ k ∗ ∏ k = 1 K e x p ( − 1 2 ( x k T Σ k − 1 x k − x k T Σ k − 1 μ k − μ k T Σ k − 1 x k − μ k T Σ k − 1 μ k ) ) =\prod^K_{k=1}\frac{1}{\sqrt{2\pi\Sigma_k}}*\prod^K_{k=1}exp(-\frac{1}{2}\big(x_k^T\Sigma^{-1}_kx_k-x_k^T\Sigma^{-1}_k\mu_k-\mu_k^T\Sigma^{-1}_kx_k-\mu_k^T\Sigma^{-1}_k\mu_k\big)) =k=1∏K2πΣk1∗k=1∏Kexp(−21(xkTΣk−1xk−xkTΣk−1μk−μkTΣk−1xk−μkTΣk−1μk))
= ∏ k = 1 K 1 2 π Σ k ∗ e x p ( − 1 2 ( x T ∑ k = 1 K Σ k − 1 x − x T ∑ k = 1 K Σ k − 1 μ k − ∑ k = 1 K μ k T Σ k − 1 x − ∑ k = 1 K μ k T Σ k − 1 μ k ) ) =\prod^K_{k=1}\frac{1}{\sqrt{2\pi\Sigma_k}}*exp(-\frac{1}{2}\big(x^T\sum^K_{k=1}\Sigma^{-1}_kx-x^T\sum^K_{k=1}\Sigma^{-1}_k\mu_k-\sum^K_{k=1}\mu_k^T\Sigma^{-1}_kx-\sum^K_{k=1}\mu_k^T\Sigma^{-1}_k\mu_k\big)) =k=1∏K2πΣk1∗exp(−21(xTk=1∑KΣk−1x−xTk=1∑KΣk−1μk−k=1∑KμkTΣk−1x−k=1∑KμkTΣk−1μk))
令:
A
=
∑
k
=
1
K
Σ
k
−
1
μ
k
,
Σ
−
1
=
∑
k
=
1
K
Σ
k
−
1
,
M
=
A
T
Σ
−
1
A
A= \sum_{k=1}^K\Sigma^{-1}_k\mu_k, \Sigma^{-1}=\sum_{k=1}^K\Sigma^{-1}_k ,M=A^T\Sigma^{-1} A
A=k=1∑KΣk−1μk,Σ−1=k=1∑KΣk−1,M=ATΣ−1A
带入前式,得到:
=
η
e
x
p
(
−
1
2
(
x
T
∑
k
=
1
K
Σ
k
−
1
x
−
x
T
∑
k
=
1
K
Σ
k
−
1
μ
k
−
∑
k
=
1
K
μ
k
T
Σ
k
−
1
x
−
∑
k
=
1
K
μ
k
T
Σ
k
−
1
μ
k
)
)
=\eta exp(-\frac{1}{2}\big(x^T\sum^K_{k=1}\Sigma^{-1}_kx-x^T\sum^K_{k=1}\Sigma^{-1}_k\mu_k-\sum^K_{k=1}\mu_k^T\Sigma^{-1}_kx-\sum^K_{k=1}\mu_k^T\Sigma^{-1}_k\mu_k\big))
=ηexp(−21(xTk=1∑KΣk−1x−xTk=1∑KΣk−1μk−k=1∑KμkTΣk−1x−k=1∑KμkTΣk−1μk))
= η e x p [ − 1 2 ( x T ∑ k = 1 K Σ k − 1 x − x T ∑ k = 1 K Σ k − 1 μ k − ∑ k = 1 K μ k T Σ k − 1 x + M ) + 1 2 M + 1 2 ∑ k = 1 K μ k T Σ k − 1 μ k ] =\eta exp \left[-\frac{1}{2}\big(x^T\sum^K_{k=1}\Sigma^{-1}_kx-x^T\sum^K_{k=1}\Sigma^{-1}_k\mu_k-\sum^K_{k=1}\mu_k^T\Sigma^{-1}_kx+M\big)+\frac{1}{2}M+\frac{1}{2}\sum^K_{k=1}\mu_k^T\Sigma^{-1}_k\mu_k\right] =ηexp[−21(xTk=1∑KΣk−1x−xTk=1∑KΣk−1μk−k=1∑KμkTΣk−1x+M)+21M+21k=1∑KμkTΣk−1μk]
= η e x p [ 1 2 M + 1 2 ∑ k = 1 K μ k T Σ k − 1 μ k ] e x p [ − 1 2 ( x T Σ − 1 x − x T A − A T x + A T Σ − 1 A ) ] =\eta exp \left[\frac{1}{2}M+\frac{1}{2}\sum^K_{k=1}\mu_k^T\Sigma^{-1}_k\mu_k\right] exp\left[-\frac{1}{2}\big(x^T\Sigma^{-1}x-x^TA-A^Tx+A^T\Sigma^{-1} A\big)\right] =ηexp[21M+21k=1∑KμkTΣk−1μk]exp[−21(xTΣ−1x−xTA−ATx+ATΣ−1A)]
= η ′ e x p [ − 1 2 ( x T Σ − 1 x − x T Σ − 1 ( Σ − 1 ) − 1 A − A T ( Σ − 1 ) − 1 Σ − 1 x + A T Σ − 1 A ) ] =\eta^{'}exp\left[-\frac{1}{2}\big(x^T\Sigma^{-1}x-x^T\Sigma^{-1}(\Sigma ^{-1})^{-1}A-A^T(\Sigma ^{-1})^{-1}\Sigma^{-1}x+A^T\Sigma^{-1} A\big)\right] =η′exp[−21(xTΣ−1x−xTΣ−1(Σ−1)−1A−AT(Σ−1)−1Σ−1x+ATΣ−1A)]
= η ′ e x p ( − 1 2 [ x − ( Σ − 1 ) − 1 A ] T Σ − 1 [ x − ( Σ − 1 ) − 1 A ] ) =\eta^{'}exp\left(-\frac{1}{2}[x-(\Sigma ^{-1})^{-1}A]^T\Sigma^{-1}[x-(\Sigma^{-1})^{-1}A]\right) =η′exp(−21[x−(Σ−1)−1A]TΣ−1[x−(Σ−1)−1A])
所以:
μ
=
(
Σ
−
1
)
−
1
A
=
(
Σ
−
1
)
−
1
∑
k
=
1
K
Σ
k
−
1
μ
k
,
Σ
−
1
=
∑
k
=
1
K
Σ
k
−
1
\mu=(\Sigma ^{-1})^{-1}A=(\Sigma ^{-1})^{-1}\sum_{k=1}^K\Sigma^{-1}_k\mu_k , \Sigma^{-1}=\sum_{k=1}^K\Sigma^{-1}_k
μ=(Σ−1)−1A=(Σ−1)−1k=1∑KΣk−1μk,Σ−1=k=1∑KΣk−1
注:如有错误,欢迎指正。