拓端tecdat|R语言混合正态分布极大似然估计和EM算法-CFANZ编程社区

拓端tecdat|R语言混合正态分布极大似然估计和EM算法

为了在统计过程中发现更多有趣的结果，我们将解决极大似然估计没有简单分析表达式的情况。举例来说，如果我们混合了各种分布，

拓端tecdat|R语言混合正态分布极大似然估计和EM算法_数据

作为说明，我们可以使用样例数据

第一步是编写混合分布的对数似然函数

极大似然性的最简单函数如下（从一组初始参数开始，只是为了获得梯度下降的起点）

因为我们可以通过使用约束优化算法来做到“更好”，例如，概率一定在0到1之间。

为了可视化估计的密度，我们使用

拓端tecdat|R语言混合正态分布极大似然估计和EM算法_r语言_02

另一个解决方案是使用EM算法。我们将从参数的初始值开始，并比较属于每个类的机会

从属于每个类别的这些概率中，我们将估算两个正态分布的参数。使用极大似然

这个想法实际上是有一个循环的：我们估计属于这些类的概率（考虑到正态分布的参数），一旦有了这些概率，就可以重新估计参数。然后我们再次开始

> for(s in 1:100){
+ p=p1/(p1+p2)
+ s1=sqrt(sum(p*(X-m1)^2)/sum(p))
+ s2=sqrt(sum((1-p)*(X-m2)^2)/sum(1-p))
+ }

然后，我们恢复混合分布的“最佳”参数

这相对接近我们的估计。

拓端tecdat|R语言混合正态分布极大似然估计和EM算法_数据_03

拓端tecdat|R语言混合正态分布极大似然估计和EM算法_解决方案_04

0 条评论