0
点赞
收藏
分享

微信扫一扫

重要性采样

飞鸟不急 2022-01-12 阅读 115
机器学习

Importance Sampling
  目的: 在概率密度函数分布 p ( x ) p(x) p(x)极其不均匀和特征函数 f ( x ) f(x) f(x)很复杂的情况下,更精确的估计样本期望 E X ∼ p ( x ) [ f ( x ) ] = E [ f ] E_{X \sim p(x)}[f(x)]=E[f] EXp(x)[f(x)]=E[f]
  利用随机采样,用样本均值估算 X ∼ p ( x ) X \sim p(x) Xp(x)的期望 E X ∼ p ( x ) [ f ( x ) ] = E [ f ] E_{X \sim p(x)}[f(x)]=E[f] EXp(x)[f(x)]=E[f],可利用公式(1)估算:
E [ f ] = 1 N ∑ i = 1 N f ( x i ) (1) E[f]=\frac{1}{N} \sum_{i=1}^{N} f\left(x_{i}\right)\tag{1} E[f]=N1i=1Nf(xi)(1)然而上式仅适合于 f ( x ) f(x) f(x)趋向均匀分布的情况。当非均匀分布时,采用随机采样会导致期望的偏差bias很大,此时,要么增大采样的数量(大数定理告诉我们,样本数足够大,采样样本的分布越近似原分布),要么引入重要性采样,用修正因子来表示重要性采样的权重,以便让样本期望和真实期望偏差尽可能小。

  做法: 引入一个和 p ( x ) p(x) p(x)有一定相似度的函数 π ( x ) \pi(x) π(x),将问题转化为求 E [ f ] = ∫ x p ( x ) π ( x ) p ( x ) f ( x ) d x E[f]=\int_{x} p(x) \frac{\pi(x)}{p(x)} f(x) d x E[f]=xp(x)p(x)π(x)f(x)dx E [ f ] = 1 N ∑ i = 1 N π ( x i ) p ( x i ) f ( x i ) E[f]=\frac{1}{N} \sum_{i=1}^{N} \frac{\pi\left(x_{i}\right)}{p\left(x_{i}\right)} f\left(x_{i}\right) E[f]=N1i=1Np(xi)π(xi)f(xi),此时就有 π ( x i ) p ( x i ) \frac{\pi\left(x_{i}\right)}{p\left(x_{i}\right)} p(xi)π(xi)为重要性采样的权重。

举报

相关推荐

0 条评论