赞
踩
马尔科夫链蒙特卡罗法也适合于概率密度函数复杂,不能直接抽样的情况,旨在解决一般的蒙特卡罗法,如接受-拒绝抽样法、重要性抽样法,抽样效率不高的问题。一般的蒙特卡罗法中的抽样样本是独立的,而马尔可夫链蒙特卡罗法中的抽样样本不是独立的,样本序列形成马尔科夫链
接受-拒绝抽样法 (accept-reject sampling method)
以下介绍离散状态马尔可夫链的性质。可以自然推广到连续状态马尔可夫链
例
例
定理 19.2
例
定理 19.3
证明
可见,若随机变量 x x x 是离散的,则应定义相应的离散状态马尔可夫链,状态数即为 ∣ X ∣ |\mathcal X| ∣X∣;若随机变量 x x x 是连续的,则应定义相应的连续状态马尔可夫链
难点
建议分布 q ( x , x ′ ) q(x, x') q(x,x′)
接受分布 α ( x , x ′ ) α (x ,x') α(x,x′)
转移核 p ( x , x ′ ) p(x,x') p(x,x′)
在计算过程中, q ( x , x ′ ) q(x,x') q(x,x′) 和 p ( x ) p(x) p(x) 并不需要归一化,只需要计算出相对大小即可,这对那些难以归一化的待采样概率分布而言十分友好,例如在贝叶斯学习中,后验概率的归一化因子就是一个难以计算的积分项
下面证明转移核为 p ( x , x ′ ) p(x,x') p(x,x′) 的马尔可夫链是可逆马尔可夫链 (满足遍历定理),其平稳分布就是 p ( x ) p(x) p(x)
证明
例
N ( 1 , ( x 2 − 1 ) − 2 ) = 1 2 π σ exp { − ( x − μ ) 2 2 σ 2 } = ∣ x 2 − 1 ∣ 2 π exp { − ( x − 1 ) 2 ( x 2 − 1 ) 2 2 } N(1,(x_2-1)^{-2})=\frac{1}{\sqrt{2\pi}\sigma}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\}=\frac{|x_2-1|}{\sqrt{2\pi}}\exp\left\{-\frac{(x-1)^2(x_2-1)^2}{2}\right\} N(1,(x2−1)−2)=2π σ1exp{−2σ2(x−μ)2}=2π ∣x2−1∣exp{−2(x−1)2(x2−1)2}
抽样第 i i i 个样本 x ( i ) x^{(i)} x(i) 的具体做法
吉布斯抽样是单分量 Metropolis-Hastings 算法的特殊情况
吉布斯抽样 v.s. 单分量 Metropolis-Hastings 算法
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。