Roberts and Tweedie (1996) Exponential Convergence of Langevin Distributions and Their Discrete Approximations
Roberts and Tweedie [Bernoulli 2(1996) 341-363] は MALA (Metropolis-Adjusted Langevin Algorithm) の指数エルゴード性を議論したもの.
論文メモ
司馬 博文
4/22/2024
Roberts and Rosenthal [Journal of the Royal Statistical Society. Series B 60(1998) 255-268] は MALA (Metropolis-Adjusted Langevin Algorithm) の最適スケーリングを論じたもの.
A Blog Entry on Bayesian Computation by an Applied Mathematician
$$
$$
MALA は (Besag, 1994) で提案され,(Roberts and Tweedie, 1996) で指数エルゴード性が示されている.(Roberts and Rosenthal, 1998) では最適スケーリングが論じられている.
なお,本論文 (Roberts and Rosenthal, 1998) では MALA を “Hastings-Metropolis algorithms derived from Langevin diffusions” と呼んでいる.(Neal, 1993) では Langevin Monte Carlo を Hybrid Monte Carlo の特別な場合として取り上げている.
Brown 運動の離散化を Monte Carlo 法に用いるというアイデアは (Rossky et al., 1978) でもすでに見られていた.
(Fearnhead et al., 2018) において,MALA は BPS と比較されている.1 モデルは AR(1) を用いており,低次元ではほとんど変わらないが,高次元では BPS の方が自己相関時間が5倍良いという結論が得られている.
乱歩 MH は目標分布に依存せず同一の実装をもつ点が利点であるが,それ故に目標分布が複雑である場合は収束が遅いことがある.
一方で,Langevin アルゴリズムは目標分布の勾配を利用した対称的な手法で,
Langevin algorithms use local problem-specific information and are therefore often almost as easy to implement.
(Roberts and Tweedie, 1996) では Langevin アルゴリズムはいつでも指数エルゴード性を持つ訳ではないことがわかったが,それでも,特に高次元の設定で,乱歩 MH 法より速い収束が確認されている.本論文の結果を通じて,このことを理論的に確認することもできる!
(Roberts et al., 1997) では乱歩 MH の最適スケーリングが調べられ,漸近的な採択率を
いずれも
これと同じように,Langevin アルゴリズムにおいても最適スケーリングを論じたい.
MALA は目標分布の情報を用いた提案をするため,最適な採択率はより高い水準で調整されるべきであるだろう,という結果の予測が立つ.
Furthermore, the proposal variance should scale as
, and thus steps are required for the Langevin algorithm to converge.
speed measure が MCMC の効率性を測るにあたって極めて重要な指標であることを説明している.
まず第一に,ベイズ計算法としては,Markov 連鎖
しかし拡散極限では,
これにより,高次元極限
All other measures of efficiency are equivalent (up to a normalization constant), including those described above.
また,
目標分布は,ある密度
この step variance
ステップサイズ
MALA
この
その際なぜか (Roberts and Rosenthal, 1998) を引用.↩︎