関連記事
A Blog Entry on Bayesian Computation by an Applied Mathematician
$$
$$
1 リサンプリング法の形式化
リサンプリング法を調べるにあたって,これを数学的な枠組みに落とし込む必要があり,これが意外と一筋縄ではいかない.
1.1 リサンプリングとは
Feynman-Kac 測度を \(\mathbb{Q}_0,\mathbb{Q}_1,\cdots\) と逐次的に推定していく問題を考える.
- 時刻 \(t=0\) にて,提案分布を \(\mathbb{M}_0\),目標分布を \(\mathbb{Q}_0(dx_0)\propto G_0(x_0)\mathbb{M}_0(dx_0)\) とした重点サンプリングを行って,\(\mathbb{Q}_0\) の重点サンプリング推定量 \[ \mathbb{Q}_0^N(dx_0):=\sum_{i=1}^NW_0^{i}\delta_{X_0^{i}}(dx_0), \] \[ X_0^i\overset{\text{i.i.d.}}{\sim}\mathbb{M}_0,\quad W^i_0:=\frac{G_0(X_0^i)}{\sum_{j=1}^NG_0(X_0^j)} \] を得る.
- 時刻 \(t=1\) では目標分布 \(\mathbb{Q}_1(dx_{0:1})\propto G_1(x_0,x_1)\mathbb{Q}_0(dx_0)M_1(x_0,dx_1)\) を,提案分布 \(\mathbb{Q}_0(dx_0)M_1(x_0,dx_1)\) から重点サンプリングすることを考える.
そこで,提案分布 \(\mathbb{Q}_0(dx_0)M_1(x_0,dx_1)\) に従う標本 \(\{(X_0^i,X_1^i)\}_{i=1}^N\) をどう得るかが問題になる.これを得たならば,残る重点サンプリングのステップとは,ポテンシャル \(G_1(x_0,x_1)\propto\frac{d \mathbb{Q}_1}{d \mathbb{Q}_0\otimes M_1}\) に関して重み付けするのみである.
まず,リサンプリングをしない粒子フィルターは,逐次重点サンプリングに等しい.その考え方は次の通りである:
しかし荷重 \(W_0^i\le1\) が引き継がれている点に注目して欲しい.ここに新たに \(W_0^iW_1^i\cdots\) と連なっていくことになる.これでは,時間が経つ \(t\to\infty\) につれて荷重の分散が拡大し,殆ど1つの粒子しか Feynman-Kac 分布 \(\mathbb{Q}_t\) の推定に寄与しないことになる.これでは,たくさん粒子を用意した意味がない.
そこで,定期的にリサンプリングを行い,\(\mathbb{Q}_t^N\) の表現を荷重 \(\{W_t^i\}_{i=1}^N\) に頼り切るのではなく,粒子の濃密で代替して,荷重の方は一様化に戻すという段階を挟む.
このリサンプリングの段階は,実用上はほとんどの場合,荷重 \(\{W_t^i\}_{i=1}^N\) の状態を監視して適応的に行うことが多い.
References
Footnotes
\(L_t\) は積分を \(1\) にするための正規化定数である.詳しくは (Chopin and Papaspiliopoulos, 2020, pp. 51–52), (Del Moral and Penev, 2014, p. 239) も参照.↩︎
確率核に関する記法は 本サイトの数学記法一覧 を参照.\(E\) を Polish 空間としたため,全ての確率測度 \(\mathbb{M}_t(dx_{0:t})\) はこのように分解 (disintegration) できる.↩︎
詳しくは (Chopin and Papaspiliopoulos, 2020, p. 53) 参照.↩︎