区分確定的モンテカルロ
総合研究大学院大学(5年一貫博士課程)2年
2/06/2025
モンテカルロ法に用いられる PDMP の例.発表者開発の PDMPFlux.jl
パッケージからの出力.
A Blog Entry on Bayesian Computation by an Applied Mathematician
$$
$$
物理のくびき
拡散過程は孤立系の平衡ダイナミクス
例:コーヒーの中に入れた砂糖粒子
必ずしもこれを模倣する必要はない.
例:コーヒーに砂糖を入れたあと混ぜずに見つめている人はいない
アルゴリズムのくびき
拡散過程は正確にシミュレートできない.
離散化をし,数値誤差を Metropolis-Hastings ステップで補正する.
アルゴリズムが重くなる.
物理:非可逆なダイナミクス
「棄却」されるまで一直線に猛進
≒ スプーンで混ぜる行為の模倣
人工的な対称性(例:詳細釣り合い)がない
収束が速い (Diaconis, 2013),
(Andrieu and Livingstone, 2021)
アルゴリズム:棄却フリー
PDMP は数値誤差なくシミュレートできる
Metropolis-Hastings の棄却-採択の枠組みが要らない
物理:非可逆なダイナミクス
「棄却」されるまで一直線に猛進
≒ スプーンで混ぜる行為の模倣
人工的な対称性(例:詳細釣り合い)がない
問題ごとにアルゴリズムを設計する必要
汎用パッケージがない
アルゴリズム:棄却フリー
PDMP は数値誤差なくシミュレートできる
Metropolis-Hastings の棄却-採択の枠組みが要らない
PDMP のシミュレーション=緑色の点をどう打つか?
PDMP シミュレーションの原則
方向転換地点 \textcolor{#78C2AD}{x_1,x_2,\cdots} を決めれば良い
*これが難しい
\textcolor{#78C2AD}{x_1,x_2,\cdots} の決め方
確率密度 \pi に収束させたい場合,強度 m^{(i)}(t)=\biggr(-v\cdot\nabla\log\pi(\textcolor{#78C2AD}{x_{i-1}}+tv)\biggl)_+,\quad t\ge0, を持つ非一様 Poisson 点過程をシミュレートする.
最初の到着点を \textcolor{#78C2AD}{x_i}=\textcolor{#78C2AD}{x_{i-1}}+vT_1^{(i)} とする.
1次元の Gauss 分布を考える:
\pi(x)=\frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{x^2}{2\sigma^2}} \therefore\quad U(x):=-\log\pi(x)=\frac{x^2}{2\sigma^2}+\mathrm{const.}
負の対数尤度 U=-\log\pi は ポテンシャル ともいう.
\begin{align*} m^{(1)}(t)&=(v_0\cdot U'(\textcolor{#78C2AD}{x_0}+\textcolor{#E95420}{v_0}t))_+\\ &=(\textcolor{#78C2AD}{x_0}+\textcolor{#E95420}{v_0}t)\cdot1{\left\{\textcolor{#78C2AD}{x_0}+\textcolor{#E95420}{v_0}t>0\right\}},\quad t\ge0, \end{align*} を強度にもつ 非一様 Poisson 点過程 の最初の到着時刻 T_1^{(1)} について,\textcolor{#78C2AD}{x_1}=\textcolor{#78C2AD}{x_0}+\textcolor{#E95420}{v_0}T_1^{(1)} とすれば良い.
m(t)=\biggr(-v\cdot\nabla\log\pi(\textcolor{#78C2AD}{x_{i-1}}+tv)\biggl)_+,\quad t\ge0, を強度に持つ非一様 Poisson 点過程をシミュレートする.
○ スケーラビリティが達成可能
m(t),\pi の評価:全データが必要
○ m(t) の不偏推定量 \mu(t)
データの一部を見るだけで計算可能
○ 収束先が変わらない
既存研究:確率的剪定 (Bierkens et al., 2019), (Sen et al., 2020)
m(t)=\biggr(-v\cdot\nabla\log\pi(\textcolor{#78C2AD}{x_{i-1}}+tv)\biggl)_+,\quad t\ge0, を強度に持つ非一様 Poisson 点過程をシミュレートする.
○ スケーラビリティが達成可能
m(t),\pi の評価:全データが必要
○ m(t) の不偏推定量 \mu(t)
データの一部を見るだけで計算可能
○ 収束先が変わらない
既存研究:確率的剪定 (Bierkens et al., 2019), (Sen et al., 2020)
汎用的なアルゴリズムが存在しない
\mu(t)\le M\;\;\text{a.s.} を達成する上界 M をどう見つければ良いのか?
もっぱらロジスティック回帰くらい
にしか使えなかった
今回の貢献:適応的剪定
(Andral and Kamatani, 2024)
アルゴリズム
\displaystyle\max_{t\in[0,t_{\text{max}}]}m(t) の計算に最適化が必要
t_{\text{max}} の調整アルゴリズム?
アルゴリズム
○ 最適化フリー+自動微分のベクトライズで高速化可能
○ 自動的かつ汎用的なアルゴリズム
① PDMP は新たなモンテカルロ法の枠組み
もう武器は MCMC だけじゃない.
② PDMP でしか出来ないことも多い
* バイアスを導入しないサブサンプリング
* \delta_x 部分を持った非絶対連続分布からのサンプリング
③ 以上の「良さ」を保ったまま,汎用パッケージ化できる
2025年,機械学習・統計でも動き出す……?
ただし尤度の等高線をなぞることは数値計算の問題になり難しいが,ハイパーパラメータをうまくチューニングすることでほとんど独立なサンプルを得ることができる.
従来的には MCMC の1つとみれるが,ダイナミクスを複雑にした PDMP と見るべきかもしれない.