物理のくびきを超える MCMC
総合研究大学院大学 / 統計数理研究所
7/25/2024
区分確定的 Makrov 過程を用いた,連続時間 MCMC 手法の1つ
A Blog Entry on Bayesian Computation by an Applied Mathematician
$$
$$
PDMP (Piecewise Deterministic Markov Process,区分確定的マルコフ過程)
今回は Zig-Zag サンプラー(中央)に注目する.
シミュレーションが簡単(本節の残りで解説)
PDMP:離散化誤差なしで簡単にシミュレーションできる稀有な連続過程
ダイナミクスが良い(第 4 節)
前スライドで見た通り,非対称なダイナミクスが作れる
スケーラブルなサンプリング手法(第 2 節)
全データにアクセスする必要はなく,一部で良い(サブサンプリング)
バイアスが入らないサブサンプリングが可能 (Bierkens, Fearnhead, et al., 2019)
定義(Zig-Zag 過程)
Zig-Zag 過程は状態空間 E=\mathbb{R}^d\times\{\pm1\}^d 上に定義される過程 Z=(X,\Theta) である.
\Theta は速度,X は位置と解し,第一成分 X が \mathbb{R}^d 上の目標分布 \pi に従うように構成される.
ランダムな時刻におけるランダムな変化(次スライド)を除いては,速度 \theta\in\{\pm1\}^d の等速直線運動をする.
すなわち,(x,\theta)\in E から出発する Zig-Zag 過程は,次の微分方程式系で定まる決定論的なフロー \phi_{(x,\theta)}:\mathbb{R}\to\mathbb{R}^d に従って運動する粒子とみなせる: \frac{d \phi_{(x,\theta)}(t)}{d t}=\theta,\qquad \frac{d \Theta_t}{d t}=0.
命題(Zig-Zag 過程の不変分布)
目標の分布が \pi(dx)\,\propto\,e^{-U(x)}\,dx と表せるとする.このとき,レート関数 \lambda_1,\cdots,\lambda_d:E\to\mathbb{R}_+ が,ある \theta_i のみには依らない非負連続関数 \gamma_i:E\to\mathbb{R}_+ を用いて \lambda_i(x,\theta)=\biggr(\theta_i\partial_iU(x)\biggl)_++\gamma_i(x,\theta_{-i}) と表されるならば,Zig-Zag 過程 Z=(X,\Theta) の位置成分 X は \pi を不変分布に持つ.
あとはエルゴード性が成り立てば,\pi に対する MCMC として使える.
U\in C^3(\mathbb{R}^d) はある定数 c>d,c'\in\mathbb{R} に関して U(x)\ge c\log\lvert x\rvert-c'\qquad x\in\mathbb{R}^d を満たすならば,全変動距離に関してエルゴード性を持つ:1 \left\|P^t((x,\theta),-)-\pi\right\|_\mathrm{TV}\xrightarrow{t\to\infty}0.
\pi(x)\,\propto\,e^{-U(x)}\le C'\lvert x\rvert^c,\qquad C'>0, ということだから,ほとんどの場合成り立つ.
\lambda_i(x,\theta)=\biggr(\theta_i\partial_iU(x)\biggl)_++\gamma_i(x,\theta_{-i})
命題
強度関数 m_i を持つ Poisson 点過程の,最初の到着時刻 T_i は, M_i(t):=\int^t_0m_i(s)\,ds と指数分布する確率変数 E_i\sim\operatorname{Exp}(1) を用いて, T_i\overset{\text{d}}{=}M_i^{-1}(E_i) とシミュレーションできる.
しかしこの方法は,m_i が多項式の場合しか使えない.
命題
m\le M を2つの強度関数とする.M を強度に持つ Poisson 点過程 \eta の点 X_1,X_2,\cdots,X_{\eta([0,T])} をシミュレーションし,それぞれを確率 1-\frac{m(X_i)}{M(X_i)} で取り除く(剪定).
すると,残った点は強度 m の Poisson 点過程に従う.
Zig-Zag 過程のシミュレーションの問題は,強度関数 m_i(t)=\lambda_i(x+t\theta,\theta)=\biggr(\theta_i\partial_iU(x+t\theta)\biggl)_++\gamma_i(x+t\theta,\theta_{-i}) の多項式による上界 M_i を見つける問題に帰着される.
Zig-Zag サンプラーは,不偏なサブサンプリングにより,スケーラブルな Monte Carlo 法として使える.
Metropolis-Hastings 法
採択-棄却のステップでは,毎度全データにアクセスする必要があり,計算量が大きい.
データの一部のみを使って尤度を不変推定する1
目標分布に収束しなくなる(バイアスが導入される)
MCMC を使う利点が失われる
1. Devide-and-conquer
データを小さなチャンクに分割し,それぞれで MCMC を回し,あとから結果を総合する.
不偏性 | 手法名 | 提案文献 |
---|---|---|
WASP | (Srivastava et al., 2015) | |
Consensus Monte Carlo | (Scott et al., 2016) | |
Monte Carlo Fusion | (Dai et al., 2019) |
2. Subsampling
尤度評価(全データが必要)を,リサンプリングに基づく不偏推定量で代用する.
不偏性 | 手法名 | 提案文献 |
---|---|---|
Stochastic Gadient MCMC | (Welling and Teh, 2011) | |
Zig-Zag with Subsampling | (Bierkens, Fearnhead, et al., 2019) | |
Stochastic Gradient PDMP | (Fearnhead et al., 2024) |
Zig-Zag サンプラーは,ジャンプ強度で尤度の情報を使う:U=-\log\pi \lambda_i(x,\theta)=\biggr(\theta_i\partial_iU(x)\biggl)_++\gamma_i(x,\theta_{-i}),\qquad i\in[d], 仮に,単一のサンプル k\in[n] から計算できる量 E_k^1(x) に関して \partial_iU(x)=\frac{1}{n}\sum_{k=1}^nE_i^k(x) が成り立つ場合,\partial_iU(x) を,[n]:=\{1,\cdots,n\} 上の一様サンプル K を用いて E_i^K(x),\qquad K\sim\mathrm{U}([n]) で不偏推定できる.
Bayes 推論の文脈では,負の対数尤度 U(x)=-\log\pi(x|\boldsymbol{y}) は U(x)=-\sum_{k=1}^n\log p(y_k|x)-\log p(x),\qquad\pi(x)\,\propto\,\left(\prod_{k=1}^np(y_k|x)\right)p(x), という表示を持つ.p(x) は事前分布,y_1,\cdots,y_k がデータ. E_i^k(x):=\frac{\partial }{\partial x_i}\biggr(-n\log p(y_k|x)-\log p(x)\biggl) と定めると, \partial_iU(x)=\mathbb{E}[E_i^K(x)]\qquad K\sim\mathrm{U}([n]).
そこで,ランダムに定まる強度関数 m^K_i(t):=\biggr(\theta\cdot E^K_i(x+\theta t)\biggl)_+,\qquad K\sim\mathrm{U}([n]), を用いて Zig-Zag 過程をシミュレーションすることを考える.
ただし, m_i^k(t)\le M_i(t) を満たす上界 M_i が存在すると仮定する.
ZZ-SS アルゴリズム
部分サンプリングにより不変分布が変わらないことの証明
ZZ-SS によってシミュレートされる過程は,レート関数 \lambda_i(x,\theta)=\mathbb{E}\biggl[\biggr(\theta_iE^K_i(x)\biggl)_+\biggr]=\frac{1}{n}\sum_{k=1}^n(\theta_iE^k_i(x))_+ を持った Zig-Zag 過程に等しい
これは,元々のレート関数 (\theta\partial_iU(x))_+ に対して, \gamma_i(x,\theta):=\frac{1}{n}\sum_{k=1}^n(\theta_iE^k_i(x))_+-\left(\frac{\theta_i}{n}\sum_{k=1}^nE^k_i(x)\right)_+\ge0. という項を加えて得る Zig-Zag サンプラーともみなすことができる.非負性は関数 (x)_+:=x\lor0 の凸性から従う.最後に \gamma_i(x,\theta)=\gamma_i(x,F_i(\theta)) を確認すれば良い.
これは \begin{align*} &\qquad\frac{1}{n}\sum_{k=1}^n\biggr(\theta_iE_i^k(x)\biggl)_+-\frac{1}{n}\sum_{k=1}^n\biggr(-\theta_iE_i^k(x)\biggl)_+\\ &=\frac{1}{n}\sum_{k=1}^n\left((\theta_iE_i^k(x))_+-(-\theta_iE_i^k(x))_+\right)=\frac{1}{n}\sum_{k=1}^n\theta_iE_i^k(x) \end{align*} であることから従う.
ランダムに定まる強度関数 m^K_i(t):=\biggr(\theta_iE^K_i(x+\theta t)\biggl)_+ に対して, \max_{k\in[n]}m^k_i(t)\le M_i(t) を満たす多項式関数 M_i を見つけないと,剪定ができず,事実上シミュレーションが不可能.
また,タイトな上界でないと,ほとんどの提案が棄却され,無駄な計算量が増してしまう.
命題 (Bierkens, Fearnhead, et al., 2019) (制御変数による上界の構成)
\partial_iU(x) は Lipschitz 定数 C_i を持って Lipschitz 連続であるとする.このとき, M_i(t):=a_i+b_it a_i:=(\theta_i\partial_iU(x_*))_++C_i\|x-x_*\|_p,\quad b_i:=C_id^{1/p} と定めれば,m_i^k\le M_i が成り立つ.ただし,ランダムな強度関数 m_i^k は次のように定めた: m^k_i(t):=\biggr(\theta E_i^k(x+\theta t)\biggl)_+,\qquad x_*:=\operatorname*{argmin}_{x\in\mathbb{R}^d}U(x), E^k_i(x):=\partial_iU(x_*)+\partial_iU^k(x)-\partial_iU^k(x_*).
事前処理により,事後最頻値 \widehat{x} に十分近いように参照点 x_* を選ぶ
その後は データのサイズに依存しない O(1) 計算複雑性で事後分布からの正確なサンプリングが可能
preprocessing for ZZ-CV
この2つはいずれも O(n) の複雑性で実行できる.
データは1次元で,分散 \sigma^2 が既知な正規分布に従うとする: Y^j\overset{\text{i.i.d.}}{\sim}\mathrm{N}(x_0,\sigma^2),\qquad j\in[n]. 事前分布を \mathrm{N}(0,\rho^2) とすると,定数の違いを除いて \begin{align*} U'(x)&=\frac{x}{\rho^2}+\frac{1}{\sigma^2}\sum_{j=1}^n(x-y^j)=\frac{x}{\rho^2}+\frac{n}{\sigma^2}(x-\overline{y}), \end{align*} であるから,U' は非有界であり,簡単な上界が見つからない.しかし, U''(x)=\frac{1}{\rho^2}+\frac{n}{\sigma^2}. は有界だから,U' は \|U''\|_\infty を Lipschitz 定数として Lipscthiz 連続である.
同じ長さの軌跡+同数のサンプルを用いて,事後平均推定量により x_0 を推定した場合の平均自乗誤差は次の通り:
単位計算量 (epoch):「データ n を通じた勾配の計算」を1単位とする
揃えて比較すると,たしかに効率が改善されている:
データ数 n\to\infty の極限で,事後分布は最頻値 \widehat{x} の周りに集中するため
事前処理により参照点 x_* を \|x_*-\widehat{x}\|_p=O(n^{-1/2})\quad(n\to\infty) 程度の正確性で得られたならば, \|x-x_*\|_p=O_p(n^{-1/2}),\quad\partial_iU(x_*)=O_p(n^{1/2})\quad(n\to\infty) が成り立つ.このことより, M_i(t)=a_i+b_it=O_p(n^{1/2})\quad(n\to\infty) であるが,Zig-Zag 過程は O(n^{-1/2}) のタイムステップで区切って独立なサンプルとみなせるため,総じて独立なサンプルを得るための計算量は O(1).
不均衡データに対する Gibbs サンプラーは収束が無際限に遅くなるが,Zig-Zag サンプラーでは簡単なトリックで克服できる.
\operatorname{P}[Y=1\,|\,X,\xi]=\frac{1}{1+\exp(-X^\top\xi)}
の,事前分布 p_0(\xi)d\xi とデータ \{(x^i,y^i)\}_{i=1}^n に対する事後分布 \pi は次のように表せる:
\pi(\xi)\,\propto\,p_0(\xi)\prod_{i=1}^n\frac{\exp(y^i(x^i)^\top\xi)}{1+\exp((x^i)^\top\xi)}.
\pi は正規分布の Pólya-Gamma 複合としての構造を持つ
データ拡張による Gibbs サンプラー (Polson et al., 2013) によりサンプリング可能.
\begin{align*} U(\xi)&:=-\log p_0(\xi)-\sum_{i=1}^n\log\left(\frac{\exp(y^i(x^i)^\top\xi)}{1+\exp((x^i)^\top\xi)}\right)=:U_0(\xi)+U_1(\xi) \end{align*}
U_1(\xi)=\frac{1}{n}\sum_{j=1}^nU^j_1(\xi),\qquad U_1^j(\xi)=-n\log\left(\frac{\exp\left(y^j(x^j)^\top\xi\right)}{1+\exp\left((x^j)^\top\xi\right)}\right), \partial_iU^j_1(\xi)=n\frac{x^j_i\exp\left((x^j)^\top\xi\right)}{1+\exp\left((x^j)^\top\xi\right)}-ny^jx^j_i<nx^j_i(1-y^j). \therefore\qquad\lvert\partial_iU^j_1(\xi)\rvert\le n\max_{j\in[n]}\lvert x^j_i\rvert\qquad i\in[d].
同じ上界を用いたサブサンプリング ZZ-SS と ZZ-CV も考えられる.
Zig-Zag 過程 (Z_t)_{t\in[0,T]} から B 個のサンプル X_1,\cdots,X_B を生成して,関数 h\in\mathcal{L}^2(\pi) の期待値 \displaystyle(\pi|h)=\int_0^Th(x)\,\pi(dx) を推定したとする.この際 \widehat{\operatorname{ESS}}:=T\frac{\widehat{\mathrm{V}_\pi[h]}}{\widehat{\sigma^2_h}} \widehat{\mathrm{V}_\pi[h]}:=\frac{1}{T}\int^T_0h(X_s)^2\,ds-\left(\frac{1}{T}\int^T_0h(X_s)\,ds\right)^2, \widehat{\sigma^2_h}:=\frac{1}{B-1}\sum_{i=1}^B(Y_i-\overline{Y})^2,\qquad Y_i:=\sqrt{\frac{B}{T}}\int^{\frac{iT}{B}}_{\frac{(i-1)T}{B}}h(X_s)\,ds. によって推定できる.
ロジスティック回帰において, \sum_{j=1}^ny^j\ll n が成り立つ状況下では,Pólya-Gamma 複合に基づく Gibbs サンプラーの収束が,n\to\infty の極限で際限なく遅くなる.
これは事後分布が最頻値の周りに集中する速度が,不均衡な n\to\infty 極限では変化するためである.
通常の極限 | 不均衡極限 | |
---|---|---|
事後分布 | n^{-1/2} | (\log n)^{-1} |
提案分布 | n^{-1/2} | n^{-1/2} |
\sum_{i=1}^ny^i=1,\qquad n\to\infty, の「不均衡極限」または Infinitely Imbalanced Limit (Owen, 2007) において,集中のオーダーが変わってしまう.
Pólya-Gamma 複合に基づく Gibbs サンプラー
提案のステップサイズが,事後分布のスケールに比べて小さすぎる.
制御変数に基づく Zig-Zag サンプラー (ZZ-CV)
レート関数 m_i の上界 M_i の評価がズレることで効率が下がっていく.
後者は単に M_i の設計不良の問題で,挽回可能!1
一様でないサブサンプリング を導入することで,Zig-Zag サンプラーを不均衡データにも強くできる.(そもそも汎用的な効率化手法である.)
サブサンプリングによりランダム化された強度関数 m_i^K(t)=\biggr(\theta_iE^K_i(x+\theta t)\biggl)_+ は,真の勾配 \partial_iU(\xi) に対する不偏性 \mathbb{E}\biggl[E^K_i(\xi)\biggr]=\partial_iU(\xi) を満たす限り,一様なサブサンプリング K\sim\mathrm{U}([n]) に限る必要はなかったのである.
(p_x) をある [n] 上の分布 \nu\in\mathcal{P}([n]) の質量関数として E^j_i(\xi):=\frac{1}{p_j}\partial_iU^j(\xi)\qquad j\in[n] と定めると, \partial_iU(\xi)=\sum_{j=1}^np_jE_i^j(\xi)=\mathbb{E}[E_i^J]. このリスケーリングした勾配の推定量 E_i^1,\cdots,E_i^n に対して,大域的な上界は \lvert E_i^j(\xi)\rvert\le\max_{j\in[n]}\frac{\lvert x_i^j\rvert}{p_j} に変わる.以前の評価 \displaystyle\partial_iU^j\le n\max_{j\in[n]}\lvert x^j_i\rvert (3.2) は,p_j\equiv1/n の場合に当たる.
この一般化により, \lvert E_i^j(\xi)\rvert\le\max_{j\in[n]}\frac{\lvert x_i^j\rvert}{p_j} の右辺を確率分布 \nu=(p_j)\in\mathcal{P}([n]) に関して最適化することで,ZZ-SS よりタイトな上界を得る.具体的には p_j\,\propto\,\lvert x^j_i\rvert と取れば良い (ZZ-IS).
\xi_0=1 を真値とし,次のように生成した1次元データを考える: X^j\overset{\text{i.i.d.}}{\sim}(1-\alpha)\delta_0+\alpha\mathrm{N}(1,2), \mathbb{P}[Y^j=1]=\frac{1}{1+e^{-X^j}}.
予想
拡散様の振る舞い (diffusive behaviour) がないために,従来法より収束レートが改善する.
従来法に比べ,
確定的な動きが対称性を壊す
状態空間のより効率的な探索が可能.
バイアスのない部分サンプリングが可能
p そのものではなく,\partial_i\log p の値のみ使うため.
効率的な Poisson 剪定アルゴリズムさえ見つかれば,(理論的には)どんな U=-\log\pi に対しても効率的な実行が可能
2を今まで詳しく見てきた.本節では1を考察する.
対象分布:標準 Cauchy 分布 f(x)=\frac{1}{\pi\sigma}\frac{1}{1+\left(\frac{x-\mu}{\sigma}\right)^2}
忘却=スタート地点をすぐに忘れるかどうか: \|P^t(x,-)-P^t(y,-)\|_\mathrm{TV}\xrightarrow{t\to\infty}0.
Diffusive Behaviour
自由度 \nu の t-分布 \mathrm{t}(\nu) に対して,
Zig-Zag Sampler (Giorgos Vasdekis and Roberts, 2022) \left\|P^t\left((x,\theta),-\right)-\mathrm{t}(\nu)\right\|_\mathrm{TV}\le\frac{C_1V_1(x)}{t^k},\qquad k<\nu.
Metropolis-adjusted Langevin Algorithm (Jarner and Tweedie, 2003) \left\|P^t\left(x,-\right)-\mathrm{t}(\nu)\right\|_\mathrm{TV}\le\frac{C_2V_2(x)}{t^k},\qquad k<\frac{\nu}{2}. 参考:\mathrm{t}(\nu)\Rightarrow\mathrm{N}(0,1)\;(\nu\to\infty).
状態空間を E'=\bigcup_{\theta\in\{\pm1\}^d}\mathbb{R}^d\times\{\theta\} と取ると,Zig-Zag 過程のジャンプは,レート関数 \lambda(x,\theta):=\sum_{i=1}^d\lambda_i(x,\theta) が定める強度 M(t):=\lambda(x+t\theta,\theta) を持った \mathbb{R}_+ 上の非一様 Poisson 点過程に従う.
この E' 上の点過程上で,次の確率核 Q に従ってジャンプするとみれる: Q((x,\theta),-):=\sum_{i=1}^d\frac{\lambda_i(x,\theta)}{\lambda(x,\theta)}\delta_{(x,F_i(\theta))}(-)
証明(2つの定義の等価性)
Zig-Zag 過程に対する2つの定義を与えたが,これら2つが同分布の過程を定めることは証明が必要である.
まず,\min_{i\in[d]}T_i が,強度関数 M が定める到着時刻に同分布であることを示す.
各 T_i の密度は p_i(t)=m_i(t)e^{-M_i(t)}1_{(0,\infty)}(t) で与えられ,T_i は互いに独立だから,(T_1,\cdots,T_d) の結合密度もわかる.
T_1,\cdots,T_d を昇順に並べた順序統計量を T_{(1)}\le\cdots\le T_{(d)} で表すとする.この d 次元確率ベクトルの密度 p は, p(t_1,\cdots,t_d)=1_{\left\{t_1\le\cdots\le t_d\right\}}(t_1,\cdots,t_d)\left(\sum_{\sigma\in\mathfrak{S}_d}\prod_{i=1}^dm_i(t_{\sigma(i)})e^{-M_i(t_{\sigma(i)})}\right) と計算できる.
この p を t_2,\cdots,t_d に関して積分することで,T_1 の密度が得られる:1 \begin{align*} p_{(1)}(t)&=\int_{(0,\infty)^{d-1}}p(t_1,\cdots,t_d)\,dt_2\cdots dt_d\\ &=\biggr(\sum_{i=1}^dm_i(t_1)\biggl)\exp\left(-\sum_{i=1}^dM_i(t_1)\right)=m(t_1)e^{-M(t_1)}. \end{align*}
これは確かに,強度関数 m が定める到着時刻の密度である.
続いて,j=\operatorname*{argmin}_{i\in[d]}T_i の,\min_{i\in[d]}T_i に関する条件付き確率質量関数が q(i|t)=\frac{m_i(t)}{\sum_{i=1}^dm_i(t)} であることを示す.
そのためには,任意の i\in[d] と A\in\mathcal{B}(\mathbb{R}^+) とに関して \left\{T_{(1)}\in A,T_{(1)}=T_i\right\} という形の事象を計算し,密度が積の形で与えられることを見れば良い.
\begin{align*} &\qquad\operatorname{P}[T_{(1)}\in A,T_{(1)}=T_i]\\ &=\operatorname{P}[T_i\in A,\forall_{j\ne i}\;T_i\le T_j]\\ &=\int_Ap_i(t_i)\,dt_i\left(\sum_{\sigma\in\mathrm{Aut}([d]\setminus\{i\})}\int^\infty_{t_i}p_{\sigma(1)}(t_{\sigma(1)})\,dt_{\sigma(1)}\int^\infty_{t_{\sigma(1)}}p_{\sigma(2)}(t_{\sigma(2)})\,dt_{\sigma(2)}\cdots\int^\infty_{t_{\sigma(d-1)}}p_{\sigma(d)}(t_{\sigma(d)})\,dt_{\sigma(d)}\right)\\ &=\int_Am_i(t_i)\exp\left(-\sum_{i=1}^dm_i(t_i)\right)\,dt_i\\ &=\int_A\frac{m_i(t_i)}{m(t_i)}m(t_i)e^{-M(t_i)}\,dt_i. \end{align*}
よって,\min_{i\in[d]}T_i と \operatorname*{argmin}_{i\in[d]}T_i とに関する結合密度は,2 q(i|t)p_{(1)}(t) という積の形で与えられることがわかった.
まとめ
1が2に等価であることがわかった.
この定式化の下では,(Davis, 1993) により 拡張生成作用素の形 が一般的な設定で調べられている:C^1(E)\subset\mathcal{D}(\widehat{L}) かつ \widehat{L}f(x,\theta)=\theta\cdot D_xf(x,\theta)+\lambda(x,\theta)\biggr(f(x,-\theta)-f(x,\theta)\biggl).
拡散項がジャンプ項になっただけで,従来の MCMC の解析に用いたエルゴード定理がそのまま使える.
U\in C^3(\mathbb{R}^d) は次を満たすとする:
このとき,Zig-Zag 過程は指数エルゴード性を持つ: \left\|P^t((x,\theta),-)-\pi\right\|_\mathrm{TV}\le V(x,\theta)e^{-ct},\qquad t\ge0,(x,\theta)\in E.
\pi の分布の裾が指数よりも重い場合などは条件1を満たさない.
例 : \displaystyle\qquad\quad U(x)=x^\alpha\qquad(0<\alpha<1)
命題(確率測度の差の全変動の表示)
任意の可測空間 (E,\mathcal{E}) 上の任意の確率測度 \mu,\nu\in\mathcal{P}(E) について, \|\mu-\nu\|_\mathrm{TV}=2\max_{A\in\mathcal{E}}\biggr(\mu(A)-\nu(A)\biggl).
たとえば A を半径 t\sqrt{d} の閉球 B_{t\sqrt{d}} の補集合 B_{t\sqrt{d}}^\complement と取ると,時刻 t に B_{t\sqrt{d}}^\complement に到着する確率は 0 だから, \left\|P^t\left((x,\theta),-\right)-\pi\right\|_\mathrm{TV}\ge\pi(B_{t\sqrt{d}}^\complement),\qquad t\ge0. \pi の裾確率が指数よりも遅い場合,これは指数エルゴード性に矛盾する.
ダイナミクス
多様な動きを取り入れることで,高次元における収束を加速する
シミュレーション
Poisson 剪定さえ効率的に出来れば実行可能
一般的な処方箋を求める方向に研究が進んでいる