A Blog Entry on Bayesian Computation by an Applied Mathematician
$$
$$
\(\mathbb{R}^n\) 上の Langevin 拡散を考える: \[ dX_t=-\nabla V(X_t)\,dt+\sqrt{2\beta^{-1}}\,dB_t,\qquad X_0=x. \tag{1}\] ただし, \[ V(x)=O(\lvert x\rvert^{2k})\qquad(\lvert x\rvert\to\infty) \] の仮定をおく.\(k\ge1/2\) の場合,指数エルゴード的であるが,\(k<1/2\) の場合はそうではない.
\(k\in(0,1/2)\) の設定で,次の ergodic lower bound を示したい: \[ C_1\exp\left(c_1V(x)-c_2t^{\frac{k}{1-k}}\right)\le\|P_t(x,-)-\mu_*\|_\mathrm{TV} \tag{2}\] \[ \mu_*(dx)\,\propto\,e^{-\beta V(x)}dx \] この lower bound から,\(k\in(0,1/2)\) の場合,Langevin 過程 \(X\) が指数エルゴード的たり得ないことが従う.
式 (2) を示すためには,\(G(x):=e^{\kappa V(x)}\;(\kappa\in\mathbb{R})\) に対して, \[ \operatorname{E}_x[G(X_t)]\le g(x,t) \] を満たす関数 \(g\) を見つける必要がある (Hairer, 2021, pp. 34–35).
これは次の3ステップを辿る
- そもそも \(\operatorname{E}_x[G(X_t)]<\infty\) であることの証明(第 1 節).
- \(G\) に関するドリフト条件 \(P_t\widehat{L}G\le C\varphi\circ G\) から,\(\operatorname{E}_x[G(X_t)]\) の \(t\) に関する微分不等式を導く(第 2 節).
- 微分不等式から,Gronwall の補題より,結論を得る(第 3 節).
1 \(G=e^{\kappa V}\) の可積分性について
1.1 はじめに
Markov 過程 \(X\) に関するドリフト条件 \[ \widehat{L}V\le-C\varphi\circ V\qquad\mathrm{on}\;\mathbb{R}^n\setminus K \] からは \(V:E\to\mathbb{R}_+\) の可積分性が出る: \[ \operatorname{E}_x[V(X_t)]<\infty\qquad t\ge0. \]
しかし,lower bound を得たい場合, \[ \widehat{L}V\le C\varphi\circ G\qquad\mathrm{on}\;\mathbb{R}^n \tag{3}\] という情報のみから, \[ \operatorname{E}_x[G(X_t)]\le g(x,t)\;(<\infty) \] という評価を得る必要が出てくる.この場合,\(\operatorname{E}_x[G(X_t)]<\infty\) は非自明で,ケースバイケースの議論がである.
1.2 OU 過程の場合
An overdamped Langevin dynamics on \(\mathbb{R}\) is defined as the solution to the following SDE: \[ dX_t=-\nabla V(X_t)\,dt+\sqrt{2\beta^{-1}}\,dB_t,\qquad X_0=x_0. \]
If \(V(x)=\frac{x^2}{2}\), \(X\) becomes an Ornstein-Uhlenbeck process. Transforming via \(f(t,x)=xe^t\) and using Itô’s formula, we get \[ X_t=x_0e^{-t}+\sqrt{2\beta^{-1}}\int^t_0e^{-(t-s)}\,dB_s. \] Hence, \(X\) is a Gaussian process with \(X_t\sim\mathrm{N}\left(x_0e^{-t},\beta^{-1}(1-e^{-2t})\right)\).
In this case, expectation with respect to \(G(y)=e^{\kappa V(y)}=e^{\frac{\kappa y^2}{2}}\;(\kappa\in\mathbb{R})\) is given by
\[\begin{align*} \operatorname{E}_x[G(X_t)]&=\int_{\mathbb{R}} G(y)\frac{1}{\sqrt{2\pi\beta^{-1}(1-e^{-2t})}}\exp\left(-\frac{(y-xe^{-t})^2}{2\beta^{-1}(1-e^{-2t})}\right)\,dy\\ &=\frac{1}{\sqrt{2\pi\beta^{-1}(1-e^{-2t})}}\int_{\mathbb{R}}\exp\left(\frac{\kappa\beta^{-1}(1-e^{-2t})y^2-(y-xe^{-t})^2}{2\beta^{-1}(1-e^{-2t})}\right)\,dy. \end{align*}\]
Taking a closer look at the numerator inside \(\exp\),
\[\begin{align*} &\qquad\kappa\beta^{-1}(1-e^{-2t})y^2-(y-xe^{-t})^2\\ &=y^2\biggr(\kappa\beta^{-1}(1-e^{-2t})-1\biggl)-2xe^{-t}y+x^2e^{-2t}. \end{align*}\]
Therefore, we conclude \[ \operatorname{E}_x[G(X_t)]<\infty\quad\Leftrightarrow\quad\kappa\beta^{-1}(1-e^{-2t})<1. \] In other words, \(P_tG(x)\) is finite as long as \[ t<-\frac{1}{2}\log\left(1-\frac{\beta}{\kappa}\right). \]
1.3 Bessel 過程の場合
\(V=a\log x\) ととると,\(V'(x)=\frac{a}{x}\) であるから,これに関する Langevin 動力学は,\(\beta=1\) のとき, \[ dX_t=-\frac{a}{X_t}\,dt+dB_t \] と,母数 \(a\) を持つ Bessel 過程になる.ただし,\(0\) への到着時刻 \(T_0\) で止めたもの \(X^{T_0}\) を考える.
この結果は (Lawler, 2019, p. 59) をみる限り,修正 Bessel 関数と,Bessel 過程の Fokker-Planck 方程式との考察によって証明されている.
\[ G(y)=e^{\kappa V(y)}=e^{a\kappa\log(y)}=y^{a\kappa} \] であるから,密度 \(q_t(x,y;a)\) に対してはどうやっても可積分である.
1.4 \(k<1/2\) の場合の尾部確率
\(k<1/2\) で最も大きく変わる点は, \[ \nabla V(x)=O(\lvert x\rvert^{2k-1})\qquad(\lvert x\rvert\to\infty) \] であるために,\(\nabla V\) が \(\mathbb{R}^n\) 上で有界になることである.
このため,一般に SDE \[ dZ_t=b(Z_t)\,dt+\sigma(X_t)\,dB_t \] の密度が,任意の \(T>0\) に対して,ある \(A_T,a_T>a\) と \(y\in\mathbb{R}\) が存在して \[ \frac{1}{A_T\sqrt{2\pi t}}e^{-\frac{a_T\lvert y-x\rvert^2}{2t}}\le p_t(x,y)\le\frac{A_T}{\sqrt{2\pi t}}e^{-\frac{\lvert y-x\rvert^2}{2a_Tt}} \] \[ t\in(0,T] \] が成り立つことが使える.1
これによれば, \[ G(x)=e^{\kappa V(x)}=O(e^{\kappa\lvert x\rvert^{2k}})\quad(\lvert x\rvert\to\infty) \] に対して \(p_t\) の尾部が勝つため,\(P_tG(x)<\infty\) である.
1.5 \(k<1/2\) の場合の \(G\) の可積分性
\(k<1/2\) の場合,式 (1) のドリフト係数が有界になる.このことから,\(G\) の可積分性が,\(X_t\) の密度の考察に依らず次のように導ける.
\[ M:=\max_{x\in\mathbb{R}^n}\nabla V(x) \] と定める.\(V(x)=O(\lvert x\rvert^{2k})\;(\lvert x\rvert\to\infty)\) より,ある \(C>0\) が存在して, \[ V(x)\le C\lvert x\rvert^{2k}\qquad\mathrm{on}\;\mathbb{R}^n. \] \[\begin{align*} \lvert X_t\rvert&\le\int^t_0\lvert\nabla V(X_t)\rvert\,dt+\sqrt{2\beta^{-1}}\lvert B_t\rvert\\ &\le Mt+\sqrt{2\beta^{-1}}\lvert B_t\rvert \end{align*}\] より, \[\begin{align*} \operatorname{E}_x[\lvert G(X_t)\rvert]&\le\operatorname{E}_x\left[e^{\kappa V(\lvert X_t\rvert)}\right]\\ &\le\operatorname{E}_x\left[\exp\biggr(\kappa V(M_t+\sqrt{2\beta^{-1}\lvert B_t\rvert})\biggl)\right]\\ &\le e^{\kappa\lvert Mt\rvert^{2k}}\operatorname{E}_x\left[e^{\kappa 2^k\beta^{-k}\lvert B_t\rvert^{2k}}\right]<\infty. \end{align*}\]
2 微分と拡張生成作用素の関係
\((X_t)\) を \(E=\mathbb{R}^n\) 上の Feller-Dynkin 過程,\((P_t)\) をその遷移半群,\(\widehat{L}\) をその拡張生成作用素とする.
これは,通常の意味での生成作用素 \(L\) の性質 \[ \frac{\partial }{\partial t}P_tG=P_t(LG) \] が,可積分性の条件の下で,拡張生成作用素 \(\widehat{L}\) にも引き継がれると理解できる.
3 下界の導出
元来の目的である下界の導出のためには, \[ \operatorname{E}_x[G(X_t)]\le CG(x)\exp\left(ct^{\frac{k}{1-k}}\right) \] という評価を得る必要がある.Gronwall の不等式を用いれば,導関数に関する不等式 \[ \frac{\partial }{\partial t}\operatorname{E}_x[G(X_t)]\le\operatorname{E}_x[\widehat{L}G(X_t)]\le C\operatorname{E}_x[\varphi\circ G(X_t)] \] があれば十分である.この導関数に関する不等式は,命題 2 とドリフト条件 (3) \[ \widehat{L}G\le C\varphi\circ G \] を併せることで, \[ \frac{\partial }{\partial t}\operatorname{E}_x[G(X_t)]=\operatorname{E}_x[\widehat{L}G(X_t)]\le C\operatorname{E}_x[\varphi\circ G(X_t)] \] より得る.
4 参考文献
Footnotes
(Kohatsu-Higa et al., 2022) で最初に知った.特に (Kohatsu-Higa, 2003) は詳しく扱っており,上からの評価は Malliavin 解析から得られる (Taniguchi, 1985).同様にして熱方程式の基本解としても捉えられるが.↩︎
元々はある正の定数 \(C>0\) が存在して,\(\widehat{L}G\le CG\).ある凹関数 \(\varphi\) について \(\widehat{L}G\le\varphi\circ G\) が成り立つならばこの仮定は満たされることに注意,としていた.↩︎
\(\sup_{t\in[0,T]}\widehat{L}G(X_t)\) は可積分とは限らないため,\(\sup\) を期待値の中に入れることはできない.Hölder の不等式により,これを迂回できる.↩︎
(杉浦光夫, 1980, p. 311) 定理13.7系では,\(f_n\) に \(C^1\)-級の仮定を置いて,この場合は \(f\) が \(C^1\)-級になることを導いている.↩︎