確率核という概念

データ解析の営みを確率空間の圏上で理解する

Probability
Kernel
Process
Functional Analysis
P(X)
Author

司馬博文

Published

3/24/2024

Modified

8/15/2024

概要
確率核という概念は現状あまりポピュラーではないと思われるが,数学的にいえば,Markov 過程論,確率論,さらにはデータ解析の中心に据えられるべき中心概念であると言えるかもしれない.例えば,カーネル法とは確率核に沿った埋め込みである.MCMC の性質も,本質的に確率核の性質が決定する.また確率核は,確率空間の圏の射となる.
このように,多くのデータ解析手法の中核に位置する数学的本体たる「確率核」への入門を目指すのが本記事である.

1 はじめに

確率核 \(P\) こそが Markov 連鎖の数学的本体である.

1.1 確率核:Markov 連鎖の本体

\((E,\mathcal{E}),(F,\mathcal{F})\) を可測空間とする.確率核とは関数 \(E\to\mathcal{P}(F)\) のことをいう(ほとんどの場合可測になる:第 3.1 節).ただし,\(\mathcal{P}(F)\)\(F\) 上の確率測度全体の集合とした.

多くの場合,\(\mathcal{P}(E)\) は Banach 空間内の \(w^*\)-閉な凸集合になっている.このことが,最終的に カーネルトリック の基となる.

\(E\) 上の確率核 \(P:E\to\mathcal{P}(E)\) が定まると,任意のスタート地点 \(x\in E\) に対して,これを起点とする Markov 連鎖 \(\{X^x_n\}_{n=0}^\infty\subset\mathcal{L}(\Omega)\) が構成できる.

ここで,確率変数 \(X^x_n\) を定義するために謎の標本空間 \((\Omega,\mathcal{F},\operatorname{P})\) が出てきた.これは数学的に確率変数を定義するために必要であるが,ご存知の通り \(\Omega\) の性質が問題になる場面はほとんどない,純粋に形式的な存在である.一方で数学的な本体は核 \(P\) なのである.まさに「核」.

Markov 連鎖の実体は分布であるが,これは確率核 \(P\) を用いて \(\{(P^*)^n\delta_x\}_{n=0}^\infty\subset\mathcal{P}(E)\) と表せる: \[ X^x_n\sim (P^*)^n\delta_x,\qquad n\in\mathbb{N}. \] \((P^*)^n\) は第 2.3 節参照.\(\delta_x\)\(x\in E\) 上のデルタ測度である.

1.2 次元を上げてランダムネスを消す

ここで,\(X^x_n\) 自体は確率変数であり,ランダムな存在である.これを捉えるために測度論が必要だったのである.特に確率過程の議論に必要な測度論は大変込み入っている.

しかし分布 \((P^*)^n\delta_x\) は空間 \(\mathcal{P}(E)\) 上の点であり,全体として \(\mathcal{P}(E)\) 上の(確定的な)力学系を定めている.ランダムネスが消えているのである!

ただしその代わり,例え \(E=\mathbb{R}^d\) であっても,\(\mathcal{P}(E)\) は無限次元空間になっている.

Newton 力学が扱う運動は結局,\(\mathbb{R}^n\) など有限次元空間上の幾何学に帰着する.1

一方で確率的な系は,確率核 \(P\) を通じて,無限次元空間 \(\mathcal{P}(E)\) 上の幾何学に帰着するのである.時代は情報幾何学である.2

1.3 \(\mathcal{P}(E)\) 上の幾何学を構築する試み

\(\mathcal{P}(E)\) が無限次元と言えど,一度同じく「力学系」に帰着してしまえば,その数学的な大枠は共通するはずである.

まず,物理学で重要な幾何学的原理として,変分原理がある.これは,空間上に自由エネルギーや作用などの汎函数を定義して,これを最小化するものとしてダイナミクスを理解する方法である.

実際,モンテカルロ法が定める \(\mathcal{P}(E)\) 上の力学系を,勾配流として理解することが進んでいる (Jordan et al., 1998), (Chopin et al., 2023)

最適輸送の名前の下で,\(\mathcal{P}(E)\) の幾何学を考慮したサンプリング法の開発も進んでいる.

エルゴード理論において,多くの基本的な力学系(減衰振動など)は指数収束をするが,同様にして多くの基本的な Markov 核も指数収束をする.

1.4 確率核が数学的に重要な理由

確率核を確率空間の射とみる見方(第 2.1 節)が急速に浸透しており,これは Markov 圏 の概念にも後押しされて急速に浸透しつつある.

Markov 圏は確率論,情報理論,統計学,因果推論に散らばっている基本的な概念に対して,統一的に形式的な定義を与える枠組みとして期待されている.

例えば,「エントロピー」は情報源や通信路が「決定論的」な状態からどれほどかけ離れているか?の指標として特徴付けることができるという (Perrone, 2024)

また Markov 圏上で一般化された形で,Kolmogorov や Hewitt-Savage の 0-1 法則,Blackwell の定理,エルゴード分解定理などが,純粋に代数的に証明されているという (Perrone, 2024)

この独立性の代数・図式的な特徴付けは,確率的グラフィカルモデル の分野の結果,(Hammersley and Clifford, 1971) の定理などと重なる部分も多い.

だが,確率核の概念は,純粋に数学的な文献を除いてまだあまりポピュラーな概念であるとは言えないのが現状であろう.

1.5 カーネル法でいう「カーネル」も確率核

実際,カーネル法でいう「カーネル関数」も,(いつでも RBF カーネル のように確率核になるとは限らないが)核の一種である.

3.1 節で説明するように,核とは可測写像 \(K:E\to\mathcal{S}(F)\) でもある.ただし,\(\mathcal{S}(F)\) は符号付き測度の集合とした.

\(\mathcal{S}(F)\) は極めて大きい空間である.例えば \(F\) 上の \(\sigma\)-有限測度 \(\nu\in\mathcal{S}(F)\) を1つ定める毎に,Radon-Nikodym の定理により Banach 空間の同型 \[ L^1(\nu)\overset{\sim}{\to}\mathcal{S}^1(F)\hookrightarrow\mathcal{S}(F) \] が引き起こされる.

カーネル法 とは,核 \(K:E\to\mathcal{S}(F)\) に沿って \(E\) 上の点を \(\mathcal{S}(F)\) 上に埋め込む方法である.

さらに \(K\) が半正定値関数が定める変換であった場合,再生核 Hilbert 空間の理論により,\(\mathcal{S}(F)\) の部分空間として,内積が \(K\) の計算だけで効率的に計算できるようなものが選び出せる.

こうして,\(E\) 上のデータ解析を \(\mathcal{S}(F)\) 上に写す非線型対応を導く,数学的に統一された方法がカーネル法である(例 2.2 節も参照).

1.6 圏論についての補足

なお, という用語も,代数幾何と代数トポロジーから多くの数学分野へ浸透した感があるが,近年は純粋数学のコミュニティからも出つつあると感じられる.

「射」とは代数系の準同型の概念を一般化したものであり,「対象」と共に (category) という代数系の構成要素である.

一般にある対象とある射が圏をなすと言ったとき,その射は,対象の何らかの数学的構造を「保存」する働きを持つと理解される.例えば線型空間における線型写像,順序集合における単調写像,多様体における可微分写像,群や環における準同型が,それぞれの圏における「射」にあたる.

一方で,可測空間や確率空間で可測写像を射に取ると,壊滅的に実りのない圏ができる.一体どうしてだろうか?

1.7 圏論と現代数学

数学的対象を中心に据えて数学を整理した Bourbaki が現代数学の始まりであるという共通認識は一定に確立されている.

しかし近年,実は射の方が重要な対象なのではないか,という共通了解もできつつある:

余談だが、homomorphism の訳語として、準同形ということばが定着している。これは、同形もどきという意味だから、同形がだいじというブルバキの思想を反映したものといえよう。射のほうが基本的という、より現代的な視点にはそぐわないが、いまさら変えることもできないだろう。(斎藤毅, 2010)

例えば距離空間の射には選択の余地がある.連続関数を取るか,一様連続写像と取るか,非拡大写像を取るかで,圏の振る舞いは全て違う.連続写像と取った場合は,位相空間の圏の充満部分圏になる.つまり,位相構造以外の構造は無理される.一様連続写像を取ると,完備性も見るようになる.非拡大写像を取ると,距離構造の全てが保存されるようになる.

このようにして,Bourbaki は集合の上に構造を添加していく描像を数学に持ったが,現代的には射の選択によって構造を選択していると理解するのである.

1.8 圏論から見た「確率核」

ここで,確率空間の圏において,射を確率核に取ると,極めて豊かな構造を持った圏 \(\mathrm{Stoch}\) を得る.これは Markov category の1つとして調べられている.

すなわち,確率空間の実体は,その可測空間としての構造にはないと言うべきである.実際,測度論が確率論において頻出するにも拘らず極めて非本質的に感じられることは,統計を営むものである一定の一致を得るだろう.

この確率核と,これがなす圏の構造を調べることで,「確率空間」を「確率空間」たらしめるものは何か?が考えられている.この分野を綜合的確率論 (synthetic probability theory) という (Fritz, 2020)

1.9 関連ページ

2 核の定義と性質

2.1 定義

定義 (kernel, probability kernel / Markov kernel)

2つの可測空間 \((E,\mathcal{E}),(F,\mathcal{F})\) について,

  1. (非負) \(K:E\to F\) とは,関数 \(E\times\mathcal{F}\to[0,\infty]\) であって次の2条件を満たすものをいう:3

    1. 任意の \(x\in E\) に対して,\(K(x,-):\mathcal{F}\to[0,\infty]\) は測度を定める.4
    2. 任意の \(A\in\mathcal{F}\) に対して,\(K(-,A):E\to[0,\infty]\) は可測関数である.
  2. 更に (1) で \(K(x,F)=1\;(x\in E)\) も成り立つとき,これを Markov 核 または 確率核 という.5

  3. \(K:E\times\mathcal{F}\to[0,\infty]\)有界 であるとは,\(\sup_{x\in E}\|K(x,F)\|<\infty\) を満たすことをいう.6 すなわち,\(E\to M^1(F)\) が有界な像を持つことをいう.

  4. \(E\) が確率空間でもあるとき,核は ランダム測度 に等価である.7

核には積と呼ぶべき結合的な演算が定まる.

定義(核の合成と積)8

\(E,F,G\) を可測空間とする.

  1. \(S:F\to G\) に対して,合成 \(T\otimes S:E\to F\times G\)\[(T\otimes S)(x,A\times B):=\int_AT(x,dy)S(y,B),\qquad(x\in E,A\in\mathcal{F},B\in\mathcal{G}),\] で定める.
  2. \(TS:E\to G\)\[(TS)(x,B):=(T\otimes S)(x,F\times B)=\int_FT(x,dy)S(y,B),\qquad(x\in E,B\in\mathcal{G}),\] で定める.

核は積に関して結合的である:9 \[(RS)T=R(ST).\]

このことにより,確率空間を対象とし,確率核を射とする圏が定まることになる.これを \(\mathrm{Stoch}\) と呼ぼう.単位射は後述の \(K_{\mathrm{id}_E}\) が与える.

2.2 核の例

核は極めて多くの重要な概念を一般化し,統一的な見方を提供してくれる.

まずなんといっても,確率核は確率行列の無限次元への一般化と捉えられる:

確率行列としての確率核

\(E,F\) が有限集合であるとき,\(\mathcal{P}(E),\mathcal{P}(F)\) は行ベクトルの空間と見れる.

すると確率核は(行/右)確率行列 \(P\) と等価になる.

次節で定義する核の作用も,列ベクトル \(x_t\in\mathbb{R}^E\) と行ベクトル \(\mu_t\) に関する行列積と等価になる: \[ x_{t+1}=Px_t,\qquad \mu_{t+1}=\mu_t P. \]

さらに,正則な条件付き確率とは,条件付き確率 \(P:E\times\mathcal{F}\to[0,1]\) が確率核になることに他ならない:

正則条件付き確率は確率核10

\(Y\in\mathcal{L}(\Omega;E)\) を確率変数,\(\mathcal{G}\subset\mathcal{F}\) を部分 \(\sigma\)-代数とする. \(Y\)\(\mathcal{G}\)の下での 正則条件付き確率 とは,次を満たす確率核 \(\kappa_{Y,\mathcal{G}}:\Omega\times\mathcal{E}\to[0,1]\) をいう: \[ \kappa_{Y,\mathcal{G}}(\omega,B)=\operatorname{E}[1_{\left\{Y\in B\right\}}\mid\mathcal{G}](\omega)\;\operatorname{P}\text{-a.s.}\qquad B\in\mathcal{E}. \]

測度は退化した核である

測度とは一点集合からの核 \(\nu:\{*\}\to E\) と考えられる.すなわち,一点集合は圏 \(\mathrm{Stoch}\) の終対象である.

続いて,そもそも核は決定論的な対象も包含する概念であることを見る:

関数も退化した確率核である11

\(f:E\to F\) を関数とする.デルタ測度への埋め込み \(\delta:F\hookrightarrow\mathcal{P}(F)\) に沿って \(f\) は確率核 \(E\to\mathcal{P}(F)\) とみなせる: \[ K_f(x,-):=\delta_{f(x)}(-). \]

\(F=E,f=\mathrm{id}_E\) とした場合の \(K_f\)\(E\) の自己射である.

\(k:E\times E\to\mathbb{C}\) を半正定値関数とすると,(Moore, 1939) の定理から,ただ一つの再生核 Hilbert 空間 \(H\subset\mathbb{C}^E\) が存在して \(k\) を核に持つ.

このとき,特徴写像 \(\Phi:E\to H\) は関数である.理想的には全単射であり,カーネルトリック \[ (\Phi(x)|\Phi(y))=k(x,y) \] を通じて \(E\) 上のデータ解析を \(H\) 上に押し出す.

関数の積も核である

\(f,k:E\to\mathbb{R}\) を関数とする.

核を \(K(x,-):=k(x)\delta_x\) と定めると,\(K\) による作用とは \(k\) との積に一致する: \[ Kf(x)=\int_Ek(x)\delta_x(dy)f(y)=k(x)f(x). \]

これをさらに一般化すると,「核」の語源に辿り着く:

積分変換は核を定める12

\(\lambda\in\mathcal{M}(E)\) を測度,\(k\in\mathcal{L}(E\times E)\) を関数とする.このとき, \[ K(x,A):=\int_Ak(x,y)\lambda(dy),\qquad x\in E,A\in\mathcal{E}, \]\(E\) 上の(符号付き)核を定める.

すなわち,\(K\) が測度 \(\lambda\) に関して密度 \(k\) を持つとき,これを \(k\)積分核 とする基底 \(\lambda\) に関する積分変換という.

2.3 確率核の作用

確率核の作用13

核は写像 \(E\to\mathcal{M}(F)\) と見れるため,その全体は自然に実線型空間をなす.これを \(\mathrm{Hom}_\mathrm{Stoch}(E,F)\) と表す.

  1. 右作用 \(\mathcal{S}(E)\times\mathrm{Hom}_\mathrm{Stoch}(E,F)\to\mathcal{S}(E)\)\[(\mu T)(A):=\int_E\mu(dx)T(x,A),\qquad A\in\mathcal{F},\] で定める.

  2. 左作用 \(\mathrm{Hom}_\mathrm{Stoch}(E,F)\times\mathcal{L}(F)\to\mathcal{L}(E)\)\[(Tf)(x):=\int_FT(x,dy)f(y),\qquad x\in E,\] で定める.14

決定論的な確率核の作用

関数 \(f\) が定める核 \(K_f:E\to E\)\(\mathcal{L}(E)\)\(f\)前合成 として作用し,\(\mathcal{S}(E)\)\(f\) による 押し出し として作用する: \[ \begin{align*} K_fg(x)&=\int_F K_f(x,dy)g(y)=\int_F\delta_{f(x)}(dy)g(y)=g\circ f(x),\\ \mu K_f(A)&=\int_E\mu(dx)K_f(x,A)=\int_E\mu(dx)\delta_{f(x)}(A)\\ &=\mu(f^{-1}(A))=f_*\mu(A). \end{align*} \]

畳み込みは強 Feller 核である15

\(\pi\in\mathcal{M}(\mathbb{R}^d)\) を測度として,核 \(K\)\[ K(x,A):=(\pi*\delta_x)(A)=\int_{\mathbb{R}^d}\delta_x(A-y)\pi(dy) \] と定めると,\(K\) の右作用は測度同士の畳み込みを定める: \[ \begin{align*} Kf(x)&=\int_{\mathbb{R}^d}K(x,dz)f(z)=\int_{\mathbb{R}^d}\int_{\mathbb{R}^d}\delta_x(dz-y)\pi(dy)f(z)=\int_{\mathbb{R}^d}f(x+y)\pi(dy),\\ \mu K(A)&=\int_{\mathbb{R}^d}\mu(dx)K(x,A)=\int_{\mathbb{R}^d}\int_{\mathbb{R}^d}\mu(dx)\delta_x(A-y)\pi(dy)\\ &\hphantom{=\int_{\mathbb{R}^d}\mu(dx)K(x,A)}=\int_{\mathbb{R}^d}\mu(A-y)\pi(dy)=\pi*\mu(A). \end{align*} \]

実は畳み込み核は強 Feller である.すなわち,任意の有界可測関数 \(f\in\mathcal{L}_b(E)\) に対して,\(Kf\in C(E)\) は連続である.16

任意の \(x_1,x_2\in E\) について,\(f\in\mathcal{L}_b(E)\) であるから,有界収束定理より \[ \lvert Kf(x_1)-Kf(x_2)\rvert\le\int_E\lvert f(x_1+y)-f(x_2+y)\rvert\pi(dy)\xrightarrow{x_2\to x_1}0. \]

核の自己随伴性17

自然なペアリング \((-|-):\mathcal{S}(E)\times\mathcal{L}(F)\to[-\infty,\infty]\) に関して,核 \(T\) は(両辺が意味を持つ限り)自己随伴性を満たす: \[(\mu T|f)=(\mu|Tf).\]

また,\((MN)f=M(Nf)\) も成り立つ.

Fubini の定理より,次のように式変形できる: \[\begin{align*} (\mu|Pf)&=\int_EPf(x)\mu(dx)=\int_E\int_FP(x,dy)f(y)\mu(dx)\\ &=\int_F\int_E\mu(dx)P(x,dy)f(y)=\int_F\mu P(dy)f(y)=(\mu P|f). \end{align*}\]

確率核の2つの作用は,作用素として非拡大的である.ただし,\(\mathcal{L}_b(E)\) 上に一様ノルム,\(\mathcal{P}(E)\) 上に全変動ノルムを考えるとする:

確率核の作用の非拡大性18

\(P\) を確率核とする.

  1. 左作用 \(P:\mathcal{L}_b(E)\to\mathcal{L}_b(E)\) は非拡大写像を定める:\(\|Pf\|_\infty\le\|f\|_\infty\)
  2. 右作用 \(P^*:\mathcal{P}(E)\to \mathcal{P}(F)\) も非拡大写像を定める:\(\|\mu P\|_\mathrm{TV}\le\|\mu\|_\mathrm{TV}\)

\[\begin{align*} \sup_{x\in E}|Pf(x)|&=\sup_{x\in E}\left|\int_EP(x,dy)f(y)\right|\le\|f\|_\infty\sup_{x\in E}\int_EP(x,dy)=\|f\|_\infty. \end{align*}\]

3 確率核の特徴付け

3.1 関数としての確率核

\(F\) が可分距離空間であるとき,確率核とは本質的に可測関数 \(E\to\mathcal{P}(F)\) である.

核の関数としての可測性19

\(F\) を距離化可能とする.このとき,関数 \(E\times\mathcal{B}(F)\to[0,1]\) について,(2)\(\Rightarrow\)(1) が成り立ち,\(F\) が可分であるとき (1)\(\Rightarrow\)(2) も成り立ち,2つは同値になる:

  1. \(E\times\mathcal{B}(F)\to[0,1]\) は確率核である.
  2. \(E\to\mathcal{P}(F)\) は可測である.
  1. が成り立つとき, \[x\in E\mapsto\int_Ff(x,y)P(x,dy),\qquad f\in\mathcal{L}_b(E\times F)\] も可測である.
  • (2)\(\Rightarrow\)(1)

    \(\sigma[\{\mathrm{ev}_B\}_{B\in\mathcal{B}(F)}]\subset\mathcal{B}(F)\) が成り立つから,任意の \(B\in\mathcal{B}(F)\) について合成 \(P(-,B):E\to\mathcal{P}(F)\xrightarrow{\mathrm{ev}_B}[0,1]\) が可測.

  • (1)\(\Rightarrow\)(2)

    \(F\) が可分に距離化可能であるとき,\(\mathcal{B}(F)=\sigma[\{\mathrm{ev}_B\}_{B\in\mathcal{B}(F)}]\) が成り立つから,\(E\to\mathcal{P}(F)\) が可測であることは,任意の \(B\in\mathcal{B}(F)\) について合成 \(P(-,B):E\to\mathcal{P}(F)\xrightarrow{\mathrm{ev}_B}[0,1]\) が可測であることに同値.

3.2 作用素としての確率核

\(\mathcal{P}(E)\) を不変にする線型作用は確率核である20

\(E\) をPolish空間,\(T:\mathcal{S}^1(E)\to\mathcal{S}^1(E)\) を線型作用素で,\(T(\mathcal{P}(E))\subset\mathcal{P}(E)\) を満たすとする. このとき,ある確率核 \(P\) が存在して,\(T\) はその作用である: \[ T\mu(A)=\int_E P(x,A)\mu(dx). \]

さらに進んで,次が成り立つ:

核の作用の特徴付け21

\((E,\mathcal{E})\) を可測空間,\(K:\mathcal{L}(E)\to\mathcal{L}(E)\) を正な線型写像とする.このとき,次は同値:

  1. \(K\) はある核の作用である.
  2. 単調収束定理:任意の増加列 \(\{f_n\}\subset\mathcal{L}(E)_+\) に対して, \[ K\left(\lim_{n\to\infty}f_n\right)=\lim_{n\to\infty}Vf_n. \]

References

Ambrosio, L., Gigli, N., and Savaré, G. (2008). Gradient Flows: In Metric Spaces and in the Space of Probability Measures. Birkhäuser Basel.
Bass, R. (2011). Stochastic processes,Vol. 33. Cambridge University Press.
Bremaud, P. (2020). Probability theory and stochastic processes. Springer Cham.
Chopin, N., Crucinio, F. R., and Korba, A. (2023). A connection between tempering and entropic mirror descent.
Chopin, N., and Papaspiliopoulos, O. (2020). An introduction to sequential monte carlo. Springer Cham.
Crisan, D., and Doucet, A. (2002). A survey of convergence results on particle filtering methods for practitioners. IEEE Transactions on Signal Processing, 50(3), 736–746.
Del Moral, P. (2004). Feynman-kac formulae. Springer New York.
Dellacherie, C., and Meyer, P. A. (1988). Probabilities and potential c: Potential theory for discrete and continuous semigroups,Vol. 151. E;sevier Science Publishers B.V.
Fritz, T. (2020). A Synthetic Approach to Markov Kernels, Conditional Independence and Theorems on Sufficient Statistics. Advances in Mathematics, 370, 107239.
Gikhman, I. I., and Skorokhod, A. V. (2004). The theory of stochastic processes i. Springer Berlin, Heidelberg.
Hairer, M. (2018). Ergodic properties of markov processes.
Hairer, M. (2021). Convergence of markov processes.
Hammersley, J., and Clifford, P. (1971). Markov fields on finite graphs and lattices.
Jacod, J., and Shiryaev, A. N. (2003). Limit theorems for stochastic processes,Vol. 288. Springer Berlin, Heidelberg.
Jordan, R., Kinderlehrer, D., and Otto, F. (1998). The variational formulation of the fokker–planck equation. SIAM Journal on Mathematical Analysis, 29(1), 1–17.
Kallenberg, O. (2017). Random measures, theory and applications,Vol. 77. Springer Cham.
Klenke, A. (2020). Probability theory: A comprehensive course. Springer Cham.
Kolokoltsov, V. N. (2011). Markov processes, semigroups and generators,Vol. 38. De Gruyter.
Kulik, A. (2018). Ergodic behavior of markov processes: With applications to limit theorems,Vol. 67. De Gruyter: Berlin, Boston.
Le Gall, J.-F. (2016). Brownian motion, martingales, and stochastic calculus,Vol. 274. Springer Cham.
Moore, E. H. (1939). General analysis, part 2,Vol. 1. American Philosophical Society.
Perrone, P. (2024). Markov Categories and Entropy. IEEE Transactions on Information Theory, 70(3), 1671–1692.
Revuz, D. (1984). Markov chains,Vol. 11. North-Holland Publishing Company.
Revuz, D., and Yor, M. (1999). Continuous martingales and brownian motion. Springer Berlin, Heidelberg.
斎藤毅. (2010). 数学セミナー. In, pages 8–13. 日本評論社.
鎌谷研吾. (2021). マルコフ連鎖モンテカルロ法における平均回帰. 日本統計学会誌, 50(2), 381–402.

Footnotes

  1. Hamilton の定式化などを通じて,接束 \(T(\mathbb{R}^n)\) または余接束 \(T^*(\mathbb{R}^n)\) 上の幾何学に変換されるが,やはり有限次元である.↩︎

  2. ちょうど,非線型力学系において,Koopman 作用素を導入することで,扱う空間が無限次元になってしまう代わりに,ダイナミクスの線型性を回復することに似ている.非線型力学系を扱うにあたって,非線型性の除去が肝心であるように,確率的な系の分析において,ランダムネスを取り除くことが重要であったようだ.↩︎

  3. (Jacod and Shiryaev, 2003) p.65,(Kolokoltsov, 2011) 3.5節 p.110, (Klenke, 2020) 8.3節 p.204 では transition kernel,(Dellacherie and Meyer, 1988) p.1,(Revuz and Yor, 1999) 定義III.1.1.1 p.79,(Revuz, 1984) 定義1.1.1.1 p.8,(Kallenberg, 2017) p.16, (Bass, 2011) 定義19.2 p.154 では kernel と呼んでいる.↩︎

  4. (Revuz, 1984) 定義1.1.1.1 p.8 では符号付き測度であることを許しているが,我々はその場合は 符号付き核 と呼ぶこととしよう.↩︎

  5. (Crisan and Doucet, 2002) p.737 では Markov transition kernel,(Del Moral, 2004) p.9 では Markov kernel,(Kolokoltsov, 2011) 3.5節 p.110 では transition probability kernel or simply probability kernel と呼び,(Chopin and Papaspiliopoulos, 2020) 定義4.1 p.36, (Bremaud, 2020) 3.3.3節 p.135 では propability kernel,(Kulik, 2018) p.25 では probability kernel としてさらに半群性も満たす族を transition probability kernels と呼ぶ.(Le Gall, 2016) pp.151-152 は Markovian transition kernel と transition semigroup と呼ぶ.(Dellacherie and Meyer, 1988) p.2 は Markovian kernel.(Kallenberg, 2017) p.29 と (Hairer, 2021) では可測関数 \(E\to\mathcal{P}(F)\) と定義しており,transition kernel と呼んでしまう.↩︎

  6. (Dellacherie and Meyer, 1988) p.2,(Kolokoltsov, 2011) 3.5節 p.110.(Del Moral, 2004, p. 9) は (bounded) integral operator と呼ぶ.↩︎

  7. (Kolokoltsov, 2011, p. 110) 3.5節 も参照.↩︎

  8. (鎌谷研吾, 2021, p. 382) の呼称に一致.(Dellacherie and Meyer, 1988, p. 4) は composition,(Gikhman and Skorokhod, 2004, p. 76) 定理II.4.1 は畳み込みと呼ぶ.↩︎

  9. これは一般の符号付き核については成り立たない (Revuz, 1984, p. 12)↩︎

  10. (Jacod and Shiryaev, 2003, p. 65)(Klenke, 2020, p. 205) 8.3節.↩︎

  11. (Dellacherie and Meyer, 1988) 7 p.4,(Revuz, 1984, p. 9)(Revuz, 1984, p. 13) 演習1.13.↩︎

  12. (Dellacherie and Meyer, 1988, p. 5) 7,(Revuz, 1984, p. 9)(Dellacherie and Meyer, 1988, p. 2)↩︎

  13. 作用は (Hairer, 2021), (Kallenberg, 2017, p. 16), (Dellacherie and Meyer, 1988, pp. 2–3) が同様に定めている.最後の文献によると,この記法は Hunt によるものだという.\(T\otimes S\) の存在は (Gikhman and Skorokhod, 2004, p. 76) 定理II.4.1 で示されており,\(\otimes\)直積\(\cdot\)畳み込み と呼んでいる.↩︎

  14. これが \(\mathcal{E}\)-可測であることは,\(f\) の単関数近似を考えることで示せる (Dellacherie and Meyer, 1988, p. 2)↩︎

  15. (Revuz, 1984, p. 10).p.36 も参照.↩︎

  16. (Revuz, 1984, p. 36)(Revuz and Yor, 1999, p. 412)↩︎

  17. (1)は (Revuz, 1984, p. 9)(Dellacherie and Meyer, 1988, pp. 5 p.3),(2)は (Dellacherie and Meyer, 1988, pp. 7 p.4)↩︎

  18. (Revuz, 1984, p. 12)↩︎

  19. (Kallenberg, 2017, p. 30) 補題1.14 では Borel 空間について示している.(Hairer, 2021) ではあらかじめ (2) を定義としている.(Del Moral, 2004, p. 7) は最初からこれによって \(\sigma\)-代数を定義する.(Ambrosio et al., 2008, p. 121) も初めからこれを通じて,可分距離空間 \(Y\) に対する Borel 写像 \(X\to\cP(Y)\) を定義する.(3) は (Ambrosio et al., 2008, p. 121)↩︎

  20. (Hairer, 2018, p. 8) 演習2.34.↩︎

  21. (Revuz, 1984, p. 9) 命題1.3.↩︎