条件付き期待値の測度論的基礎付け

Probability
Author

司馬博文

Published

12/02/2023

Modified

1/10/2024

1 条件付き期待値の定義

条件付き期待値を,測度論から厳密に定義する際,ポイントは次の4点である.

ポイント
  1. 条件付き期待値は \(\sigma\)-代数 \(\mathcal{G}\) に対して \(\operatorname{E}[X|\mathcal{G}]\) の形で(\(\Omega\) 上殆ど至る所)定義される確率変数である( 節 1.1 ).
  2. \(\operatorname{E}[X|Y]\) というのは,\(\operatorname{E}[X|\sigma(Y)]\) の略記である( 節 1.2 ).
  3. \(\operatorname{E}[X|Y=y]\) というのは,\(\operatorname{E}[X|\sigma(Y)](Y^{-1}(y))\) のことである( 節 1.2 ).
  4. \(X\in L^2(\Omega)\) でもあるとき,\(\operatorname{E}[X|\mathcal{F}]\)\(X\)\(L^2(\Omega)\)-距離で最も近いような \(\mathcal{F}\)-可測確率変数である( 節 1.3 ).
  5. 条件付き確率は \(\operatorname{P}[Y\in B|X]:=\operatorname{E}[1_{\left\{Y\in B\right\}}|X]\) と定義する( 節 1.4 ).

1.1 測度論による定義

定義(条件付き期待値)

\((\Omega,\mathcal{F},\operatorname{P})\) を確率空間とし,\(\mathcal{G}\)\(\mathcal{F}\) の部分 \(\sigma\)-代数とする.可積分確率変数 \(X\in\mathcal{L}^1(\Omega)\) について, 次の2条件を満たす,\(\operatorname{P}\)-零集合を除いて一意な確率変数を条件付き期待値といい,\(\operatorname{E}[X|\mathcal{G}]\) で表す.

  1. \(\mathcal{G}\)-可測でもある \(\operatorname{P}\)-可積分確率変数である.
  2. 任意の \(\mathcal{G}\)-可測集合 \(B\in\mathcal{G}\) 上では \(X\) と期待値が同じ確率変数になる:\[\operatorname{E}[X1_B]=\operatorname{E}[\operatorname{E}[X|\mathcal{G}]1_B]\]

\(\operatorname{E}[X|\mathcal{G}]\)\(L^1(\Omega,\mathcal{G},\operatorname{P})\) の元であり,数学的対象としては「関数の同値類」である.関数としてはある零集合の上では定まらない.その任意の代表元も \(\operatorname{E}[X|\mathcal{G}]\) と表すことが多く,1 その場合は,多くの等式には a.s. (= almost surely) がついてまわることになる.

もちろん,\(L^1(\operatorname{P})\) 上の順序関係 \(\le\)\[ X\le Y:\Leftrightarrow X\le Y\;\;\text{a.s.} \] と定義し,a.s. を省略して書いてもよい.

定義の2条件のみから,\(\operatorname{E}[X|\mathcal{G}]\)\(\operatorname{P}\)-零集合を除いて一意に定まること(とその存在)を示す.

\[Q(B):=\operatorname{E}[X,B]=\operatorname{E}[1_BX]\;(B\in\mathcal{G})\] とおくことで,\(Q\) は可測空間 \((\Omega,\mathcal{G})\) 上の確率測度を定める. いま,\(\operatorname{P}|_\mathcal{G}\) に関して \(Q\) は絶対連続になっている:\[\forall_{B\in\mathcal{G}}\;P(B)=0\Rightarrow Q(B)=0.\] これより,Radon-Nikodymの定理から, ある \(\mathcal{G}\)-可測で \(\operatorname{P}\)-可積分な可測関数 \(Y:\Omega\to\mathbb{R}\) が,\(\operatorname{P}\)-零集合上での違いを除いて一意的に存在して,\[\forall_{B\in\mathcal{G}}\;Q(B)=\int_BY(\omega)P(d\omega)\] が成り立つ. よって,条件付き期待値 \(Y\) は確かに存在して(同値類 \(L^1(\operatorname{P})\) の元としては)一意的で,(1),(2)が成り立つ.

(Dudley, 2002, pp. 10.1節 p.336), (吉田朋広, 2006, p. 43) がおすすめな参照先.(舟木直久, 2004, p. 88) が入門しやすい.\(X\in L^2(\Omega)\) でいい場合は,より「射影」としてわかりやすい特徴付けがある( 節 1.3 ).これのおすすめは (Jacod and Protter, 2004, pp. 第23節 p.200), (Kallenberg, 2021, p. 164)

1.2 確率変数に関する条件付け

定義(確率変数を与えた下での条件付き期待値)

\((E,\mathcal{E})\) を可測空間とする.確率変数 \(X\in\mathcal{L}(\Omega;E)\) による \(Y\in\mathcal{L}^1(\Omega)\)条件付き期待値は,次を満たす可測関数 \(\operatorname{E}[Y|X=-]:E\to\mathbb{R}\) のことをいう: \[ \begin{align*} \forall_{B\in\mathcal{E}}\quad&\int_{X^{-1}(B)}Y(\omega)P(d\omega)\\ &\quad=\int_B\operatorname{E}[Y|X=x]P^X(dx). \end{align*} \]

すると,\(X\)\(\Omega\) 上に引き戻す \(\sigma\)-代数 \[ \sigma(X):=\left\{A\subset\Omega\mid\exists_{B\in\mathcal{E}}\; X^{-1}(B)=A\right\} \] を与えた下での条件付き期待値 \(\operatorname{E}[Y|\sigma(X)]\) と,次のように関係する.2 \(\operatorname{E}[Y|\sigma(X)]\) は定義 節 1.1 1から \(\sigma[X]\)-可測であるが,可測性の特徴付け(後述)から,これはあるBorel可測関数 \(f\) について,\[\operatorname{E}[Y|X]=f(X)\;\;\text{a.s.}\] と表せる.この \(f:\mathcal{X}\to\mathbb{R}\) が,\(X\) を与えた下での \(Y\) の条件付き期待値 \(\operatorname{E}[Y|X=-]\) である.

この記法 \(\operatorname{E}[Y|X=x]\) とは何かというと,\(X\) の値域 \(\mathcal{X}\) 上の関数として,新たに \[\operatorname{E}[Y|X=x]:=f(x)\;\;\text{a.s.}\] と書くことにするのである.3 すると, \[ \operatorname{E}[Y|X=x]|_{x=X(\omega)}=\operatorname{E}[Y|X](\omega)\;\;\text{a.s.} \] も満たす.つまり,次の図式が可換である:

Commutative Diagram for Conditional Expectations
命題4 (Doob, 1953)

\(S\) を位相空間,\(X\in \mathcal{L}(\Omega;S),Y\in \mathcal{L}(\Omega)\) を確率変数とする.次は同値:

  1. \(Y\)\(\sigma(X)\)-可測.
  2. あるBorel可測関数 \(f:S\to\mathbb{R}\) が存在して,\(Y=f(X)\) を満たす.

2 \(\Rightarrow\) 1 はすぐに従う.任意の \(B\in\mathcal{B}(\mathbb{R})\) について,\(f^{-1}(B)\in\mathcal{B}(S)\) であるから, \[Y^{-1}(B)=X^{-1}(f^{-1}(B))\in\sigma(X).\] あとは 1 \(\Rightarrow\) 2 を示せば良い.3段階で示す.

  1. まず \(Y\) が単関数 \[Y=\sum_{i=1}^nc_i1_{A_i},\qquad c_i\ne c_j\;(i\ne j).\] の場合について示す.仮定より \(A_i\in\sigma(X)\) であるから,ある \(B_i\in\mathcal{B}(S)\) が存在して \(A_i=X^{-1}(B_i)\).よって, \[f(x):=\sum_{i=1}^nc_i1_{B_i}(x).\] と定めると \(Y=f(X)\)
  2. 次に \(Y\ge0\;\;\text{a.s.}\) の場合を考えると,正な単関数の単調増加列 \(\{Y_n\}\)\(Y\) に収束するものが取れる.各 \(Y_n\) について,\(f_n\in\mathcal{L}(S)\) が存在して \(Y_n=f_n(X)\) が成り立つ.このとき,\(f:=\limsup_{n\to\infty}f_n\) と定めれば, \[\begin{align*} Y&=\limsup_{n\to\infty}Y_n\\ &=(\limsup_{n\to\infty}f_n)(X)=f(X). \end{align*}\]
  3. 一般の場合は \(Y=Y^+-Y^-\) の分解から従う.

(Dudley, 2002, pp. 定理4.2.8 p.128)\(S=\mathbb{R}\) の場合,(Landkov, 1972)\(S=\mathbb{R}^m\) の場合, (Kallenberg, 2021, pp. 補題1.14 p.18) に一般の標準Borel空間の場合の証明がある.nLab も極めて参考になる.

1.3 射影としての特徴付け

\(L^2(\Omega)\subset L^1(\Omega)\) 上に議論を制限してみると,実は \(\mathcal{F}\) の部分 \(\sigma\)-代数 \(\mathcal{G}\) に関する条件付き期待値は,部分空間 \[ L^2_\mathcal{G}(\Omega):=\left\{X\in L^2(\Omega)\:\middle|\:X\,\text{は}\,\mathcal{G}\,\text{-可測}\right\} \] への射影になっている.

定理(条件付き期待値の特徴付け)

部分 \(\sigma\)-代数 \(\mathcal{G}\subset\mathcal{F}\)\(X\in\mathcal{L}^2(\Omega)\) を考える. 任意の \(\widehat{X}_\mathcal{G}\in\mathcal{L}^2_\mathcal{G}(\Omega)\) について,次は同値:

  1. \(\widetilde{X}_\mathcal{G}\)\(X\)\(L^2_\mathcal{G}(\Omega)\) への射影である: \[ \begin{align*} &\|X-\widehat{X}_\mathcal{G}\|_{L^2(\Omega)}\\ &=\inf_{X'\in\mathcal{L}^2_\mathcal{G}(\Omega)}\|X-X'\|_{L^2(\Omega)}. \end{align*} \]
  2. \(\widetilde{X}_\mathcal{G}\)\(X\) の条件付き期待値である:\[\forall_{Z\in L^2_\mathcal{G}(\Omega)}\;\operatorname{E}[ZX]=\operatorname{E}[Z\widehat{X}_\mathcal{G}].\]

1.4 条件付き確率

定義(条件付き確率)

\((\Omega,\mathcal{F},\operatorname{P})\) を確率空間,\(\mathcal{G}\subset\mathcal{F}\) を部分 \(\sigma\)-代数とする.\(\mathcal{G}\) の定める条件付き確率を, \[ \operatorname{P}[B|\mathcal{G}](\omega):=\operatorname{E}[1_B|\mathcal{G}](\omega)\;(B\in\mathcal{F}) \] で定める.

しかしこの定義には問題がある.条件付き期待値 \(\operatorname{E}[X|\mathcal{G}]\)\(\Omega\)\(\operatorname{P}\text{-a.e.}\) でしか定まらない(場合がある)から,\(\operatorname{P}\) も一般には可算加法性をa.s.にしか満たさない: \[ \operatorname{P}\left[\bigcap_{n\in\mathbb{N}}A_n\,\middle|\,\mathcal{G}\right]=\sum_{n\in\mathbb{N}}\operatorname{P}[A_n]\;\;\text{a.s.} \] この式自体は後述の単調収束定理( 節 2.3 )から示せる.

だが,\(\mathcal{G}\) がある完備可分距離空間に値を取る確率変数 \(Y\) について \(\mathcal{G}=\sigma(Y)\) である場合など,殆どの場合で,うまく \(\operatorname{P}\) を取ることが出来る.5 このように,a.s. 抜きで正式に確率測度として定まる場合,その確率核 \(\operatorname{P}:E\times\mathcal{G}\to[0,1]\) を,正則条件付き確率と呼び分ける.

2 性質

2.1 作用素としての性質

\(\mathcal{G}\)-可測な可積分関数のなす部分空間を \(L_{\mathcal{G}}^1(\Omega)\subset L^1(\Omega)\) で表す.

命題(条件付き期待値はノルム減少的な正作用素)

条件付き期待値 \(\operatorname{E}_{\mathcal{G}}:L^1(\Omega)\to L_{\mathcal{G}}^1(\Omega)\) はノルム減少的で正な線型汎作用素である.すなわち,

  1. 線型性:任意の実数 \(a,b\in\mathbb{R}\) について, \[\begin{align*} \operatorname{E}[aX+bY|\mathcal{G}]&=a\operatorname{E}[X|\mathcal{G}]\\ &\qquad+b\operatorname{E}[Y|\mathcal{G}]\;\;\text{a.s.} \end{align*}\]
  2. 正性:\(X\le Y\;\;\text{a.s.}\) ならば, \[\operatorname{E}[X|\mathcal{G}]\le\operatorname{E}[Y|\mathcal{G}]\;\;\text{a.s.}\]
  3. Jensenの不等式:\(\varphi:\mathbb{R}\to\mathbb{R}\) を凸関数とする.\(\varphi(X)\in L^1(\Omega)\) ならば,\[\varphi(\operatorname{E}[X|\mathcal{G}])\le\operatorname{E}[\varphi(X)|\mathcal{G}]\;\;\text{a.s.}\]
  4. 三角不等式:\[\lvert\operatorname{E}[X|\mathcal{G}]\rvert\le\operatorname{E}[\lvert X\rvert|\mathcal{G}]\;\;\text{a.s.}\]

いずれも \(L_{\mathcal{G}}^1(\Omega)\) 上の等式・不等式であり,殆ど確実ににしか成り立たないことに注意.

1は結局積分の線型性から従います.2は次のように議論できます.

任意の \(X\in L^1(\Omega)_+\) について \(\operatorname{E}[X|\mathcal{G}]\in L^1(\Omega)\) を示せば良い.\(A_n:=\left\{X'\le 1/n\right\}\in\mathcal{G}\) について,条件付き期待値の定義から,任意の \(n\in\mathbb{N}^+\) について, \[ \begin{align*} 0\le\operatorname{E}[X,A_n]&=\operatorname{E}[\operatorname{E}[X|\mathcal{G}],A_n]\\ &\le\frac{1}{n}\operatorname{P}[A_n]. \end{align*} \] より,\(\lim_{n\to\infty}\operatorname{P}[A_n]=0\) が必要.これより, \[\operatorname{P}[\operatorname{E}[X|\mathcal{G}]<0]\le\operatorname{P}[\cup_{n=1}^\infty A_n]=0.\] が解る.

3は単関数の場合から地道に示します.4はその特別の場合で \(\varphi(x)=\lvert x\rvert\) と取った場合に当たります.

2.2 Tower Property

命題(繰り返し期待値の法則)

2つの \(\sigma\)-代数が \(\mathcal{G}_1\subset\mathcal{G}_2\) を満たすならば,\(\operatorname{E}_{\mathcal{G}_1}=\operatorname{E}_{\mathcal{G}_1}\circ\operatorname{E}_{\mathcal{G}_2}\).すなわち, \[\operatorname{E}[X|\mathcal{G}_1]=\operatorname{E}[\operatorname{E}[X|\mathcal{G}_2]|\mathcal{G}_1]\;\;\text{a.s.}\]

右辺を \(Z\) とおく.任意の \(A\in\mathcal{G}_1\) について,\(A\in\mathcal{G}_2\) でもあるから, \[\begin{align*} \operatorname{E}[Z1_A]&=\operatorname{E}[\operatorname{E}[X|\mathcal{G}_1]1_A]\\ &=\operatorname{E}[X1_A]. \end{align*}\]

2.3 単調収束定理

命題(条件付き期待値に対する単調収束定理)

可積分な実確率変数の列 \(\{X_n\}\cup\{X\}\subset L^1(\Omega)\) について, \[X_n\nearrow X\;\;\text{a.s.}\] \[\Rightarrow\quad\operatorname{E}[X_n|\mathcal{G}]\nearrow\operatorname{E}[X|\mathcal{G}]\;\;\text{a.s.}\]

条件付き期待値の正性 節 2.1 より, \[\operatorname{E}[X_n|\mathcal{G}]\le\operatorname{E}[X|\mathcal{G}]\;\;\text{a.s.},\qquad n\in\mathbb{N}.\] よって,有界な単調列は収束するから,ある \(Y\in L^1(\Omega)\)\(E[X_n|\mathcal{G}]\nearrow Y\;\;\text{a.s.}\) を満たすように定めることが出来る.同時に,通常の期待値に関する単調収束定理から, \[ \begin{align*} \operatorname{E}[X1_A]&=\lim_{n\to\infty}\operatorname{E}[X_n1_A]\\&=\operatorname{E}[Y1_A]\;(A\in\mathcal{G}) \end{align*} \] が必要であるから,条件付き期待値の一意性より,\(Y=\operatorname{E}[X|\mathcal{G}]\;\;\text{a.s.}\)

2.4 可測関数の取り出し

命題(可測関数の取り出し)

\(X,XY\in\mathcal{L}^1(\Omega)\) を可積分,\(Y\in\mathcal{L}_\mathcal{G}(\Omega)\)\(\mathcal{G}\)-可測実確率変数とする.このとき,

  1. \(XY\in\mathcal{L}^1(\Omega)\)ならば,\[\operatorname{E}[XY|\mathcal{G}]=Y\operatorname{E}[X|\mathcal{G}]\;\;\text{a.s.}\]
  2. 特に,\(\operatorname{E}[Y|\mathcal{G}]=Y\;\;\text{a.s.}\)

条件付き期待値の線型性から,\(X,Y\ge0\) の場合について示せば良い.このとき,非負値単関数の収束列 \(X_n\nearrow X,Y_n\nearrow Y\) が取れる.\(X_nY\nearrow XY\in L^1(\Omega)\) だから,単調収束定理 節 2.3 から \[\operatorname{E}[X_n|\mathcal{G}]\nearrow\operatorname{E}[X|\mathcal{G}]\] \[ \begin{align*} \Rightarrow&\quad Y\operatorname{E}[X_n|\mathcal{G}]\nearrow Y\operatorname{E}[X|\mathcal{G}]\\ \quad\land&\quad\operatorname{E}[X_nY|\mathcal{G}]\nearrow\operatorname{E}[XY|\mathcal{G}]. \end{align*}\] よって,各 \(n\in\mathbb{N}\) について \(Y\operatorname{E}[X_n|\mathcal{G}]=\operatorname{E}[X_nY|\mathcal{G}]\) を示せば良い.単関数とは \(X=1_C\;(C\in\mathcal{G})\) という形の関数の線型和だから,畢竟この形の関数について考えれば良いのである.任意の \(B\in\mathcal{G}\) について \(C\cap B\in\mathcal{G}\) であるから, \[ \begin{align*} \int_B1_C\operatorname{E}[Y|\mathcal{G}]\,d\operatorname{P}&=\int_{C\cap B}\operatorname{E}[Y|\mathcal{G}]\,d\operatorname{P}\\ &=\int_{C\cap B}Y\,d\operatorname{P}\\ &=\int_B1_CY\,d\operatorname{P}. \end{align*} \] 条件付き期待値の一意性より,\(1_C\operatorname{E}[Y|\mathcal{G}]=\operatorname{E}[1_CY|\mathcal{G}]\;\;\text{a.s.}\) を得る.

2.5 独立な場合

命題(独立確率変数に対する性質)

可積分実確率変数 \(X\in\mathcal{L}^1(\Omega)\)\(\sigma\)-代数 \(\mathcal{G}\) と独立とする.

  1. \(\operatorname{E}[X|\mathcal{G}]=\operatorname{E}[X]\;\;\text{a.s.}\)
  2. 特に,\(\operatorname{E}[X|\boldsymbol{2}]=\operatorname{E}[X]\;\;\text{a.s.}\)

ただし,\(\boldsymbol{2}=\{\emptyset,\Omega\}\) とした.

2.6 条件付き期待値のアトム上での値

問題

確率変数 \(X,Y\) とその値域の値 \(y\in\mathcal{Y}\) について, \[ \operatorname{E}[X|Y=y]\operatorname{P}[Y=y]=\operatorname{E}[X1_{\left\{Y=y\right\}}] \] はどう正当化されるか?

\(\operatorname{E}[X1_{\left\{Y=y\right\}}]\) の中身を \(\sigma(Y)\) で条件付けてTower property( 節 2.2 )を使うと(定義 節 1.1 の条件2からと論じても良い),\(1_{\left\{Y=y\right\}}\)\(\sigma(Y)\)-可測だから,条件付き期待値の中身から出る( 節 2.4 参照).これによって正当化できる.式で表すと, \[ \begin{align*} \operatorname{E}[X1_{\left\{Y=y\right\}}]&=\operatorname{E}[\operatorname{E}[X1_{\left\{Y=y\right\}}|Y]]\\ &=\operatorname{E}[1_{\left\{Y=y\right\}}\operatorname{E}[X|Y]]\\ &=\int_{\mathcal{Y}}\delta_y(y')\operatorname{E}[X|Y=y']\operatorname{P}(dy')\\ &=\operatorname{E}[X|Y=y]\operatorname{P}[Y=y]. \end{align*} \] ただし,\(\mathcal{Y}\) 上の確率測度を \(\operatorname{P}\) と置いた.

条件付き確率の定義 節 1.4 から, \[ \operatorname{P}[Y\in B|X=x]:=\operatorname{E}[1_{\left\{Y\in B\right\}}|X=x] \] と議論できる.さらに \(\operatorname{P}[X=x]>0\) のとき, \[ \begin{align*} &=\frac{\operatorname{E}[1_{\left\{Y\in B\right\}}1_{\left\{X=x\right\}}]}{\operatorname{P}[X=x]}\\ &=\frac{\operatorname{P}[Y\in B,X=x]}{\operatorname{P}[X=x]} \end{align*} \] という見慣れた表示を得る.

3 更なる条件付け

3.1 条件付き独立性

定義(条件付き独立性)

\(\mathcal{C}\subset\mathcal{F}\) の下で,\(\mathcal{G}_1,\cdots,\mathcal{G}_n\)\(\mathcal{C}\)-条件付き独立 であるとは,任意の \(A_k\in\mathcal{G}_k\;(k\in[n])\) について \[ \operatorname{P}\left[\bigcap_{k\in[n]}A_k\:\middle|\:\mathcal{C}\right]\overset{\text{a.s.}}{=}\prod_{k\in[n]}\operatorname{P}[A_k|\mathcal{C}] \] を満たすことをいう.

\(\mathcal{C}=\boldsymbol{2}\) であるとき,通常の独立性に一致する(節 2.5 ).また全ての確率変数は \(\mathcal{F}\)-条件付き独立である(節 2.4 ).

命題(条件付き独立性の特徴付け Doob)

部分 \(\sigma\)-代数 \(\mathcal{C},\mathcal{G},\mathcal{H}\subset\mathcal{F}\) について,次は同値:6

  1. \(\mathcal{G}\perp\!\!\!\perp\mathcal{H}\mid\mathcal{C}\)
  2. 任意の \(H\in\mathcal{H}\) について, \[ \operatorname{P}[H|\mathcal{G}\lor\mathcal{C}]\overset{\text{a.s.}}{=}\operatorname{P}[H|\mathcal{C}] \]
  • (1)\(\Rightarrow\)(2):任意の \(C\in\mathcal{C},G\in\mathcal{G},H\in\mathcal{H}\) を取る. \[ \begin{align*} &\operatorname{E}[\operatorname{P}[H|\mathcal{C}]1_{G\cap C}]=\operatorname{E}[\operatorname{P}[H|\mathcal{C}]1_G1_C]\\ &=\operatorname{E}[\operatorname{E}[P[H|\mathcal{C}]1_G|\mathcal{C}]1_C]=\operatorname{E}[\operatorname{P}[H|\mathcal{C}]P[G|\mathcal{C}]1_C]\\ &=\operatorname{E}[\operatorname{P}[H\cap G|\mathcal{C}]1_C]=\operatorname{E}[\operatorname{E}[1_{H\cap G}1_C|\mathcal{C}]]\\ &=\operatorname{E}[1_H1_{G\cap C}]. \end{align*} \] が成り立つ.\(G\cap C\) という形の集合は,\(\mathcal{G}\lor\mathcal{C}\) を生成する集合体であるから,単調族定理より,\(\mathcal{G}\lor\mathcal{C}\) の元は,\(C\cap G\) という形の集合の単調増大列の極限として得られる.

    よって単調収束定理から, \(\operatorname{P}[H|\mathcal{C}]\overset{\text{a.s.}}{=}\operatorname{P}[H|\mathcal{C}\lor\mathcal{G}]\)

  • (2)\(\Rightarrow\)(1):任意の \(G\in\mathcal{G},H\in\mathcal{H}\) を取る. \[ \begin{align*} &\operatorname{P}[G\cap H|\mathcal{C}]=\operatorname{E}[1_{G\cap H}|\mathcal{C}]\\ &=\operatorname{E}[\operatorname{E}[1_G1_H|\mathcal{G}\lor\mathcal{C}]|\mathcal{C}]=\operatorname{E}[1_G\operatorname{E}[1_H|\mathcal{G}\lor\mathcal{C}]|\mathcal{C}]\\ &=\operatorname{E}[1_G\operatorname{E}[1_H|\mathcal{C}]|\mathcal{C}]=\operatorname{E}[1_H|\mathcal{C}]\operatorname{E}[1_G|\mathcal{C}]=\operatorname{P}[H|\mathcal{C}]\operatorname{P}[G|\mathcal{C}]. \end{align*} \]

3.2 条件付き分散

命題(Pythagorasの式)

\[ \|Y\|^2_2=\|Y-\operatorname{E}[Y|\mathcal{G}]\|^2_2+\|\operatorname{E}[Y|\mathcal{G}]\|^2_2. \]

これは条件付き期待値が \(L^2(\Omega)\)-射影であるためである( 節 1.3 ).

確率変数 \(Y\in\mathcal{L}^2(\Omega)\)\(\mathcal{G}\) に関する条件付き分散を \[ \begin{align*} \mathrm{V}[Y|\mathcal{G}]&:=\operatorname{E}\left[(Y-\operatorname{E}[Y|\mathcal{G}])^2|\mathcal{G}\right]\\ &=\operatorname{E}[Y^2|\mathcal{G}]-\operatorname{E}[Y|\mathcal{G}]^2 \end{align*} \] と定める.このとき,次の 全分散の公式 と呼ばれる関係が成り立つ: \[ \mathrm{V}[Y]=\operatorname{E}[\mathrm{V}[Y|\mathcal{G}]]+\mathrm{V}[\operatorname{E}[Y|\mathcal{G}]]. \]

Pythagorasの関係から, \[ \begin{align*} \operatorname{E}[Y^2]&=\operatorname{E}[(Y-\operatorname{E}[Y|\mathcal{G}])^2]\\ &\qquad+\operatorname{E}[\operatorname{E}[Y|\mathcal{G}]^2]. \end{align*} \] 両辺から \[ \operatorname{E}[Y]^2=\operatorname{E}[\operatorname{E}[Y|\mathcal{G}]]^2 \] を減じると,右辺第一項の \(\operatorname{E}[-]\) の中身は中心化確率変数であることから, \[ \begin{align*} \mathrm{V}[Y]&=\mathrm{V}[Y-\operatorname{E}[Y|\mathcal{G}]]\\ &\qquad+\operatorname{E}[\operatorname{E}[Y|\mathcal{G}]^2]-\operatorname{E}[\operatorname{E}[Y|\mathcal{G}]]^2\\ &=\mathrm{V}[Y-\operatorname{E}[Y|\mathcal{G}]]+\mathrm{V}[\operatorname{E}[Y|\mathcal{G}]]. \end{align*} \] 最後に, \[ \mathrm{V}[Y-\operatorname{E}[Y|\mathcal{G}]]=\operatorname{E}[\mathrm{V}[Y|\mathcal{G}]] \] より結論が従う.

3.3 条件付き共分散

定義(条件付き共分散)

\(X,Y\in\mathcal{L}^2(\Omega)\)\(\mathcal{G}\) に関する 条件付き共分散\[ \begin{align*} &\mathrm{C}[X,Y|\mathcal{G}]\\ &=\operatorname{E}\biggl[(X-\operatorname{E}[X|\mathcal{G}])(Y-\operatorname{E}[Y|\mathcal{G}])\bigg|\mathcal{G}\biggr]\\ &=\operatorname{E}[XY|\mathcal{G}]-\operatorname{E}[X|\mathcal{G}]\operatorname{E}[Y|\mathcal{G}]. \end{align*} \] と定義する.

命題(条件付き共分散公式)

\[ \begin{align*} &\mathrm{C}[X,Y]\\ &=\operatorname{E}[\mathrm{C}[X,Y|\mathcal{G}]]+\mathrm{C}[\operatorname{E}[X|\mathcal{G}],\operatorname{E}[Y|\mathcal{G}]]. \end{align*} \]

証明は (Kallenberg, 2021) 補題8.2 p.166 など.

References

Dellacherie, C., and Meyer, P. A. (1978). Probabilities and potential,Vol. 29. Hermann, Paris; North-Holland Publishing Company, Amsterdam, New York, Oxford.
Doob, J. L. (1953). Stochastic processes. New York, Wiley & Sons; London, Chapman & Hall.
Dudley, R. M. (2002). Real analysis and probability,Vol. 74. Cambridge University Press.
Jacod, J., and Protter, P. (2004). Probability essentials. Springer Berlin, Heidelberg.
Jacod, J., and Shiryaev, A. N. (2003). Limit theorems for stochastic processes,Vol. 288. Springer Berlin, Heidelberg.
Kallenberg, O. (2021). Foundations of modern probability,Vol. 99. Springer Cham.
Landkov, N. S. (1972). 確率論入門. 森北出版.
吉田朋広. (2006). 数理統計学,Vol. 21. 朝倉書店.
舟木直久. (2004). 確率論,Vol. 20. 朝倉書店.

Footnotes

  1. (Jacod and Shiryaev, 2003, p. 2) など.↩︎

  2. (Dudley, 2002, p. 340) など.↩︎

  3. (Kallenberg, 2021, p. 167)↩︎

  4. (Kallenberg, 2021), (Dellacherie and Meyer, 1978)↩︎

  5. (Dudley, 2002, pp. 定理10.2.2 p.345).一般には Borel空間に値を取る確率変数について成り立つ (Kallenberg, 2021, p. 165)↩︎

  6. (Kallenberg, 2021, pp. 170–171) 定理8.9 も参照.↩︎