Markov Category (nLab) | 紹介

Probability
Foundation
Author

司馬博文

Published

11/11/2023

Modified

2/10/2024

概要
「総合的確率論」アプローチの基本概念に Markov 圏の概念がある.これは可測空間を対象とし,確率核を射として得る圏のことである.nLab の Markov category のページを翻訳して紹介する.

0. はじめに

綜合的確率論 (synthetic probability) とは,確率論の定義と定理を,その性質によって特徴づけようとする試みである.確率論が測度論に依拠しているのは「一つの実装例」に過ぎず,より普遍的で自然な定義が見つかるはずだ,というものである.思えば,条件付き期待値がa.s.にしか定まらないこと,多くの正則性条件が成り立つためには空間の可分性が必要であること.確率論には,あまりにも恣意的で非本質的な,「確率論に関係のない議論」が多いとは思わないか?これは,確率というものの数理的な構造を,我々が正しく把握できていないからなのではないか?

The basic object of study in probability is the random variable and I will argue that it should be treated as a basic construct . . . and it is artificial and unnatural to define it in terms of measure theory. (Mumford, 2000)

このような精神を持ち,具体的には圏論的な方法で,確率論のもう一つのモデルを構築しようとするのが綜合的確率論である.Anders Kock と Lewvere による綜合的微分幾何学 (synthetic differential geometry) からの接続を意識した命名であり,数学の各分野を「圏論化」することを,「綜合的」という形容詞で捉えようとしている.

nLabとは,圏論的な視点から種々の数学・物理学・哲学の概念をまとめた,有志によって運営されているウィキである.今回は Markov圏のページ を翻訳.

Screen Shot from nLab

1.アイデア

Markov 圏の概念は,確率統計学の綜合的 (synthetic) な側面を表現する方法の1つである.すなわち,確率統計学を基礎付ける構造と公理からなり,これを用いて測度論を介することなく直接的に種々の定理が示せる.通常の測度論的な議論は,綜合的確率論のモデル(意味論)の1つであると見なされる.

直感的に言えば,Markov 圏とは射が「確率変数」または「Markov 核」(ここから名前がついた)と見なせるような,確率論で用いられる圏である.標準的な例に,Kleisli 圏や確率モナドがあるが,Markov 圏は更に一般的な枠組みである.

2.定義

Markov 圏とは,半デカルト対称モノイダル圏 \((C,\otimes,1)\) であって,その対象 \(X\in C\) が可換な内部余モノイドの構造を持つものである.余乗法と余単位写像は \(\mathrm{copy}:X\to X\otimes X\)\(\mathrm{delete}:X\to1\) とそれぞれ表される.

複製写像とテンソル積の間に次の整合性条件を課す:任意の対象 \(X,Y\in C\) に対して,

\[ \mathrm{copy}_{X\otimes Y}=(\mathrm{id}_X\otimes b_{Y,X}\otimes\mathrm{id}_Y)(\mathrm{copy}_X\otimes\mathrm{copy}_Y). \]

ただし, \(d\) でブライダルを表す.

また,写像 \(\mathrm{delete}:X\to 1\) は, \(1\) が終対象であることから一意的であるため,更に \(X\) 内で自然であることに注意.一方で,複製写像は自然とは限らない.

3.注

  • A Markov category can equivalently be defined as a semicartesian symmetric monoidal category that supplies commutative comonoids.

4.例

  • 有限集合と確率行列のなす圏 \(\mathtt{FinStoch}\)
  • 可測空間とMarkov核のなす圏 \(\mathtt{Stoch}\)
  • 任意のデカルトモノイダル圏 \(C\) が,モノイド単位を保存するモノイダルモナド \(T\) を持つならば,そのKleisli圏 \(\mathrm{Kl}(T)\) はMarkov圏になる.

5.決定論的な射

Markov圏の射 \(f:X\to Y\) が決定論的であるとは,複製写像と可換であることをいう:

\[ \mathrm{copy}\circ f=(f\otimes f)\circ\mathrm{copy}. \]

この定義のモチベーションは以下の通りである. \(f\) が例えば実数上の実確率変数で,入力に,サイコロの目を振ってでた値を加えるような関数であるとしよう.すると,入力 \(x\in\mathbb{R}\) に対して,サイコロを振り,出た目 \(n\in[6]\) を加えて得た結果をコピーするから,左辺は \((x+n,x+n)\) である.一方で,まず入力 \(x\in\mathbb{R}\) を複製写像 \(\mathrm{copy}\) に渡し, \((x,x)\) を得た後でサイコロを2回降り,出た目 \(n_1,n_2\in[6]\) をそれぞれ加えると,右辺は \((x+n_1,x+n_2)\) となるが,別々の試行で出た目が一致する \(n_1=n_2\) とは限らない.この性質を,「ランダム性」の定義とする,というのである:つまりランダム性とは,2回行ったときに結果が異なり得る,という過程に宿るものとする.また,同値なことだが,その過程の前に情報を複製することと,その過程を見た後に情報を複製することとで,異なる状況を与えるような「過程」のことだとも理解できる.

10.参考文献

Tobias Fritz(現在オーストリアInnsbruck大学)がこの分野の騎手であり,他にホモトピー型理論のレクチャーノートも執筆している.

  • Tobias Fritz (2019) A synthetic approach to Markov kernels, conditional independence and theorems on sufficient statistics. (arXiv:1908.07021)
  • Tobias Fritz and Eigil Fjeldgren Rischel (2019) The zero-one laws of Kolmogorov and Hewitt–Savage in categorical probability. (arXiv:1912.02769)

この研究の流れは,Bart Jacobsによるchannel perspectiveを汲んでいる.彼らは同様の概念をaffine CD-圏と呼んでいたようだ.

  • Bart Jacobs and Fabio Zanasi (2018) The Logical Essentials of Bayesian Reasoning. (arXiv:1804.01193)

References

Mumford, D. (2000). The dawning of the age of stochasticity. In Mathematics : Frontiers and perspectives, pages 197–218. American Mathematical Society.