数学者のための統計力学1
Ising 模型とスピングラス
数学者のための統計力学2:小正準集団・正準集団・大正準集団
司馬博文
4/07/2024
6/28/2024
統計力学で用いられる種々の模型については前稿参照:
A Blog Entry on Bayesian Computation by an Applied Mathematician
$$
$$
殆どの力学的現象は,相空間 \(\Omega\subset\mathbb{R}^{6N}\) と呼ばれる シンプレクティック多様体 上の Hamiltonian flow \((S_t)\) として理解される.統計力学では,その上に確率測度 \(P\) を導入して運動を理解する.組 \((\Omega,P)\) を統計集団という.
例えば,\(N\)-粒子系 \(\Omega_{\Lambda,N}\) の統計的な振る舞いを最もよく記述する確率分布 \(P\in\mathcal{P}(\Omega_{\Lambda,N})\) を推定することを考える.
系が平衡状態にない場合は分子の衝突などを追加で考える必要があり,現在でも理論は発展中であるが,すでに平衡状態に至ったとみなせる場合には,この確率分布 \(P\) というのは殆どわかる.
仮に初期分布 \(P_0\in\mathcal{P}(\Omega_{\Lambda,N})\) を持っていた場合,分布は Hamilton 流の押し出しにより \((S_t)_*P_0\) というように \(\mathcal{P}(\Omega_{\Lambda,N})\) 上の力学系として発展していく.1
従って,平衡分布は必ず \(S_t\) の不動点,不変確率分布である必要があるが,これを満たす分布は複数存在する.そのうち特に意味のあるものが,小正準集団 \((\Omega_{\Lambda,N,E},P^{\text{microcanon}}_{\Lambda,N,E})\),正準集団 \((\Omega_{\Lambda,N},P^{\text{canon}}_{\Lambda,N,\beta})\),大正準集団 \((\Omega_\Lambda,P^{\text{grandcanon}}_{\Lambda,\beta,\mu})\) などである.「小」「大」などの接頭辞は分布の台の大きさとも思える.
確率的な系も,確率分布の空間 \(\mathcal{P}(\Omega_{\Lambda,N})\) 上で見れば決定論的な発展をするのが数理の妙である.
これら3つの分布はどれもそれだけで完全なものではなく,熱力学極限において真に物理的に意味のある量になると理解する.
小正準測度 \(\nu_{\Lambda,N,E}\) を正規化したものも \(S_t\) の不変確率分布である: \[ P^{\text{microcanon}}_{\Lambda,N,E}(A):=\frac{\nu_{\Lambda,N,E}(A)}{\nu_{\Lambda,N,E}(\Omega_{\Lambda,N,E})} \]
改めて,\(P^{\text{microcanon}}_{\Lambda,N,E}\) は等エネルギー面 \(\Omega_{\Lambda,N,E}\) 上にしか台を持たないことに注意.そのため,\(P^{\text{microcanon}}_{\Lambda,N,E}\) は \(\mathbb{R}^{6N}\) 上の Lebesgue 測度 \(\ell_{6N}\) に関しては絶対連続ではない.2
このようにエネルギーが一定であるような力学系の集団をミクロカノニカル集団,この集団の分布,すなわちそのエネルギーに対応する全ての微視状態へ,等しい確率を持って存在するような分布をミクロカノニカル分布という.(久保亮五, 2003, p. 27)
孤立系など,エネルギー一定の系は Hamiltonian の等位集合上で運動をする.その上の小正準測度 / Gelfand-Leray 測度は,相空間上の自然な体積要素から誘導される.3 従って小正準分布は運動に関して不変ではあるが,だからと言ってどのようなマクロ系に対しても小正準分布が平衡分布になると約束する法則は何もない.孤立したマクロ系(エネルギー一定以外に制約がない場合)が小正準分布に従うことは,等重率の仮定の具体的な表現と見れる,一種のモデルの仮定である.4
系のエネルギーを指定するのではなく,逆温度を指定することで,相空間上で密度 \[ p^{\text{canon}}_{\Lambda,N,\beta}(Q,V)=\frac{1}{Z_{\Lambda,N,\beta}}e^{-\beta H_{\Lambda,N}(Q,V)} \] を持つ不変確率分布を得る.5 これを 正準分布 (canonical distribution) という.
\(\beta>0\) を 逆温度,\(Z_{\Lambda,N,\beta}\) を 分配関数 (partition function / statistical sum) という.
古典気体の \(H\) において位置に依存する項と速度に依存する項とが分かれているため,\(P^{\text{canon}}_{\Lambda,N,\beta}\) において位置と速度は独立であり,速度 \(v_1,\cdots,v_N\) も互いに独立でそれぞれは Gauss 分布に従う.これを Maxwell の法則 という.
また特に,Gibbs 測度の配置空間上での周辺分布は,configuration gas の Gibbs 測度に一致する.この意味で,古典気体の統計力学的性質は,configuration gas に帰着すると言える.
大雑把に捉えれば,エネルギー一定の力学系(例えば孤立系)の全ての状態の上の分布がミクロカノニカル分布であり,このエネルギーも動かした場合(例えば孤立系の部分系),各エネルギー上の分布はカノニカル分布になる.
\(\Lambda_0\subset\Lambda\) を部分領域として,この領域に \(s\) 個の粒子が存在する状態 \[ \Omega_{\Lambda,N}^{\Lambda_0,s}:=\left\{(Q,V)\in\Omega_{V,N}\mid\lvert Q\cap\Lambda_0\rvert=s\right\} \] を考え,この部分領域への小正準分布 \(P^{\text{microcanon}}_{\Lambda,N,E}\) の制限を考えると,ある極限に関して正準分布になる (Minlos, 2000).これがいわば 熱浴 や thermostat の概念である.
すなわち,ある領域 \(\Lambda_0\) に \(s\) 個の粒子が存在する限り値が変わらないような量 \(F:\Omega_{\Lambda,N}\to\mathbb{R}\) は,小正準平均も正準平均も「ほとんど」変わらないことになる.この極限の正確な意味は \[ \Lambda\nearrow\mathbb{R}^v,N\to\infty,\frac{N}{\lvert\Lambda\rvert}\to\rho\in\mathbb{R},\frac{E_i}{\lvert\Lambda_i\rvert}\to e\in\mathbb{R}, \] というものであり,これを 熱力学極限 という(第 6 節).
一般に極めて多数の自由度を持つ力学系 B と,問題の対象たる一つの力学系 A(上の例では \(s\) 個の粒子からなる系)とが結合しているときに,系 A の一つの微視状態の実現確率を与える.これはそのような条件の下に,前節に述べた等重率の仮定に代わるものである. 物理的な言葉に引き直せば,結局,熱容量の大きい物体と熱平衡を保つ任意の力学系の統計的分布を表す集団がカノニカル集団である.(久保亮五, 2003, p. 30)
大正準集団は,領域 \(\Lambda\subset\mathbb{R}^3\) に粒子数 \(N\in\mathbb{N}\) を定めずに存在する互いに区別できない粒子の系を考えることになる(エネルギーの交換だけでなく粒子も交換する部分系など): \[ \Omega_\Lambda=C_\Lambda^{(0)}\cup C_\Lambda^{(1)}\cup\cdots\cup C_\lambda^{(N)}\cup\cdots \]
この \(\Omega_\Lambda\) 上に,各 \(C_\Lambda^{(N)}\) 上での Lebesgue 測度が誘導する測度 (Lebesgue-Poisson measure) \[ \mu_\Lambda^{(N)}(A):=\frac{\ell_{3N}(A)}{N!} \] の貼り合わせとして定義される測度を正規化したものを \(\mu\) とし,これを体積の代わりとする.
これを基底測度として密度 \[ p^{\text{grandcanon}}_{\Lambda,\beta,\mu}(c):=\frac{1}{\Xi(\Lambda,\beta,\mu)}e^{-\beta(H_\Lambda(c)+\mu N(c))} \] が定める分布を 大正準分布 という.
\(\beta>0\) は逆温度であるが,\(\mu\in\mathbb{R}\) は化学ポテンシャルである.
小正準集団が正準集団になる際に,エネルギー一定の制約は解放されて,代わりに新たなパラメータ \(\beta>0\) を得た.ここからさらに粒子数一定の制約を解放し,代わりに新たなパラメータ \(\mu\in\mathbb{R}\) を得たものが大正準集団である.この順に解析が容易になる.
大正準分布を粒子数一定の条件で条件付けて得る \(C_\Lambda^{(N)}\) 上の分布は正準分布に一致する.
\(F_B:\Omega_\Lambda\to\mathbb{R}\) が 局所変数 であるとは, \[ F_B(c)=F_B(c\cap B)\quad(c\in\Omega_\Lambda) \] を満たすことをいう.
熱力学極限 \[ \lim_{\Lambda\nearrow\mathbb{R}^3}\langle F_B\rangle_{\Lambda,\beta,\mu}=\langle F_B\rangle_{\infty,\beta,\mu} \] は,ある空間上のある積分と捉えられる.これを 極限 Gibbs 測度 (limit Gibbs distribution) という.
この極限 Gibbs 測度が複数存在したり,良い性質が失われたりする現象を 相転移 といい,その際の \((\beta,\mu)\) を特異点という.
熱力学では,系の変化が極めて緩慢であるために,一瞬一瞬において平衡状態が保たれているとみなせる物理的過程が扱われるため,大正準集団では \(T=\beta^{-1},\mu\),正準集団では \(T,\rho\),小正準集団では \(\rho,e\) などのマクロ変量によって記述できる理論になっている.
そして熱力学極限において,これら3集団は等価であるから,これらはパラメータ変換の問題でしかなく,さらにこのパラメータ空間上に別の関数も導入される.特にエントロピー \(s(e,\rho)\),Helmholz の自由エネルギー(密度) \(f(\beta,\rho)\),圧力 \(p(\beta,\mu)\) などであり,これらは互いに Legendre 変換により関係し合っている.
これらの熱力学的関数も,特定の統計力学的な量の熱力学極限として理解できる.
\[ s(\rho,e)=\lim_{\substack{\Lambda\nearrow\mathbb{Z}^v\\\frac{N}{\lvert\Lambda\rvert}\to\rho\\\frac{E}{\Lambda}\to e}}\frac{\log Q^{\text{indistin}}(\Lambda,E,N)}{\lvert\Lambda\rvert} \] \[ f(\beta,\rho)=-\frac{1}{\beta}\lim_{\substack{\Lambda\nearrow\mathbb{Z}^3\\\frac{N}{\lvert\Lambda\rvert}\to\rho}}\frac{\log Z^{\text{indistin}}(\Lambda,N,\beta)}{\lvert\Lambda\rvert} \] \[ p(\beta,\mu)=\frac{1}{\beta}\lim_{N\nearrow\mathbb{Z}^3}\frac{\log\Xi(\Lambda,\mu,\beta)}{\lvert\Lambda\rvert} \]
ただし,\(Q^{\text{indistin}},Z^{\text{indistin}},\Xi\) はそれぞれ,(粒子が互いに区別がつかない場合の)小正準集団,正準集団,大正準集団の正規化定数とした.
極限 Gibbs 測度に依らずとも,次のように直接的な方法で相転移を定義することができる:
情報理論や統計学において,エントロピーは確率分布の不確実性として理解されている.
同様にして,熱力学的な相の変化は,エントロピーの急激な変化として検出されるわけである.
自由エネルギーは平均ポテンシャルとエントロピーの競争を表す量である.統計的には,周辺対数尤度として理解できる.
自由エネルギーが低い状態ほど現れやすい.このような見方はまさにベイズ因子によるモデル選択と同じ観点に立っていることになる.
また,自由エネルギーはキュムラント母関数でもあり,その微分係数は多くの統計学的な意味を持つ.
次の稿で紹介した I-MMSE 定理もその例である:
次の式は状態方程式と呼ばれ,(Metropolis et al., 1953) はこれの推定のために Monte Carlo 法を開発したのであった: \[ \langle p(\beta,\theta,N)\rangle:=-\partial_VF(\beta,\theta(N,V),N). \]
(Minlos, 2000), (西森秀稔, 2003), (Baxter, 1982) の書籍と,(Faulkner and Livingstone, 2024) のレビューを参考にした.
運動は相空間の自然な体積形式 (Liouville 形式ともいう) を不変に保つという Liouville の定理 (Khinchin, 1949) は量子論でも成り立つ.(戸田盛和 et al., 2011, p. 23) これらの性質を抽象した形で,古典・量子力学は,統計力学に等重率の仮定を課す.↩︎
ただし,\(\Omega_{\Lambda,N,E}\) 上に制限された体積測度に関しては,密度 \(\frac{1}{\lvert\operatorname{grad}H\rvert}\) を持つ (Khinchin, 1949).↩︎
これを Liouville 形式だけでなく Liouville 測度ということもあるようである (砂田利一, 2004).↩︎
等重率の仮定は量子論の観点から「マクロな量子系では,ある平衡状態に対応する許容される量子状態の全てが区別できない」と説明されることも多い.いずれにしろ極めて非自明な主張であるが,これを認めてみると良い理論を得る.実際 (田崎晴明, 2008, p. 89) では等重率の仮定を「戦略」「等重率の原理に基づく確率モデル」と説明している.いわば,統計モデルの1つであり,モデル選択の観点に立っているのである.↩︎
\(S_t\) は体積を保存し Hamiltonian も保存するため,これは明らかに \(S_t\) の不変確率分布である.↩︎
(Faulkner and Livingstone, 2024, pp. 4–5) 2.4節も参照.↩︎