法律家のための統計数理（３）意思決定解析

概要

教科書第2章第4節 (pp. 42-72)を通じ，決定木を用いた意思決定分析の方法を学んだ．機械学習では，不確実性の下での意思決定支援をするエキスパートシステム作成を目指した，確率的グラフィカルモデルという分野が絶賛発展中である．決定木からベイジアンネットワークへの進化を遂げた現代の技術の広がりを，世界銀行報告書，内閣府日本経済白書，そして法科学への応用事例を通じて学んだ．

シリーズトップページはこちら．

1 今回の内容

1.1 第2章：意思決定

第二章は決定木を用いた 決定分析 に関する章である．

1.1.1 第2章1節「決定の木の作り方」

決定木の美点は，あり得るシナリオを全て書き出すことが出来ること にある (Smith, 2010, p. 29) が，それも箇条書きをするのではなく，木構造に書くことで，

計算機との親和性があり，自動発見に繋げられる．
最適なポリシーを執るための，期待値の計算が容易になる．
計算した結果から，自身の信念の構造を反省する契機になる．

などの利点が生まれる，という極めて古典的な技法 (Raiffa and Schlaifer, 1961) である．

これを用いて全てのシナリオと，それに対応する金銭的利得と確率を書き出し，各意思決定毎の期待値を計算することで，意思決定に役立てることができる．

決定木の節 (node) には2種類ある (Taroni et al., 2014, pp. 35–36)

確率節 (Chance Node)：どっちに転ぶか判らない事象（確率変数）を表す節．
決定節 (Decision Node)：意思決定者が選択する行動を表す節．

教科書 (草野耕一, 2016) では 1.を \(\bigcirc\) で，2.を \(\square\) で表している．

1.1.2 第2章第2節「リスク中立的な行為者」

問題2-2

上場会社Dテレビがその報道についてE社から訴訟を受けた．2億円支払えば和解に応じるという．

EがDに勝訴する確率は8割で，その場合1億円の賠償請求が命じられる．
訴訟費用は3000万円．
Eが米国で訴訟を起こした場合，管轄権が認められる可能性は1割であり，さらにその場合には9割で5億円の賠償で2億の訴訟費用，1割で unjust enrichment の法理が適用され50億賠償で5億の訴訟費用がかかるとする．

この問題は「キャッシュフローの期待値」を決定木を通じて算出することで教科書内で解かれるが，同時に重要な問題を提起している．

そもそも，評価基準が「キャッシュフローの期待値」であるべきとは限らない．リスクに対する評価は人それぞれである．

事実，もし50億の賠償命令が下った場合に倒産リスクが生じる場合，この事象は「50億円」という額面以上に避けるべき事象ということになるだろう．

そこで，金銭的利得とは別に効用の概念を導入し，この効用の期待値によって意思決定をするための論理基盤として (von Neumann and Morgenstern, 1944) の 期待効用理論 を紹介している．

1.1.3 コラム2-1：「期待効用理論」

期待効用理論極めて古いが，現在でも不確実性の下での意思決定の定量的理論の騎手である (Dentcheva and Ruszczynski, 2013)．

教科書 (草野耕一, 2016) では「効用」という概念を金銭的利得と関連付けて説明しているが，そのためにわかりにくい提示の仕方になっている．¹

そこでここでは，抽象的な定義を提示する．効用とはここでは，「行為者にとっての好ましさの度合いを，相対的に比較できるように定量化したもの」以上の意味はないものとする．

定義 (preference relation) (Dentcheva and Ruszczynski, 2013)

\(X\) を位相空間とする．完備な前順序 ² \(\precsim\;\subset X^2\) を 選好関係 と呼ぶ．³

（完備性）任意の \(x,y\in X\) について，⁴ \[x\precsim y\;\lor\;x\succsim y.\]
（連続性）任意の \(z\in X\) に対して， \[ \left\{v\in X\mid v\precsim z\right\}\overset{\textrm{closed}}{\subset}X, \] \[ \left\{v\in X\mid v\succsim z\right\}\overset{\textrm{closed}}{\subset}X. \]
（独立性）任意の \(x,y,z\in X\) に対して，\(x\succsim y\) ならば，任意の \(\alpha\in(0,1)\) について \[ \alpha x+(1-\alpha)z\succsim\alpha y+(1-\alpha)z. \]
（アルキメデス性）⁵ 任意の \(x,y,z\in X\) に対して，\(x\succsim y\succsim z\) ならば，ある \(\alpha,\beta\in(0,1)\) が存在して， \[ \alpha x+(1-\alpha)z\succsim y\succsim\beta x+(1-\beta)z. \]

定理 (Dentcheva and Ruszczynski, 2013)

\(X\) を Polish 空間，\(\precsim\;\subset P(X)^2\) を連続で独立な選好関係とする．⁶ このとき，ある有界連続関数 \(u\in C_b(\mathbb{R})\) が存在して， \[ U(\mu):=\int_Xu(z)\,\mu(dz)\quad(\mu\in P(X)) \] は \[ \mu\succsim\nu\quad\Rightarrow\quad U(\mu)\ge U(\nu) \] を満たす．

教科書 (草野耕一, 2016) にいう「期待効用定理」とはこの定理を指すものと思われる．この \(u\in C_b(\mathbb{R})\) を 効用関数 (utility function) という．

問題2-2で用いていた金銭的利得の空間とは \(X=\mathbb{R}\) の場合であり，これは定理の条件を満たす．よって任意の連続で独立な選好関係 \(\succsim\) を用意することで，金銭的利得の代わりに効用 \(u\) の期待値 \(U\) を用いれば，特定のリスク選好性に対応して，同様の議論を用いて意思決定分析が可能になる．

2 決定木の応用

今回決定木を用いた意思決定の形式化の仕方を学んだが，この手法は多くの人間と機械との間で広く共有されて最も輝く．

決定木は現代では一般に（確率的）グラフィカルモデルの例として捉えられており，そのグラフとしての構造は計算機との親和性が高く，「不確実性の下での意思決定が出来る人工知能・エキスパートシステムの作成」において重要な役割を果たすと考えられている (Sucar, 2021)．

2.1 人間同士のコミュニケーションツールとしての応用

2.1.1 世界銀行の太陽光発電＋蓄電池システムの導入へのイニシアティブ

世界銀行は 11月28日に，途上国向けに大規模な太陽光発電＋蓄電システムを導入するために，どのようにプロジェクトを進めれば良いかの実践的なフレームワークを提供する報告書 (Jain et al., 2023) を公開した（プレスリリース）．

安定したエネルギー供給源の確保も多くの途上国にとって重要な課題であるが，太陽光発電システムを導入し，化石燃料への依存度を低減させることも（特に公的債務がかさんでいる国家では）同時に重要である．これを可能にするフレームワークを提供することが，本報告書の目的であるようである．

そのフレームワークは4段階

実行可能性の評価：長期的なコスト，既存電力網への統合の方法，需要予測などの予備調査．
ビジネスモデルの選択：二部料金契約，容量契約，混合契約の3つを提示している．
リスク配分の方法
競争入札による調達と実行

からなるが，特に 2.のビジネスモデルの選択について，多くのケーススタディを通じて得た「どの変数に応じてどのモデルが選択されるべきか」の知見を決定木の形にまとめている．

Decision Tree for Selecting a Business Model Figure 3.2 from (Jain et al., 2023, p. 41)

The report’s ready-to-use planning framework, the decision-making tree, sample business models, and the PPA template aim to streamline the adoption of solar-plus-storage projects that leverage private investments in countries where fuel-dependency is putting stress on limited public resources. (Jain et al., 2023)

報告書は、12月初旬にアラブ首長国連邦のドバイで開催される気候変動枠組み条約第28回締約国会議（COP28）で発表される。–プレスリリース

2.1.2 世界銀行の気候変動対策イニシアティブ

世界銀行は過去にも，気候変動対策の分野でも，同様の報告書と簡単な決定木（フローチャート）を発表している．

No generally accepted methodology for assessing the significance of climate risks relative to all other risks to water resources projects currently exists. This book puts forth a decision support framework in the form of a decision tree to meet this need. (Ray and Brown, 2015)

2.2 機械とのコミュニケーションツールとしての応用

木構造というのは計算機にとっても扱いやすい構造であり，決定木をデータから学習することで大いに我々の意思決定に活用することができる．これが現代において，機械学習技術が我々に与えてくれる希望の形である．

2.2.1 決定木学習

どう考えても，決定木は人間が書くよりも，データから学習する方が良い．これが 決定木（学習） (Breiman et al., 1984) である．

これは初め，回帰木 という名前で，単関数の線型和を用いたノンパラメトリック回帰手法として導入された．さらにアンサンブル法と組み合わせて精度を向上させたものが ランダムフォレスト (Breiman, 2001) と呼ばれる手法であり，現在極めて主流な手法となっている．

2.2.2 2017年度日本経済白書

内閣府が発表している日本経済白書の 2017年度版の第二章では「多様化する職業キャリアの現状と課題」を扱っている．

第3節にて，リスキリングに関して調べられており，「自主的にキャリア設計をしたい人を決める変数は何か？」を決定木学習によって調べている．⁷

分析結果をみると（第2－3－7図（2））、正社員では、自主的に職業生活設計を考えている割合は、将来に備える目的で自己啓発を実施している人では8割となるが、実施していない人では65％と大きく下がる。だが、実施していなくても大卒・院卒であれば、職業生活設計の自主性割合は73％と増えるが、大卒・院卒以外では59％と大きく差が開く。–日本経済2017-2018

第1節では，転職市場の流動性を調べるにあたって，決定木を用いたブースティングにより，転職による賃金上昇の説明変数で，最も有力なものは何かを調べている．

まず、転職前後の賃金変化と関係の深い変数を調べるため、機械学習の手法を用いて、転職後に賃金が変化する人の特徴について整理する。ここでは機械学習の分野でよく使われている「ランダム・フォレスト」という手法を用いた。同手法は、説明変数の数が多くても対応でき、それぞれの説明変数の「重要度」を算出できることから、転職者が持つ多数の特徴のうち、どこに注目するのが適切かを把握するのに有用であると考えられる。–日本経済2017-2018

なお，結果は以下の通りである．

2.2.3 ランダムフォレストとは何か？

せっかくなので，日本経済付記2-1 に付された簡潔な説明を引用する．

ランダム・フォレストは、学習データから「決定木」と呼ばれるツリー構造をしたグラフを大量に作成し、作成した決定木を元に多数決で最良の結果を導き出す方法である。–日本経済2017-2018

ランダム・フォレストはバギングと呼ばれるアンサンブル法の一種である．アンサンブル法 とは，性能の芳しくない小さな学習器をたくさん集め，これらを効率的に組み合わせることで全体として優れた性能を発揮するように組み合わせる，一段階高次元な機械学習手法であり，バギング とは「1つ1つは信頼出来ない出力でも，全ての平均を取れば性能が良くなる」という考え方に基づく手法である．⁸

特に決定木に対してバギングを使用した場合，その手法は ランダム・フォレスト と呼ばれる．これがうまくいく理由は，アンサンブルの過程にある．学習の段階では何も最適化しておらず，アンサンブルの段階で最適化されているのである．

アンサンブル法は極めてアドホックに感じられるかも知れないが，実践の場面では重要な技術であり，実際 Kaggle などのデータコンペティションでは最も広く見られる戦略の1つである．

3 グラフィカルモデルによる意思決定支援

本書では取り上げられなかったが，意思決定の場面こそベイズ統計学の本領 と言えるものである．⁹

3.1 グラフィカルモデルの利用

本書で解説されている決定木による意思決定分析の先に，近年では Bayesian Network などの新しい道具が，確率的グラフィカルモデリングの分野から追加されている (Smith, 2010)．

These graphical methods help draw different aspects of a decision problem together into a coherent whole and provide frameworks where data can be used to support a Bayesian decision analysis. (Smith, 2010, p. viii)

これは，決定木によるイベントの表現では，イベントの間の依存関係を表現することが出来ない（現実を単純化し過ぎている）という欠点を，木構造を一般のグラフ構造に拡張することで解決したものである．¹⁰

構造は多少複雑になるが，視覚的な理解も引き続き用意である同時に，近年では多くの推論手法が提案されつつある (Sucar, 2021)．

3.2 法廷での利用について

(Smith, 2010, p. 20) では，法廷での DNA 証拠の使用をきっかけに，「確率」を用いた議論が法廷に導入されたことに触れて，ベイズの枠組みは次の意味で親和性が高いと論じている．そのことは，本勉強会で第一章の内容を学んできた皆さんには首肯いただけることだろう．

ベイズ統計学は演繹的論理の拡張であり，厳密で論理的なフレームワークを提供してくれる．
どうしてその意思決定に至ったかを，透明で一貫性のある方法で説明することができる．

3.3 法科学への応用

Bayesian Network は法科学への応用が進んでいる．¹¹

A problem that arises in a courtroom, affecting both lawyers, witnesses and jurors, is that several pieces of evidence have to be put together before a reasoned judgement can be reached: as when motive has to be considered along with material evidence. Probability is designed to effect such combinations but the accumulation of simple rules can produce complicated procedures. Methods of handling sets of evidence have been developed: for example Bayes nets (…). There is a fascinating interplay here between the lawyer and the scientist where they can learn from each other and develop tools that significantly assist in the production of a better judicial system.–Foreword by Dennis Lindley (Aitken and Taroni, 2004, p. 24)

References

Aitken, C. G. G., and Taroni, F. (2004). Statistics and the evaluation of evidence for forensic scientists. John Wiley & Sons.

Breiman, L. (2001). Random forests. Machine Learning, 45, 5–32.

Breiman, L., Friedman, J., Stone, C. J., and Olshen, R. A. (1984). Classification and regression trees. Chapman & Hall.

Dentcheva, D., and Ruszczynski, A. (2013). Common mathematical foundations of expected utility and dual utility theories. SIAM Journal on Optimization, 1(23).

Hansen, B. E. (2022). Econometrics. Princeton University Press.

Jain, A., Kanaan, T., and Maurer, L. (2023). Unlocking the energy transition - guidelines for planning solar-plus-storage projects. ESMAP Paper, Washington, D.C.: World Bank Group.

Raiffa, H., and Schlaifer, R. (1961). Applied statistical decision theory. Harvard Business School.

Ray, P. A., and Brown, C. M. (2015). Confronting climate uncertainty in water resources planning and project design: The decision tree framework. Washington, D.C.: World Bank Group.

Smith, J. Q. (2010). Bayesian decision analysis: Principles and practice. Cambridge University Press.

Sucar, L. E. (2021). Probabilistic graphical models: Principles and applications. Springer London.

Taroni, F., Biedermann, A., Bozza, S., Garbolino, P., and Aitken, C. (2014). Bayesian networks for probabilistic inference and decision analysis in forensic science. John Wiley & Sons.

von Neumann, J., and Morgenstern, O. (1944). Theory of games and economic behaviour. Princeton University Press.

草野耕一. (2016). 数理法務のすすめ. 有斐閣.

Footnotes

加えて，p.55 に「上記の公理からの演繹的推論によって次の結論が導き出される」とあるが，これは「効用」「単調増加」などの未定義用語を含むため，「演繹的推論によって」というのは誤謬というべきである．↩︎
すなわち反射的 \(x\precsim\) で推移的な二項関係↩︎
さらに \(X\) を prospect space という．↩︎
すなわち（反対称性を満たさないが）「全順序」であるということである．↩︎
教科書 (草野耕一, 2016) では「連続性」とあったが，ここでは (von Neumann and Morgenstern, 1944) の原著に従う．↩︎
記法については数学記法一覧参照．↩︎
決定木学習について，付記2-1 にて「決定木による分類は、説明変数によるサンプルの分割を繰り返しながら徐々に分類目的（職業設計を自分で実施）の予測誤差を小さくしていく手法である。説明変数間の相互作用を考慮した分類が可能であり、複数の説明変数で分割していくことで職業設計を自分でしたい人の比率が高まる（低まる）樹形図（tree）が作成できる。」と述べられている．↩︎
Bootstrap aggregating の略である (Hansen, 2022, p. 927)．↩︎
(Smith, 2010, p. 8) で，近年の決定分析の文脈でベイズの手法が興隆している理由の一つに，ベイズ計算手法の発展を挙げている．↩︎
(Smith, 2010, p. 59) 2.8節も参照．↩︎
(Taroni et al., 2014), (Smith, 2010, pp. 34–37) 2.3.1節↩︎