ベイズデータ解析2

平均処置効果の推定とセミパラメトリック法

Statistics
Author

司馬博文

Published

9/23/2024

Modified

9/29/2024

概要

人間を対象にする介入の研究では,介入の前後で変化があったかが争点となる.

関連記事

1 はじめに

1.1 概観

現代の因果推論は平均処置効果 (ATE) \[ \tau:=\operatorname{E}[Y_i^1]-\operatorname{E}[Y_i^0] \] と関連する推定対象 (estimand / target parameter) に集中している.

1.1.1 潜在結果モデル

このように 因果効果 と呼ばれる推定対象を設定し,良い実験計画を構築してこれを推定するという枠組みは (Neyman et al., 1990) から始まるもので,(Rubin, 1974) の因果モデルや 潜在結果モデル (potential outcome model),または 反実仮想モデル (counterfactual model) とも呼ばれる.

潜在結果モデルを用いた因果推論

潜在結果モデルは特定の介入の因果効果を推定する枠組みであり,十分に考慮された実験計画が必要であるが,それにより不必要なモデリングの議論を避けることができる.

このために,極めて多くの人間を対象とする科学分野で潜在結果モデルが用いられている.

この方法では,ランダム化された実験,あるいは欠測メカニズムが推定しやすいように工夫された「擬似実験」を行なうことで,ほとんどモデリングの議論を表に出さずとも ATE やその他の実験科学者が設定する量を不偏推定可能にする,というアプローチをとる.1

最終的に ATE の推定においては,各個体 \(i\in[n]\) に対して処置を行った場合の結果 \(Y_i^1\) と行わなかった場合の結果 \(Y_i^0\) とのいずれかは必ず欠測するということである.2

端的に言えば,統計学のサンプリング論と科学の実験計画論との邂逅である (Ding, 2024)

1.1.2 構造的因果モデル

しかし他の多くの科学では実験的介入が難しかったり,実験計画だけでは背後の交絡要因が統制しきれない状況がある.

またはそもそも,科学的な興味の対象が「因果効果」だけでなくデータの背後にある「モデル」にもある場合も多い.

このような場合には,変数同士の関係を丁寧にモデリングし,加えて識別可能性を確保するなどの理論的な配慮が欠かせない.

これを可能にするのが 構造的因果モデル (SCM: Structural Causal Model) またはノンパラメトリック構造方程式モデルの枠組みである (Bongers et al., 2021)

多くはグラフィカルモデルと計算機的な方法を組み合わせることで,推定可能な高次元モデルを構築する.このモデルに対する「変換」として,介入操作と因果効果を定義する.

構造的因果モデルを用いた因果推論

自然を対象にする科学分野を中心として,介入できない状況下での因果推論が構造的因果モデルの枠組みで行われる.

モデリングが必要不可欠であるため,計算的にも困難な問題となる.それゆえ計算機科学や機械学習の分野で盛んに研究されている.

1.1.3 まとめ

  • 潜在結果アプローチ:実験を行うことでモデリングを回避する.
  • 構造的因果モデル:モデリングを行い,モデルの変換として因果効果を定義する.特定の条件下 (Rubin, 1980) で離散変数に実験処置介入を行った場合として,潜在結果アプローチを含むとも見れる.3

歴史的には,どちらかというと構造的因果モデル → 潜在結果モデルという順に注目された.

この現象は特に経済学で顕著に起こった.Cowles 委員会のイニシアティブの下で,初めは構造的なアプローチを取っていた経済学が,実験事実との乖離が激しいことの自覚から,実験と統計的推論を取り入れるように生まれ変わった現象は 信頼性革命 と呼ばれている.

本章では以降,各分野における因果推論の歴史を議論する.

1.2 経済学における因果推論の歴史

経済学において,(Haavelmo, 1943) は「構造推定」の枠組みで政策介入の因果効果を推定しようとした.4

構造推定では「同時方程式」により統計モデルを定義するが,その際には識別可能性が問題になる.

当時の計算資源では十分な推定を実行することができず,加えて,マクロなモデルに対する「介入」の定義を正しく与えていなかった (Lucas, 1976)5

時代が下ると,このアプローチでの経済学は大きな批判に晒され,より実験的なアプローチを採用するように変化を余儀なくされた.これが信頼性革命である.

1.3 計量経済学における信頼性革命

(Leamer, 1983) は計量経済学の手法と古典的な実験科学とを比較し,計量経済学の信頼性は感度解析とロバストを取り入れることによって(のみ)回復されるだろうと論じた.

(LaLonde, 1986) は職業訓練の効果に関する観察研究と実験研究の結果が大きく異なることを示し,当時の計量経済学が抱えていた体質に抜本的改革を迫った.

(Leamer, 1983) が「よく計画された実験を超える統計的手法など出てこないかもしれない」と論じていた通り,その後の信頼性革命は主に実験計画を改善することと擬似ランダム化の適切な取り扱いによって達成された (Angrist and Pischke, 2010)

そのキーワードは「自然実験」や「擬似実験」と呼ばれており,サーベイ手法での「擬似ランダム化」アプローチに相当する.擬似ランダム化については次稿も参照

1.4 媒介分析

媒介分析 (mediation analysis) (J. M. Robins and Greenland, 1992) においては,因果の流れが複数あり得る場合に,媒介因子 \(Z\) を経由した 間接効果 の量を総合効果の中から識別することを目標とする.

媒介変数 \(Z\) を表す図式

一方でモデリングに基づいた方法も可能である (Pearl, 2012), (Nguyen et al., 2021)6

はじめ社会学や社会心理学においてはモデルによる媒介分析が試みられていた (Alwin and Hauser, 1975), (Baron and Kenny, 1986)

2 交絡調整法

2.1 はじめに

因果推論において,実験計画による工夫に限界がある際は,条件 \[ (Y^0_i,Y^1_i)\perp\!\!\!\perp A_i|X_i \tag{1}\] を満たす共変量 \(X_i\) の特定を目指す.

この \(X_i\)交絡因子 (cofounders) といい,条件 (1) を 非交絡性 (unconfoundedness) または 無視可能性 (ignorability) という.

2.2 操作変数法

操作変数 (instrumental variable) とは,処置変数(または説明変数)をよく予測するような補助変数であり,補助変数と処置変数の間の関係を推定することで擬似的に層別サンプリングが行われたとみなせるようなものである.7

未観測の交絡因子が予期される場合でも,操作変数が利用可能である場合はこれを調整することができる.

回帰モデル \[ Y=X_1^\top\beta_1+X_2^\top\beta_2+\epsilon \] において,\(X_1\) は外生性を持つが,\(X_2\) は内生性を持ってしまうとする: \[ \operatorname{E}[X_1\epsilon]=0,\quad\operatorname{E}[X_2\epsilon]\ne0. \] このとき,次の3条件を満たす \(X\) と同次元の \(Z\) を操作変数という:

  1. 外生性:\(\operatorname{E}[Z\epsilon]=0\)
  2. 多重線型性の非存在:\(\operatorname{rank}\operatorname{E}[ZZ^\top]>0\)
  3. 関連性:\(\operatorname{rank}\operatorname{E}[ZX^\top]=\operatorname{rank}\operatorname{E}[X]\)

操作変数 \(Z_2\)\(X_2\) の代わりに説明変数に用いることで内生性の問題が除去される.このため \(Z_2\)排除されていた外生変数 (excluded exogenous variable) ともいう.

操作変数が存在するとき,遵守者の平均処置効果,すなわち 局所平均処置効果 (LATE: Local Average Treatment Effect) が識別可能になる (Imbens and Angrist, 1994)

2.3 回帰非連続デザイン

回帰不連続デザイン (RDD: Regression Discontinuity Design) では,割り当ての閾値の近傍では擬似ランダム化が行われていると仮定できる状況において,閾値の近傍に位置した部分標本を用いて,その部分標本での処置効果を推定する.

2.4 差の差法

差分の差法 (DID: Difference-in-Differences) は,被曝群と比較群それぞれの処置前後の差分に現れる差分を,処置効果の近似とみなす方法である.

被曝群と比較群をマッチングすることで共変量を統制することが期待されるが,処置の有無と関係を持つ未統制の共変量の調整が問題となる (Bertrand et al., 2004)

2.5 周辺構造モデル

周辺構造モデルは平均処置効果をパラメータに持つモデルであり (J. M. Robins, 2000),潜在結果変数の(周辺)平均構造をモデリングする: \[ g(\operatorname{E}[Y^a_i|L_i])=\psi_0+\psi_1a+\psi_2L_i+\psi_3L_ia. \]

統計ソフトの充実によりよく使われるようになったが,後述の構造的ネストモデルと \(G\)-推定の方が一般的であり,より効率的である (Vansteelandt and Joffe, 2014)

2.6 \(G\)-推定

\(G\)-推定 (J. M. Robins et al., 2000) は不服従など処置変数 \(D\) に依存した交絡を調整するために,構造的平均モデル,パラメトリック \(G\)-公式 (J. Robins, 1986),構造的ネストモデル (structural nested model) (J. M. Robins et al., 1992) と同時に提案された.

構造的平均モデル (SMM: Structural Mean Model) では,リンク関数 \(g\) の自由度を残して \[ g(\operatorname{E}[Y^a|L=l,A=a])-g(\operatorname{E}[Y^0|L=l,A=a])=\gamma^*(l,a;\psi^*) \] により処置 \(A=a\) の平均因果効果にパラメトリックな仮定をおく.

3 モデルフリー推定手法

3.1 はじめに

疫学では一般化推定方程式,計量経済学では一般化モーメント法など,モデルを全面に押し出さずに推定目標を定義し,これを推定する手法が用いられる.

このように関心のある母数以外の 局外母数 (nuisance parameter) にはモデルを明示的に想定しない手法を セミパラメトリック法 (semi-parametric method) という.

このような手法では,興味のあるパラメータがはっきりしているため,それ以外のモデルの仮定にはひとまず興味がなく,誤特定の下でも効率的な推論ができるロバスト性が重視される.9

3.2 共通の枠組み

ある関数 \(g\) に関して, \[ \operatorname{E}[g(\beta,X,Y)]=0 \tag{2}\] によって推定対象 \(\beta\) を特徴付ける場面は多い.10

条件 (2) によって推定対象 \(\beta\) が定義されているとき,標本上の対応する方程式 \[ \frac{1}{n}\sum_{i=1}^ng(\beta,X_i,Y_i)=0 \tag{3}\] の解として推定量を構成することが自然な発想になる.

名前一覧
  • 数理統計学・頑健統計では極値点として定義される \(M\)-推定量(第 3.3 節)と区別して \(Z\)-推定量 とも呼ばれる (van der Vaart, 1998)
  • 疫学では \(g\)推定関数 (Godambe, 1997),式 (2) を推定関数の 不偏性,式 (3) を 推定方程式 という.
  • 計量経済学では 一般化モーメント法 (GMM: Generalized Method of Moments) (L. P. Hansen, 1982) として知られる.式 (3) を モーメント方程式 という.主に構造方程式モデルの推定に用いられた.

特に一般化モーメント法は,モデルの議論を伴わないリサーチクエスチョンに応えるために格好の枠組みである.

例えば線型回帰係数に対する OLS 推定量は \(g(\beta,X)=X(Y-X^\top\beta)\) によって定まる一般化モーメント推定量である.

操作変数推定量は \(g(\beta,X,Y,Z)=Z(Y-X^\top\beta)\) によって定まる一般化モーメント推定量である.

このような推定量はモデルに依存しない方法を与える上に,漸近論の観点で好ましい性質を持つ (L. P. Hansen, 1982)

3.3 \(M\)-推定量

最尤推定量のように,特定の目的関数 \[ M_n(\theta):=\frac{1}{n}\sum_{i=1}^nm_\theta(X_i) \] を最大化する点として定義される推定量 \(\widehat{\theta}\)\(M\)-推定量 と呼ばれる.

同時に最尤推定量は,スコア関数の零点としても特徴付けられる (Carmer, 1946)

大変大雑把に言えば,モーメント法 → 最尤推定量 → \(Z\)-推定量という歴史的な流れがある (Le Cam, 1952)

名前一覧
  • 頑健統計において \(M\)-推定量 (P. J. Huber, 1964) と呼ばれる.11
  • 数理統計において最小コントラスト推定量 (Pfanzagl, 1969) と呼ばれる.

頑健統計に起源を持つように,\(M\)-推定量,一般に \(Z\)-推定量は極めて安定して一致性と漸近正規性をもつ.

推定方程式 (3) を近似的に解いても大丈夫だし,推定関数の不偏性 (2) が漸近的にしか成り立たなくてもほとんど問題がない.

3.4 一般化推定方程式

一般化推定方程式は,一般化線型モデル (Nelder and Wedderburn, 1972) における,擬似スコア \[ U(Y_j,\beta|X_j)=(\partial_\beta\mu(X_j^\top\beta))^\top V_i^{-1}(Y_i-\mu(X_i^\top\beta)) \] を推定関数に用いた一般化モーメント法である.

\(U\) を擬似スコアと呼んだのは,誤差の分散 \(V_i\) はモデルの仮定により定まるわけではなく,主に推定効率のために「作業仮設として」設定されたものであるためである.

実際,正規化した \(V_i\) は作業相関係数⾏列ともいう.\(V_i\) を代入した尤度を 擬似尤度 (quasi-likelihood) (Wedderburn, 1974) という.

この方法では,真の誤差分布が相関を持つようなものであった場合でも,平均構造 \(\mu\) の特定にさえ成功すれば,\(\beta\) に関して不偏推定を可能にする.ある種の最尤推定の迂回路である.

\(V_i\) の特定に成功した場合は,セミパラメトリック最適な推定量を与える.

二次のモーメントに関しても関心がある場合は,混合効果モデルなどを通じたモデル化が必要になる.詳しくは この稿 を参照.

3.5 経験尤度法

データ \(\{x_i\}_{i=1}^n\subset\mathbb{R}^d\) に関する 経験尤度 (empirical likelihood) (Owen, 1988) とは,分布関数の汎函数 \[ L(F):=\prod_{i=1}^nF(X_i)-F(X_i-)=\prod_{i=1}^n\operatorname{P}[X=x_i] \] をいう.

この観点から,経験分布関数 \(F_n\) は経験尤度を最大にするノンパラメトリック推定量である.

最尤法はモデルの全ての母数を特定化しない限り実行できないが,経験尤度の最大化ならば可能である.12

\[ \sum_{i=1}^np_ig(x_i,\theta)=0 \] を満たす中で経験尤度を最大化する \(\theta\)最大経験尤度推定量 (MELE: maximum empirical likelihood estimator) (Qin and Lawless, 1994) という.

4 文献案内

4.1 ベイズ推定

平均処置効果のベイズ推定は初めから (Rubin, 1978) により考えられていた.

近年のレビューには (Li et al., 2023) がある.

First and most importantly, by enabling imputation of all missing potential outcomes, the Bayesian paradigm provides a unified inferential framework for any causal estimand. (Li et al., 2023, p. 18)

頻度論的な因果推論手法は特にモデルフリーな感覚があり,応用分野に浸透しきっている.モデリングの必要性を感じにくいこともあり,ベイズ的な方法が出遅れたままの感がある.

ベイズ手法の成功事例には (Dorie et al., 2019) がある.ここでは,2016 年の Atlantic Causal Inference Conference のデータ解析コンペティションで,BART (Bayesian Additive Regression Trees) に基づく手法が優勝したことが考察されている.

In general, Bayesian nonparametrics offers both the flexibility of modern machine learning algorithms and the statistically-principled uncertainty quantification of Bayesian inference. (Linero and Antonelli, 2023)

4.2 計量経済学

(川口康平 and 澤田真行, 2024) は日本語の文献であるが,最新の手法も含めた潜在結果モデルの因果推論手法を,計量経済学の構造推定の文脈から切り離して紹介しており,計量経済学に限らず広い聴衆にリーチすべき内容になっている.GitHub サポートページはこちら

4.3 生物統計学

(Hernán and Robins, 2020) は 2024 年 reviesed 版も 無料で公開されている

4.4 社会科学

(Morgan and Winship, 2014) は社会学の本である.4章で媒介解析を扱うと同時に,第5章では Rubin の周辺構造モデルも扱っている.

(Brand et al., 2023) は社会学に力点が置かれているが,因果推論手法一般について極めて良い概観を与える読みやすいレビューである.

4.5 統計学

(Rosenbaum, 2023) は統計学の本である.

References

Alwin, D. F., and Hauser, R. M. (1975). The decomposition of effects in path analysis. American Sociological Review, 40(1), 37–47.
Angrist, J. D., and Pischke, J.-S. (2010). The credibility revolution in empirical economics: How better research design is taking the con out of econometrics. The Journal of Economic Perspectives, 24(2), 3–30.
Baron, R. M., and Kenny, D. A. (1986). The moderator–mediator variable distinction in social psychological research: Conceptual, strategic, and statistical considerations. Journal of Personality and Social Psychology, 51(6), 1173–1182.
Bertrand, M., Duflo, E., and Mullainathan, S. (2004). How Much Should We Trust Differences-In-Differences Estimates?*. The Quarterly Journal of Economics, 119(1), 249–275.
Bongers, S., Forré, P., Peters, J., and Mooij, J. M. (2021). Foundations of structural causal models with cycles and latent variables. The Annals of Statistics, 49(5), 2885–2915.
Brand, J. E., Zhou, X., and Xie, Y. (2023). Recent developments in causal inference and machine learning. Annual Review of Sociology, 49(Volume 49, 2023), 81–110. Journal Article.
Carmer, H. (1946). Mathematical methods of statistics. Princeton University Press.
Cui, P., and Athey, S. (2022). Stable learning establishes some common ground between causal inference and machine learning. Nature Machine Intelligence, 4(2), 110–115.
Ding, P. (2024). A First Course in Causal Inference. Chapman; Hall/CRC.
Dorie, V., Hill, J., Shalit, U., Scott, M., and Cervone, D. (2019). Automated versus do-it-yourself methods for causal inference: Lessons learned from a data analysis competition. Statistical Science, 34(1), pp. 43–68.
Godambe, V. P. (1997). Estimating functions: A synthesis of least squares and maximum likelihood methods. Lecture Notes-Monograph Series, 32, 5–15.
Haavelmo, T. (1943). The statistical implications of a system of simultaneous equations. Econometrica, 11(1), 1–12.
Hansen, B. E. (2022). Econometrics. Princeton University Press.
Hansen, L. P. (1982). Large sample properties of generalized method of moments estimators. Econometrica, 50(4), 1029–1054.
Heckman, J. J. (2010). Building bridges between structural and program evaluation approaches to evaluating policy. Journal of Economic Literature, 48(2), 356–398.
Hernán, M. A., and Robins, J. M. (2020). Causal Inference: What If. Boca Raton: Chapman & Hall/CRC.
Holland, P. W. (1986). Statistics and causal inference. Journal of the American Statistical Association, 81(396), 945–960.
Huber, M. (2023). Causal Analysis: Impact Evaluation and Causal Machine Learning with Applications in R. MIT Press.
Huber, P. J. (1964). Robust Estimation of a Location Parameter. The Annals of Mathematical Statistics, 35(1), 73–101.
Huber, P. J. (1981). Robust statistics. John Wiley & Sons.
Imbens, G. W., and Angrist, J. D. (1994). Identification and estimation of local average treatment effects. Econometrica, 62(2), 467–475.
Laan, M. J. van der, and Rose, S. (2011). Targeted Learning: Causal Inference for Observational and Experimental Data. Springer New York.
LaLonde, R. J. (1986). Evaluating the econometric evaluations of training programs with experimental data. The American Economic Review, 76(4), 604–620.
Le Cam, L. M. (1952). On some asymptotic properties of maximum likelihood estimates and related bayes’ estimates (PhD thesis). UC Berkeley. Retrieved from https://math.berkeley.edu/publications/some-asymptotic-properties-maximum-likelihood-estimates-and-related-bayes-estimates
Leamer, E. E. (1983). Let’s take the con out of econometrics. The American Economic Review, 73(1), 31–43.
Li, F., Ding, P., and Mealli, F. (2023). Bayesian causal inference: A critical review. Philosophical Transactions of the Royal Society A: Mathematical Physical and Engineering Sciences, 381(2247).
Linero, A. R., and Antonelli, J. L. (2023). The how and why of bayesian nonparametric causal inference. WIREs Computational Statistics, 15(1), e1583.
Lucas, R. E. (1976). Econometric policy evaluation: A critique. Carnegie-Rochester Conference Series on Public Policy, 1, 19–46.
Morgan, S. L., and Winship, C. (2014). Counterfactuals and Causal Inference. Cambridge University Press.
Nelder, J. A., and Wedderburn, R. W. M. (1972). Generalized linear models. Journal of the Royal Statistical Society, Series A (General), 135(3), 370–384.
Neyman, J., Dabrowska, D. M., and Speed, T. P. (1990). On the Application of Probability Theory to Agricultural Experiments. Essay on Principles. Section 9. Statistical Science, 5(4), 465–472.
Nguyen, T. Q., Schmid, I., and Stuart, E. A. (2021). Clarifying causal mediation analysis for the applied researcher: Defining effects based on what we want to learn. Psychological Methods, 26(2), 255–271.
Owen, A. B. (1988). Empirical likelihood ratio confidence intervals for a single functional. Biometrika, 75(2), 237–249.
Pearl, J. (1988). Probabilistic reasoning in intelligent systems. Morgan Kaufmann.
Pearl, J. (2012). The mediation formula: A guide to the assessment of causal pathways in nonlinear models. In Causality, pages 151–179. John Wiley & Sons, Ltd.
Pearl, J. (2015). TRYGVE HAAVELMO AND THE EMERGENCE OF CAUSAL CALCULUS. Econometric Theory, 31(1), 152–179.
Pfanzagl, J. (1969). On the measurability and consistency of minimum contrast estimates. Metrika, 14(1), 249–272.
Qin, J., and Lawless, J. (1994). Empirical Likelihood and General Estimating Equations. The Annals of Statistics, 22(1), 300–325.
Robins, J. (1986). A new approach to causal inference in mortality studies with a sustained exposure period—application to control of the healthy worker survivor effect. Mathematical Modelling, 7(9), 1393–1512.
Robins, J. M. (2000). Marginal structural models versus structural nested models as tools for causal inference. In M. E. Halloran and D. Berry, editors, Statistical models in epidemiology, the environment, and clinical trials, pages 95–133. New York, NY: Springer New York.
Robins, J. M., and Greenland, S. (1992). Identifiability and exchangeability for direct and indirect effects. Epidemiology, 3(2).
Robins, J. M., Hernán, M. Á., and Brumback, B. (2000). Marginal structural models and causal inference in epidemiology. Epidemiology, 11(5).
Robins, J. M., Mark, S. D., and Newey, W. K. (1992). Estimating exposure effects by modelling the expectation of exposure conditional on confounders. Biometrics, 48(2), 479–495.
Rosenbaum, P. R. (2023). Causal inference. MIT Press.
Rubin, D. B. (1974). Estimating causal effects of treatments in randomized and nonrandomized studies. Journal of Educational Psychology, 66(5), 688–701.
Rubin, D. B. (1978). Bayesian inference for causal effects: The role of randomization. The Annals of Statistics, 6(1), 34–58.
Rubin, D. B. (1980). Randomization analysis of experimental data: The fisher randomization test comment. Journal of the American Statistical Association, 75(371), 591–593.
Runge, J., Gerhardus, A., Varando, G., Eyring, V., and Camps-Valls, G. (2023). Causal inference for time series. Nature Reviews Earth & Environment, 4(7), 487–505.
Ryosuke Fujii, Y. T., Shuntaro Sato, and Suzuki, K. (2022). DNA methylation as a mediator of associations between the environment and chronic diseases: A scoping review on application of mediation analysis. Epigenetics, 17(7), 759–785.
van der Vaart, A. (1998). Asymptotic statistics. Cambridge University Press.
Vansteelandt, S., and Joffe, M. (2014). Structural Nested Models and G-estimation: The Partially Realized Promise. Statistical Science, 29(4), 707–731.
Wedderburn, R. W. M. (1974). Quasi-likelihood functions, generalized linear models, and the gauss-newton method. Biometrika, 61(3), 439–447.
学. (2016). R-6-2 構造的因果モデルから潜在反応モデルへ. 日本行動計量学会大会抄録集, 44, 124–125.
川口康平, and 澤田真行. (2024). 因果推論の計量経済学. 日本評論社.

Footnotes

  1. 科学的な興味の対象は多くの場合モデル全体ではなく,特定の1つのパラメータであり,そのような場合は実験計画を工夫することでモデルに関係なく推定可能になるという発想は (Heckman, 2010) により “Marschak’s Maxim” と呼ばれる.詳しくは (Laan and Rose, 2011) のPearl による foreword も参照.↩︎

  2. 因果推論の根本問題 (Holland, 1986) とも呼ばれる.↩︎

  3. (学, 2016) も参照.↩︎

  4. (川口康平 and 澤田真行, 2024), (Pearl, 2015) も参照.↩︎

  5. 詳しくは ルーカス批判 (Wikipedia) も参照.↩︎

  6. (Laan and Rose, 2011) の Pearl による Foreword も参照.(Ryosuke Fujii and Suzuki, 2022)オンラインページも参照.↩︎

  7. ただし当然結果に依存してはいけない.(Section 2 Imbens and Angrist, 1994, p. 468)(Section 3.1 Hernán and Robins, 2020, p. 28) も参照.↩︎

  8. (Section 12.5 B. E. Hansen, 2022, p. 335) も参照.↩︎

  9. それゆえ最尤法やベイズ法のように,一旦はモデルの想定が必要な手法が忌避されるところがある.↩︎

  10. \(X,Y\) を任意の定数とした際に,\(\beta\) に関して一意な解を持つとき,モーメント条件は 識別可能 であるという.↩︎

  11. 他には \(L\)-, \(R\)-推定量があった (Section 3.2 P. J. Huber, 1981, p. 43)↩︎

  12. 一般化推定方程式のように,作業的な値を代入して得る尤度は 擬似尤度 (quasi-likelihood) という.↩︎