福井秀樹“Evaluating Different Covariate Balancing Methods: A Monte Carlo Simulation.”
[Open Access] Fukui, H. (2023). Evaluating Different Covariate Balancing Methods: A Monte Carlo Simulation. Statistics, Politics and Policy, 14(2), 205-326.
https://doi.org/10.1515/spp-2022-0019
本稿は、社会科学や医学・疫学の分野で広く用いられてきた傾向スコア・マッチング(Propensity Score Matching, PSM)に対するKing and Nielsen (2019)の批判を追試により検証し、同手法の有効性をあらためて確認したものです。
非実験的手法の一つであるマッチングは、処置群と比較群の間で処置以外の要因の効果をより均質にすることで、処置効果推定値のバイアスを低減させることを目的とするものです。この手法は、実験実施が必ずしも常に可能ではない公共政策や医学・疫学の分野で、観察データを用いた因果効果推定におけるバイアス低減に有効であるとして、広く使われてきました。2023年7月9日現在、Scopusの文献検索では41,790の学術論文がPSMに言及しています。
これに対し、King and Nielsen (2019)は、傾向スコアを用いた非復元抽出1対1最近傍マッチングに基づく観察値の削除は、共変量バランスをむしろ悪化させ、ひいては処置効果の推定におけるバイアスを増大させる可能性がある(PSMパラドクス)とし、PSM以外のマッチング手法を用いるべきであると主張しました。
King and Nielsen (2019)の第一著者Gary Kingはハーバード大学の政治学者であり、学術界におけるその影響力には非常に高いものがあります。事実、King and Nielsen (2019)は、Scopusによると、2023年7月9日現在、564の文献で引用されています。もっとも、それゆえに追試は不要、と考えることは危険です。というのも、定評ある学術誌に掲載された実験等の結果が再現できないという問題、「再現性の危機」は、学術界においてつとに大問題となっているためです。問題はそこにとどまりません。心理学、経済学の学術誌および『ネイチャー』と『サイエンス』に掲載された80論文の引用回数を検証した Serra-Garcia and Gneezy (2021)によると、実験結果を再現できない論文のほうが、再現できる論文よりも、年平均で16回も多く引用されているのです。
再現不可能な研究の「結果」が、再現できないにもかかわらず信じ込まれる事態は社会にとって危険です。そこで本稿は、PSMを含む5つの重み付けとマッチング手法が、有限標本状況における処置効果推定時の共変量バランスの改善とバイアスの低減にどの程度有効であるかを、モンテカルロ・シミュレーション(以下、シミュレーション)により検討しました。
本稿のシミュレーションは、PSMだけでなく、King and Nielsen (2019)がよりよいマッチング手法として推奨したマハラノビス距離マッチング(MDM)や粗指標完全マッチング(CEM)でも、PSMパラドクスが観察されることを明らかにしました。さらに、King and Nielsen (2019)の主張とは対照的に、本稿のシミュレーション結果は、逆確率重み付け(IPW)とPSMは、少なくとも本稿のデータ生成等の設定においては、概ねMDMやCEMよりも低いバイアス推定値を実現することを明らかにしました。加えて本稿の分析結果は、適切な共変量を用いたOLSが、他の重み付けやマッチング手法と同程度もしくはそれ以上に選択バイアスを減少させることも示唆しています。
本稿の分析結果は、観察データを用いた分析においては、画一的な推定量を求めることを避け、利用可能なデータの特性を精査し、標本に適した非実験的推定量(OLSやPSMも含む)を注意深く特定することが重要であることを示唆しています。
なお、本稿は令和5年度法文学部戦略経費の助成を得てオープンアクセス論文として公表されました。
参考文献
King, G., & Nielsen, R. 2019. Why propensity scores should not be used for matching. Political analysis, 27(4), 435-454.
Serra-Garcia, M., and Gneezy, U. 2021. Nonreplicable Publications Are Cited More than Replicable Ones. Science Advances, 7(21), eabd1705.
※福井教員のその他の研究業績についてはresearchmapをご参照ください。
https://researchmap.jp/read0064481