政策評価のための因果関係の見つけ方 ランダム化比較試験入門

【エスター・デュフロおすすめ本 – 貧困、開発経済学専門のノーベル賞受賞者(アビジット・V・バナジーとの共著も)】も確認する

フィールドワーク/開発経済学の本格RCTs実践本

本書はDufloの他Glennerster, and Kremer が筆者である、Handbook of Development Economics 第4巻第61章 Duflo, Glennerster, and Kremer (2008) “Using Randomization in Development Economics Research: A Toolkit”の訳書です。こちらは本格的な研究者、リサーチポジション、大学院生などが開発経済学におけるテーマでの実験的なところからRCTsを行う上で必須となる書籍です。

エステル・デュフロ (著), レイチェル・グレナスター (著), マイケル・クレーマー (著), 小林 庸平 (監修, 翻訳), 石川 貴之 (翻訳), 井上 領介 (翻訳), 名取 淳 (翻訳)
出版社: 日本評論社 (2019/7/25)、出典:出版社HP

訳者まえがき

本書は、Handbook of Development Economics 第4巻第61章 Duflo, Glennerster, and Kremer (2008) “Using Randomization in Development Economics Research: A Toolkit”の訳書である。

経済学の実証研究の世界では、フィールド実験と呼ばれる手法が近年急速 に発展してきた。フィールド実験とは、医療をはじめとした自然科学の分野 で使われてきた「ランダム化比較試験(Randomized Controlled Trial: RCT)」 と呼ばれる手法を、現実社会のなか(フィールド)で適用することによって、 政策等の効果を厳密に測定する手法である。RCT・フィールド実験をいち早く取り入れたのが開発経済学であり、著者の一人であるマサチューセッツ 工科大学のエステル・デュフロ教授はそのパイオニアである。そのため本書 の内容も、基本的には開発経済学においてRCT・フィールド実験を適用することを念頭において執筆されている。しかしながら本書は、理論的な解説 や実践的なノウハウが数多く盛り込まれており、社会科学の実証研究において幅広く役に立つ内容となっている。

とりわけ近年は、先進国を中心として「エビデンスに基づく政策形成 (Evidence-Based Policy Making: EBPM)」が重視されるようになってきた。 EBPM の基本的な考え方や政策形成における RCT・フィールド実験の活用 方法については本文および解説をご覧いただきたいが、RCTフィールド 実験は政策等の効果を精緻に検証するための有用な分析ツールであり、現実 の政策形成のなかでも EBPM のための重要な分析道具のひとつとして位置 づけられるようになってきた。

本書翻訳のきっかけは2015年にさかのぼる。当時の日本では、まだ 「EBPM」という言葉自体ほとんど普及していなかったが、私は、エビデンスを政策形成にもっと活用していくことの必要性を感じていた。本文や解説 をご覧になればお分かりいただけると思うが、政策の意思決定に活用可能な エビデンスを「つくる(=効果検証する)」ためには、経済学の実証研究で広く活用されてきた「後ろ向き評価(retrospective evaluation)」がはっ RCTやフィールド実験といった「前向き評価(prospective evaluatin)」を活用していくことが求められる。また、行政は政策の執行主体であるが、 向き評価を自ら仕込んでいける立場にもある。

しかしながら、私が計量経済学を本格的に学んだ大学院修士理」だけでなく執行主体であるため、前学院修士課程の頃 部的に分析する後ろ向(2004~2006年)は既存のデータを用いて経済現象を実証的に分析する後ろ向き評価が中心だった。前向き評価と後ろ向き評価は、外形的な分析方法>2 似ているものの、その発想は大きく異なる。例えば後ろ向き評価では、呼 存在しているデータや経済現象を観察し、そこから興味深い仮説が構築できるか考え、原因と結果の因果関係が特定可能な条件が満たされているかを検討し、統計的な分析を行う。しかしながら前向き評価の場合は、検証したい 問いを立て、それを検証するためのフィールドを探し、政策(介入)を実際 に実施し、データを収集して分析を行う。伝統的な後ろ向き評価では先にデータがある場合がほとんどであるのに対して、前向き評価ではデータが最後 に収集されるのである。つまり、個々のステップごとにみれば前向き評価と 後ろ向き評価は類似しているものの、全体を貫く発想が大きく異なるのである。そのため私は、RCT やフィールド実験の理論・実践を一度体系的にき ちんと勉強したいと思うようになった。

その頃、旧知の伊藤公一朗さん(現:シカゴ大学公共政策大学院准教授)か ら推薦されたのが本書の原論文だった。伊藤公一朗さんのお名前は、2017年 に出版された『データ分析の力因果関係に迫る思考法』(光文社新書)という書籍でご存知の方も多いと思うが、若手の経済学の実証研究者の世界的な トップランナーの一人で、自身でも数多くの RCT・フィールド実験を手掛けている方である。

原論文を一読して、じっくり読むに値するものであると感じた。私は民間 のシンクタンクに勤務する研究員だが、勉強するのであれば、一人でではなく関心のあるメンバーを集めて勉強会を開催しようと考え、若手メンバー 声を掛けて始まったのが本書の輪読会である。当初、輪読会はあくまでも 分たちの勉強のために開始したものであり、翻訳出版をしようという意図 持っていなかった。しかし読み進むにつれて、その内容が理論面・実践的に双方でとても素晴らしく、ぜひとも日本国内での共有知にしたいと思うよう になった。軌を一にして、日本において EBPM に少しずつ注目が集まり始 め、EBPM のツールのひとつとして RCT が紹介されるようになってきた。 しかしながら本文や解説で述べられているように、RCT はその原理こそ簡 単であるものの、現実社会のなかでそれを実施してくためには、数々の困難 や知っておくべき知識がある。そのため本書の翻訳書の出版には社会的意義 があるのではないかという思いを強く持つようになった。
その頃に相談に乗っていただいたのが後藤康雄さん(現:成城大学社会イ ノベーション学部教授)である。後藤さんは私にとって民間シンクタンク業 界の大先輩であり、日本を代表するエコノミストのお一人であるが、同時に 学術的な深い知見も兼ね備えていらっしゃる稀有な方である。当時経済産業 研究所に所属されていた後藤さんに本書の翻訳書出版についてご相談したと ころ、日本評論社の担当者を早速ご紹介いただき、とんとん拍子で出版が決 まったのである(ただしこの話には後日談があり、出版自体はとんとん拍子で決 まったものの、翻訳・解説に予想以上の時間を要してしまい、当初の出版予定日 から大幅に後ろ倒しになってしまったことは、日本評論社の皆様にお詫びしなければならない。
本書をお読みいただくとお分かりいただけると思うが、決して初歩的な内 容ではなく、統計学や経済学に関する基本的な理解があった方が、より正確 に読み進めることが可能だろう。しかし直感的に理解可能な内容も多く含まれており、数式やテクニカルな記述を読み飛ばしたとしても一読に値するも のである。また、本書を読み進める上で参考になると思われる情報を可能な 限り訳注で補ったため、一見して理解しにくい内容であったとしても、訳注 で理解を補いながら読んでいただけるのではないかと考えている。加えて本 書末尾の解説では、EBPM の基本的な考え方や、EBPM における RCT の 位置づけ、そして本書のエッセンスを説明しているため、本文で理解しにくい部分があれば、適宜解説を参照していただきたい。場合によっては、解説 を先にお読みいただき、全体像を把握した上で本文をお読みいただくと、より一層理解が深まるのではないかと考えている。

本書の翻訳や訳注、そして解説は、内容の正確性に留意しながらも、できるだけ分かりやすい日本語となるように努めた。我々の試みが成功しているかどうかは読者の皆様のご判断に委ねたいが、誤りなどあればご指摘いただければ幸いである。
前述の通り、本書執筆の過程では、伊藤公一朗さんや後藤康雄さんなど数 多くの方にお世話になった。特に日本評論社の道中真紀さんには、原稿を丁 寧にお読みいただき、数多くの改善点をご指摘いただいた。記して感謝申し 上げたい。
本書の内容が日本国内に広まることで、より良い政策形成の一助となれば 幸いである。

令和への改元の日に
訳者を代表して小林 庸平

エステル・デュフロ (著), レイチェル・グレナスター (著), マイケル・クレーマー (著), 小林 庸平 (監修, 翻訳), 石川 貴之 (翻訳), 井上 領介 (翻訳), 名取 淳 (翻訳)
出版社: 日本評論社 (2019/7/25)、出典:出版社HP

目次

訳者まえがき
第1章 はじめに
第2章 なぜランダム化が必要なのか?
2.1 因果推論の問題
2.2 ランダム化による選択バイアス問題の解決
2.3 選択バイアスを補正するその他の方法
2.3.1 観測可能な変数を用いた選択バイアスの制御
2.3.2 回帰不連続デザイン
2.3.3 差の差推定と固定効果推定
2.4 実験的手法と非実験的手法の比較
2.5 出版バイアス
2.5.1 非実験的研究における出版バイアス
2.5.2 ランダム化と出版バイアス
第3章 調査設計におけるランダム化比較試験の導入
3.1 パートナー
3.2 パイロットプロジェクト:プログラム評価からフィールド実験へ
3.3 特殊な RCTの例
3.3.1 応募超過法
3.3.2 段階的導入の順番のランダム化
3.3.3 グループ内ランダム化
3.3.4 奨励設計
第4章 サンプルサイズ、実験設計、検出力
4.1 基本原理
4.2 グループ化されたエラー
4.3 不完全コンプライアンス
4.4 制御変数
4. 5層化
4.6 実践的な検出力の計算
第5章 実際の調査設計と実施にあたっての留意事項
5.1 ランダム化の単位
5.2 横断的手法について
5.3 データ収集
5.3.1 事前調査の実施
5.3.2 行政データの利用
第6章 「完全なランダム化」が行われない場合の分析
6.1 割当率が層別に異なる場合
6.2 不完全コンプライアンス
6.2.1 ITTからATE(平均処置効果)へ
6.2.2 IV が適切でない場合
6.3 外部性
6.4 脱落
第7章 推論に関する問題
7.1 グループ化されたデータ
7.2 複数アウトカム
7.3 サブグループ化
7.4 共変量
第8章 外的妥当性とランダム化比較試験から
得られた結果の一般化
8.1 部分均衡効果と一般均衡効果
8.2 ホーソン効果とジョンヘンリー効果
8.3 特定のプログラムやサンプルを越えての一般化
8.4 RCT の結果の一般化可能性に関するエビデンス
8.5 フィールド実験と理論モデル

解説 エビデンスに基づく政策形成の考え方と本書のエッセンス
参考文献
索引
著訳者紹介

第1章

はじめに
ランダム化は、経済学者にとって不可欠な研究ツールになっている。 2000年代以降、経済学者が直接的もしくは間接的に関与する形でランダム化 を用いた評価が行われており、その数はますます増加している。ランダム化 比較試験(Randomized Controlled Trial: RCT)の適用範囲は多岐に渡る。例え ば、学校での教育施策が学習に及ぼす影響や(Glewwe and Kremer 2006)、農 業における新技術の採用の効果(Duflo et al. 2006)、運転免許行政における不 正の影響(Betrand et al. 2006)、消費者金融市場におけるモラルハザード・逆 選択の影響(Karlan amd Zinman 2007)の評価などに利用されてきた。いずれ の研究も重要な政策的課題に解を与えようとするものであり、経済学の理論 の検証にも使われている。

アメリカで行われてきた初期の「社会実験」では、多額の予算と多くの人 員を使って、複雑な介入を行ってきた。しかし、途上国で近年行われている RCT の多くは、非常に少額の予算で実施されており、開発経済学者にとって十分実践可能なものである。こうした小規模な RCT は、現地のパートナーと協働して行われることになるため、研究者にとってはより柔軟に調査を 設計し、評価を行うことが可能となる。その結果、RCT は強力な研究ツー ルになってきている。

ランダム化を用いた研究事例の数は開発経済学の分野全体のなかではまだ まだ少ないが、RCT を行うための理論的な知見や実践的な経験がこれまでに多く蓄積されてきた。本書では、RCT を行う際の教訓をまとめると共に、研究者が RCT を進める上での指針を示したい。つまり本書では、途上 国において RCT をどのように行い、分析し、解釈すべきかについて実践的 なガイダンスを示すと共に、経済行動に関する疑問に解を与えるために、 RCT をどのように利用すればよいのかを紹介する。

本書の目的は、開発経済学においてランダム化を利用した研究を概観する ことではない3)。また、他の研究手法を補完や代替する手段として RCT を 活用することに言及するものの、それを正当化することも本書の目的ではない。本書は、RCT を調査設計の一部として活用することに興味がある人 たちに対して、実践的なガイダンスを提供することを目的としている。

本書の構成は以下の通りである。第2章では、「潜在アウトカム」という 枠組みを紹介しつつ、「過去に遡る形」で行われてきた従来の評価手法(以 下、「後ろ向き [retrospective] 評価」と言う)に特有の問題が、RCT によってどのように解決されるのかを議論する。ここでは、特に「選択バイア ス」に焦点を当てる。選択バイアスは、アウトカムに影響を与えるような特 性に基づいて個人やグループが処置群に割り当てられる場合に生じる問題だ が、選択バイアスがあると処置効果を測定することが難しくなってしまう。 また、後ろ向き評価を行う研究では、事前仮説を裏付ける結果や、統計的に 有意な結果が報告されやすく、それは出版バイアスと呼ばれるが、第2章で はこの問題についても議論する。

第3章では、現実世界においてどのようにランダム化を行うことが可能かを議論する。どういったパートナーと協働すべきか、パイロットプロジェク トをどのように利用すべきか、倫理的・政治的に受け入れられる形でランダ ム化する方法は何かを議論する。

第4章では、研究者が評価設計の検出力にどのように影響を与えることが できるか、もしくは統計的に意味のある結論を得るにはどうすればよいかを 議論する。ここでは、サンプルサイズをどのように決定するべきか、ランダ ム化の単位や、制御変数の利用可能性、層化によって、検出力にどういった 影響が出るのかを議論する。
第5章では、RCT を行う際に直面する実際の評価設計、具体的には「ラ ンダム化の単位をどう設定すべきか(個人、家族、村、地域など、どの単位で ランダム化するか)」について議論する。ここでは、クロスカッティングデザ インと呼ばれる横断的手法のメリットとデメリットや、いつどのようなデー タを集めるべきかについても検討する。

第6章では、理想的なランダム化ができなかった場合に、どのようにデー タを分析すべきかを議論する。ここでは、グループごとに割当率(処置群か 対照群かに割り当てられる確率)が異なる場合の対処方法や不完全コンプライ アンス、外部性について議論する。

第7章では、データがグループ化されている時や、複数のアウトカムやサ ブグループが存在する時に、処置効果を正確に推定する方法を議論する。
最後に第8章では、RCT の結果を一般化する際の課題について議論する。 RCT の設計時やそこから得られた分析結果を解釈する際に、経済理論をどのように活用するかについても議論する。

1)(訳注)原著は開発経済学での RCT の適用を念頭に執筆されたものであるため、後 出の事例は当該分野におけるものが多用されている。
2)〔訳注)原著は2008年に執筆されたものであるが、以降これまでの間に、開発経済学
の分野全体のなかで RCT が用いられた事例数は増えており、状況は変わってきている。 3) 【原注] Kremer(2003) や Glewwe and Kremer(2006)は、教育に関する RCT を 概観している。Banerjee and Duflo (2006)は、RCTの結果から、途上国において教師 や看護師の出席率を改善するためにはどうすればよいかを整理している。Duflo(2006) は、インセンティブや社会的学習、双曲割引について概説している。
4)(原注)これについては、Duflo(2004) や Duflo and Krener(2005)を参照された
5)(訳注)既存の評価手法の多くは「過去に遡る形で行われてきた。つまり、研究者 は、ある政策が実施された後で、過去のデータを用いて当該政策の評価を行おうとして きたのである。しかし、後述の通りそうした後ろ向き評価は多くの問題をはらんでおり、 RCT はそれらの問題を解決する手段となりえる。

エステル・デュフロ (著), レイチェル・グレナスター (著), マイケル・クレーマー (著), 小林 庸平 (監修, 翻訳), 石川 貴之 (翻訳), 井上 領介 (翻訳), 名取 淳 (翻訳)
出版社: 日本評論社 (2019/7/25)、出典:出版社HP