伊藤公一朗『データ分析の力 因果関係に迫る思考法』(6)
今回は、第3章 「境界線」を賢く使うRDデザイン の続きである(p.131~147)。*1
RDデザインにおける仮定が崩れるのはどんな場合か
前回の復習から。「回帰・不連続」(回帰曲線が不連続)の意味は次のグラフで明らかである。
https://healthpolicyhealthecon.com/2015/05/16/regression_discontinuity_design/
また、回帰不連続デザイン(RDデザイン)における仮定は、次の通りであった。(「回帰不連続デザイン」(2021/9/24)参照)
回帰不連続デザインの仮定 |
もしも境界線で自己負担額(X) が変化しない場合、医療サービス(Y)の平均値が境界線でジャンプすることはない。 |
この仮定が崩れる場合が2つある。
- 何らかの理由で70歳を境に所得が増える場合。自己負担額が変わらなくとも、医療サービスの利用がジャンプする可能性がある。
- データの対象となっている主体が、グラフ上の横軸の変数を操作できる場合。患者が自分の年齢をごまかして操作できる場合、病気になりがちな人や所得が低い人などが70歳以上だと年齢をごまかす可能性がある。(よって、RDデザインを用いる分析では「データの主体が、横軸の変数を恣意的に操作できない」という条件が必要になる)。
以上から、
「RDデザインに必要な仮定が適切に守られている」と断定したり立証したりすることはできない。
あくまでも、分析者側にできることは「この状況下では、RDデザインの仮定は守られる可能性が高い」と主張できる根拠を並べていくだけである。[RDデザインの弱み1]
回帰不連続デザインにおける分析結果は「仮定」に依存しているので、データ分析者は、「仮定」が守られている可能性が高いという根拠を示さなければならない。そのような根拠が示されていなければ、分析結果の信頼性は低い。
分析結果の批判者は、「仮定」が明示されていなければ、それを指摘し、「仮定」が守られている可能性が低いことの根拠を示さなければならないだろう(批判と疑義を呈することは違う)。
ランダム化比較試験(RCT)と回帰不連続デザイン(RDデザイン)との関連性
RDデザイン[Regression Discontinuity Design]は、境界線付近で自然に作られたRCT[Randomized Controlled Trial]という理解ができる。
何故そう言えるのか?
境界線上付近にいる2つのグループを考える。1つ目のグループは、69歳11ヵ月の人たち、そして2つ目のグループは70歳0ヵ月の人たち。この2つのグループは誕生日が少し違うだけなので、平均的には健康状態や就業率など様々な要素において非常に似通った集団になるのではないか、と予想される。
ところが、誕生日が少し違うだけで、1つ目のグループの自己負担額は3割、2つ目のグループの自己負担額は1割になる。つまり、非常に似通った2つのグループに対し、あたかもランダムに(無作為に)介入(ここでは低い自己負担額)を割り振ったような状況が作り出されたのである。69歳11か月の人たちが比較グループで、70歳0ヵ月の人たちが介入グループと解釈できる。
RCTとは異なり、データ分析者がこの2つのグループを作ったわけではない。しかし、70歳の誕生日で自己負担額が3割から1割へ大きく変わる、という日本の制度が「あたかも実験が起こったかのような状況」を作り出したのである。これが、「自然実験」と呼ばれる所以である。
この場合は、実験者ではなく、別目的の社会制度が境界線を引いて2グループに分割したということであろう。(「自然」実験というのはどうかと思う)
RDデザインの弱み
分析によって求めたい因果関係は、自己負担額(X)が医療サービス利用(Y)へ与える影響だった。しかし、70歳の境界線を使うRDデザインで分析できるのはあくまでも「年齢が70歳付近の人たちが自己負担額にどのように反応するのか」という因果関係だけである。…だから50歳や80歳など、70歳の境界線付近から離れた人に対しても分析結果を適用したい場合、追加的な仮定が必要になる。[RDデザインの弱み2]
RDをRCTと同等のものと扱ってはならない。
一方、適切なRCTを行うと、より広範囲な年齢層の方たちの反応を調べることが可能である。例えば、仮に日本全国の患者に対して自己負担額1割と3割をランダムに割り振る、というRCTが可能だったとしよう。すると、日本全国の様々な年齢の人に対しての「効果」を分析することができる。なぜなら、様々な年齢層の中に介入グループと比較グループを作り出すことができるからである。
そもそも何を分析したいのか。
政策担当者の関心が70歳前後の患者への最適な制度改革を吟味したい、ということであれば、このRDデザインで得られた分析結果がまさに知りたい結果だった、ということになる。
この意味では、RCTでなくても良い。
<弱みのまとめ>
- RDデザインに必要な仮定は、成り立つであろう根拠を示すことはできるが、成り立つことを立証はできず、この点はRCTに比べて大きな弱点である。
- RDデザインは、境界線付近のデータに対しての因果関係しか主張できないため、実験参加者全体への因果関係を主張できるRCTに比べて有用性に欠ける場合がある。
RDデザインの強み
RCTを実施しないにもかかわらず、(既に存在するデータを利用して)RCTに近い状況を作り出せる。[非常に似通った2つのグループに対し、あたかもランダムに介入を割り振ったような状況が作り出される]。[RDデザインの強み1]
これは、費用や手間を節約する。
分析結果の説明や分析の仮定の検証をする際に、グラフを使ってビジュアルな説明ができる。データ分析の非専門家にとっても納得するような分析を実現させる。[RDデザインの強み2]
本例は、「ある年齢を境に政策介入が非連続的に変化する」というものだったが、世の中を見渡してみると、ビジネスや政策によって境界線が作り出されている状況は想像以上に多岐にわたる。RDデザインを使える状況は世の中の色々なところに存在する。[RDデザインの強み3]
<強みのまとめ>
- 仮定が成り立てば、境界線付近であたかもRCTが起こっているかのような状況を利用できる。
- 主要な結果を、図を用いて示せることで、分析者以外に対しても理解がしやすく、透明性のある分析ができる。
- RDデザインを利用できる「境界線」は、ビジネスや政策の様々な場所・場面に存在するため、RCTが実施できない際に有効な分析法の一つである。
ビジネスや政策の様々なところで、「線引き」がなされている。(「境界線」というより、「線引き」といったほうが、イメージしやすいのではないかと思われる)。複数の線引きもある。
私が思うに、そのような「線引き」に出くわしたら、RD(回帰不連続)を踏まえて、その線引きは目的に照らして妥当か?と問うべきである。
線を引く立場にたっても、RD(回帰不連続)を踏まえて、その線引きは目的に照らして妥当か?と問うべきである。
ここで注意すべきは、目的は1つとは限らないということである。目的と手段の階層構造がある中で、どこに焦点をあてて分析/提案しようとしているのか。いかに統計技術的に問題がないとしても、その目的如何によっては、ナンセンスな、あるいは有害な分析/提案となるだろう。
世の中の様々な「線引き」をどう考えるか?
原爆の「黒い雨」で病気に 国が長く認めず、苦しむ
高知新聞(https://www.kochinews.co.jp/article/477649/)
次回は、第4章「階段状の変化」を賢く使う集積分析である。
*1:本書では、「地理的境界線」を用いたRDデザインの説明もあるが、これは省略。