伊藤公一朗『データ分析の力 因果関係に迫る思考法』(9)
今回は、第4章 「階段状の変化」を賢く使う集積分析 の続き(p.157~)である。
集積分析とRDデザインの違い
車が重くなるほど、規制が緩くなっているので、いま測定値が階段を下りる手前のところにあれば、少しだけ重くすることによって階段を降りることができるので、そのように設計変更がされるというものである。
第3章はRDデザイン[Regression Discontinuity Design、回帰不連続デザイン]であったが、その例示も再掲しよう*2。
70歳の「境界線」で患者数が非連続的に増えている要因は、医療費の自己負担割合は70歳を境に3割から1割になるという(当時の)ルールだった。このようなルールが、外来患者数を非連続的に増やしたというのである。
伊藤は、集積分析とRDデザイン(=回帰不連続デザイン)の違いを説明している。
集積分析で明らかにできる「因果関係」は、RDデザイン(=回帰不連続デザイン)の場合と大きく異なる。
RDデザインでは、対象となる主体はグラフの横軸の変数を操作できないことを仮定していた。一方、集積分析では、「対象となる主体がグラフの横軸の変数を操作できる状況」に適用される。
集積分析の仮定
もしも燃費規制値(X)が階段状に変わらない場合、自動車の重量(Y)の分布は滑らか(連続的)であり、集積することはない。
しかし、この仮定は立証できない。
なぜなら、現実の世界では「重量に応じて階段状に変化する燃費規制」が存在しているため、「その規制がなかったら」というデータは「実際には起こらなかった潜在的結果」であり、世の中には存在しないためである。
その為、データ分析者としてできることは、前記の仮定が成立するであろうという証拠をできる限り並べていくことである。
集積分析の強み
- 分析に必要な仮定が成り立てば、境界線付近であたかもRCT[Randomized Controlled Trial、ランダム化比較試験]が起こったかのような状況を利用できる。
- 図を用いて結果をビジュアルに示せることで、分析者以外にも透明性のある分析ができる。
- 「階段状にインセンティブが変化する状況」はビジネスや政策の様々な場所・場面に存在するため、RCTが実施できない際に有効な分析手法の一つである。
私は、「階段状にインセンティブが変化する状況」を、「連続した変化に分断線を入れる状況」と言っても良いのではないかと思う。
<連続した変化に分断線を入れる>
https://shoyo3.hatenablog.com/entry/2020/06/27/210000
https://shoyo3.hatenablog.com/entry/2021/11/16/210000
https://shoyo3.hatenablog.com/entry/2020/12/30/103000
この分断線(ルール)は、さまざまな社会的影響を及ぼす。分断線(ルール)が「原因」となり、社会的影響という「結果」をもたらす。因果関係である。なお、社会的影響の評価は、評価基準により異なる。
集積分析の弱み
- 分析上の仮定は、成り立つであろう根拠を示すことはできるが立証はできず、この点はRCT[ランダム化比較試験]に比べて大きな弱点と言える。
- あくまでも階段状に変化するインセンティブに反応した主体(集積をした主体)に対しての因果関係しか分析できない。そのため、実験参加者すべてに対しての因果関係を分析できるRCTに比べて信用性に欠ける場合がある。
分析上の仮定は、「(X)が階段状に変わらない場合、(Y)の分布は滑らか(連続的)であり、集積することはない」であるが、この仮定は立証することができない。しかし、仮定が成り立つであろう根拠を示すことができる。であれば、立証不能の仮定と決めつけるのではなく、仮定が成り立つかもしれない・成り立つであろう根拠を示すことによって、説得力あるものとなろう。(状況証拠の積み重ねをどう考えるかの問題である)
弱みの2番目はよく考えてみる必要がありそうだ。
*1:集積分析(1)― ギザギザがもたらすもの(2021/11/27)参照。