新型コロナウイルス感染症(COVID-19)に関するメモ(88)
伊藤公一朗『データ分析の力 因果関係に迫る思考法』(2)
※ 当ブログのCOVID-19関連記事リンク集 → https://shoyo3.hatenablog.com/entry/2021/05/06/210000
今回は、『データ分析の力 因果関係に迫る思考法』 第2章 現実の世界で「実際に実験をしてしまう」― ランダム化比較試験(RCT)である(p.53~)。(この本は数式を一切使っていない。著者は、超入門書だと言っている)
伊藤は、第1章を次のようにまとめている。
因果関係は「介入効果」で定義できる
伊藤は、因果関係を「直観的に」説明するために、次のような問題を考えている。
電力の価格を上げると、節電につながるのか?
この問題を、「Xの価格を上げると、Yなる効果を得られるか?」という形に一般化してみれば、多くの事例に適用可能であることに気づく。
この問題の因果関係は、
価格を上げること(X)が、消費量(Y)にどのような影響を及ぼすか?
という関係である。
料金の上昇がなかった場合の消費量(Y0)と料金の上昇があった場合の消費量(Y1)の差を「介入効果」と呼ぶ*1。
因果関係によってもたらされた効果=介入効果=Y1―Y0
COVID-19に関して、因果関係のさまざまな問題を立てることができよう。
因果関係を導くのが難しいのは「もしも」のデータが存在しないため
実際に料金の上昇があれば[if]、Y1は測定できるが、Y0は測定できない。これでは、介入効果が計算できない。逆に、料金の上昇がなければ[if]、Y0は測定できるが、Y1は測定できない。介入効果が計算できない。
この「もしも」[if]の結果のことを、「実際には起こらなかった潜在的結果」と呼ぶ。潜在的には存在し得る結果ではあるが、実際には起こらなかったので、現実世界では観測できないというデータという意味である。(反実仮想的事実とも呼ぶ)
1個人のデータから、Y1とY0の差を計算して、因果関係を測定するのは根本的に不可能。これを「因果的推論の根本問題」と呼ぶ。
解決策は介入グループと比較グループという考え方
ルービン(ハーバード大学教授)は、1個人についての介入効果を測定することは不可能だが、複数人の介入効果を平均した値である「平均介入効果」を測定することは可能だと説明している。
ここで鍵となるのは、介入グループ(Treatment group)と比較グループ(Control group)という考え方である。(比較グループとは、介入を受けないグループ。対象グループや統制グループと訳されることもある)
電力消費量の例で、100人の介入グループの消費量の平均値をYT、別の100人の比較グループの消費量の平均値をYCとする。価格の上昇を経験したのは介入グループのみだから、YTとYCの差を見ることで「平均介入効果」を測定することができる。
これまでの説明で、YTとYCの差を見ることで「平均介入効果」を測定することができる、と考える人が多いのではなかろうか。
実はこの引用は、あえて不正確な引用とした。伊藤は、次のように書いている。
YTとYCの差を見ることで「平均介入効果」を測定することができないだろうか?
この方法で介入効果の平均値を測定するには、以下に述べる一つの大きな仮定が必要となる。
2つのグループの比較で、平均介入効果を測定するための仮定…もしも価格の上昇という介入(X)が無かった場合、比較グループの平均消費量(YC)と介入グループの平均消費量(YT)は等しくなる。
もしも、YCとYTが等しくなければ、価格の上昇という介入(X)が無いのだから、別の要因が働いて、YCとYTが異なっているということであるから、この仮定の必要性が理解されよう。
伊藤は、
上記仮定が成り立つ限り、平均消費量の差は「価格の上昇という介入以外の要因では説明できない」
と説明している。
しかしながら、この仮定が成り立つかどうかは、(通常は)立証不可能である。
なぜなら、介入グループは現実には価格変化を経験するので、「価格変化がなかった場合」の介入グループの消費量データは存在しないからである。
例外は、ランダム化比較試験という方法を用いて介入グループと比較グループのグループ分けを行った場合だけである。
例えば、次のようなグループ分けはどうか。
割引クーポンを受け取った消費者と受け取らなかった消費者の消費者行動を比較することで、クーポンの効果を見る。
補助金を受け取った世帯と受け取らなかった世帯を比較する。
このグループ分けでは、先の仮定が成り立たない。割引クーポンあるいは補助金を受けとるというのは、個人が自らの意思で介入を受けるか否かを判断している。これを「自己選抜」(Self-selection)という。自己選抜でグループ分けすれば、「様々な面で、非常に違った特性を持つグループである可能性が高くなる」。
最良の解決法は「ランダム化比較試験」
ランダム化比較試験 RCT:Randomized Controlled Trial(無作為化対照試験とも)
ビジネス分野では、AとBという2つのグループを比較するという意味で、ABテストと呼ぶこともある。
鍵は、グループ分けを必ずランダムに(無作為に)行うこと。
ランダムなグループ分けの最大の強みは、特定の要素についてだけ成り立つのではなく、あらゆる要素について成立する点である。
伊藤は、RCTの具体例として、1.北九州市での電力価格フィールド実験、2.オバマ前大統領の選挙活動におけるマーケティング戦略、3.電力不足はモラルで解決可能か? 価格政策が有効か? をあげている。ここでは2番目の例について見てみよう。
オバマ前大統領の選挙活動におけるマーケティング戦略
2008年の大統領選において、オバマ陣営は、グーグルからシローカー(Dan Siroker)を引き抜き、支援金集めの戦略を任せた。
シローカーはオバマ候補のウェブサイトのデザインを工夫することで、ウェブサイトを訪れた多くの人が自分のメールアドレスを登録してくれるようにした。(そのアドレスへ送信する各種のメールによって効率的に支援金を集められる)。
オバマ陣営は、まずウェブサイトのトップページに表示する画面を6通り考えた。
あの大統領も140%の成果改善。アメリカ大統領とA/Bテストの意外な関係
1(画像)「Obama」の旗に囲まれる柔らかな表情の写真
2(画像)家族と一緒に写っている写真
3(画像)正面からアップで撮影した凛々しい表情の写真
4(動画)オバマ氏が視聴者に向けて語りかけるパターン
5(動画)演説の一部を抜粋したパターン
6(動画)支援者の様子も映したパターン
https://juicer.cc/articles/archives/1273/
オバマ陣営は、更にトップページに表示するボタン(クリックするとメールアドレスを書き込むページに移る)に、4通りのメッセージ案を考えた。
1) SIGN UP(登録しよう)
2) SIGN UP NOW(今すぐ登録しよう)
3) JOIN US NOW(今すぐ参加しよう)
4) LEARN MORE「もっと知ってみよう」
つまり、6通りの画面案と4通りのメッセージ案があったので、合計で24通りの組み合わせが作られる。
オバマ選挙チームは、議論の結果、一番効果的なのは「画像1とメッセージ1の組み合わせ」という結論に達した。
シローカーが行ったABテストとは、どのようなものだったか?
2007年のある期間中、約31万人がオバマ候補のウェブサイトを訪れた。選挙チームは、この31万人の一人一人に対し、24通りのデザイン案の中からランダムに1つのデザインだけを選び表示した。
31万人が24通りのグループに均等に振り分けられたので、それぞれのグループには13,000人ほどが振り分けられたことになる。
実験終了後、選挙チームは各グループにおける「メールアドレス登録率」を計算し、登録率が最も高かったデザインを最適なデザインと特定し、以後の選挙運動で用いた。
では、最も登録率が高かったデザインはどれだったか。それは次回に。
今回の記事がCOVID-19と何の関係があるのかと思う人がいるかもしれないので、補足しておこう。
- 人の流れ(人流)を減らせば、感染者が減少する。
- 接触率を減らせば、感染者が減少する。
- 飲食店等に対する規制(協力要請)を強化すれば、感染者は減少する。
感染者が問題となるのは、以下の意味においてである。
- 感染者が減少すれば、中等症・重症患者は減少する。
- 中等症・重症患者が減少すれば、死者数は減少する。
これらを、「科学的に因果関係を証明する」ことはできているのだろうか?
因果関係を証明できているのであれば、介入効果も測定して公表されていると思うのだが…。
ワクチン接種後の死亡に関しては、「ワクチン接種との因果関係は証明されていない」というのは多分正しいと思うが、同様に上に挙げた5点についても、「因果関係は証明されていない」のではなかろうか。
もちろん「因果関係が不明だから放置して良い」ということにはならない。何らかの対策を講じる必要があるだろう。そして、その対策のプラス・マイナスの効果を測定する必要がある。
*1:因果関係によってもたらされた効果を「介入効果」(Treatment effect)と呼ぶのは、医学における呼び名に由来するそうだが、近年では医学以外の分野を含む様々な状況で「何かしらの介入(X)が結果(Y)へ及ぼす効果」として使われるという。