伊藤公一朗『データ分析の力 因果関係に迫る思考法』(7)
今回は、第4章 「階段状の変化」を賢く使う集積分析 である。
因果関係をデータ分析によって解き明かすための最良の方法は、ランダム化比較試験(RCT、Randomized Controlled Trial)である。RCTは、「データ分析者が能動的に実験設計を考え、政策介入やビジネスでの介入といった介入を行い、データを収集して分析を行うという手法」であったが、実際には「費用・労力・各機関の協力」が必要なので実施不可能なことが多い。そこで「まるで実験が起こったかのような状況を利用する」というコンセプトの「自然実験」という手法が使われている。
伊藤は、自然実験の手法を3つ挙げている、第1の手法は「回帰不連続デザイン」*1であった。今回は、第2の手法「集積分析」である。
集積分析(Bunching Analysis)とは、「商品の価格や割引、所得税などの税金、政府からの補助金などが階段状になっている」ことを利用して、因果関係を明らかにしようとするものである。(E.サエズが提示した手法)
私は、集積分析といってもピンと来ないし、忘れてしまうので、階段分析とかギザギザ分析とか言えば良いのではないかと思う。(以下、ギザギザ分析と呼ぶことにする)
ギザギザ分析の例として挙げられるのは、自動車の燃費規制と所得税率である。今回は燃費規制について見ることにしよう。
日本の自動車燃費規制
日本の燃費規制は、次の図で表される。このようなギザギザの(階段状の)燃費規制(原因)が、自動車メーカーの望ましくない行動をもたらしている(結果)のではないか、というのが問題意識である。
伊藤公一朗、『環境規制の抜け道が日本車を重くした 「規制達成値取引制度」の薦め』より。具体的な数値は、自動車燃費目標基準についての「燃費基準値一覧」を参照。
横軸は自動車の重量(kg)、縦軸は燃費規制値(km/リットル)である。
オレンジ色のギザギザは、2010年度目標の燃費基準(1999/3策定)、緑色のギザギザは、2015年目標の燃費基準(2007/7策定)である。
ご覧の通り、車が重くなるほど、規制が緩くなっているので、いま測定値が階段を下りる手前のところにあれば、少しだけ重くすることによって階段を降りることができるので、そのように設計変更がされると予想される。
もしも企業がこのような燃費政策のインセンティブ(誘因)に反応し、実際に車両重量を上げていたとすると、市場に出回っている自動車のヒストグラム(度数分布図)描いた際に、インセンティブに反応している車が「規制の境界点の右側」[階段の左側]に集まっていることが予想される。
伊藤らは、国土交通省が公開している「自動車燃費一覧」というデータを利用し、以上の分析をしたところ、予想通りの結果を得られたという。
伊藤公一朗、『環境規制の抜け道が日本車を重くした 「規制達成値取引制度」の薦め』より
(1)は、2010年度目標基準で、2002年から2008年に販売された自動車の分布、(2)は、2015年度目標基準で、2009年から2013年に販売された自動車の分布である。境界点の右側(階段の左側)が飛びぬけた数字となっている。
政策変更[2010年目標基準から、2015年目標基準への変更]によって階段の形状が変化したが、分布が集積する地点を見ると、その政策変更に応じて動いている。これは自動車会社が、規制によって作られたインセンティブに合理的に反応していたことを、データ分析が示しているということである。
この場合の「合理的」とは、緩い燃費規制の自動車を作ることが「合理的」であるということを意味する。
単純に考えて、車の重量が重くなるほど(重い車:高級車で、富裕層のみが買える)、燃費規制が緩くなるのは「おかしい」のではないか。この点については、後で考えてみよう。
*1:回帰不連続デザイン(2021/9/24)、RDデザインの強み・弱み、広島の「黒い雨」(2021/10/15)参照。