まるで一般書のように売られており、確かに一応一般人向けに書いているような気はするが、実際には多少統計学をやったことがないと分かりにくい。日本語では「統計的因果推論」と言うが、統計学的にデータから因果関係を計算するかなり新しい分野で、その第一人者が一般向けに書いた本である。と言っても、そもそも一般人にはこんなのがなぜ新しい分野なのか分かりにくいと思われる。
今でも統計学の初学者は「相関関係は因果関係ではない」という呪文をひたすら唱えさせられることになっている。そして疑似相関とか交絡因子とかいう概念を学び、実際に相関係数だの回帰係数だのを学ばされるが、永久に因果関係の概念は教えられることはない。これは古典流でもベイズ統計でも同じことで、統計学で判明するのは相関関係だけで、それを因果関係とは何かについては統計学の範囲外ということになっている。
それはそれでその通りなのだが、著者は、因果関係を明示したグラフ図を導入し、そのグラフを利用してデータを解釈することで、今までに不可能だった計算が可能になると主張する。著者が最も重視するのは反実仮想、つまり、「もし違うようにしていたらどういう結果になっていたか」という確率計算だ。これは人工知能との関連で未来のある話である。もっとも、グラフ図をどうやって思いつくかは謎であることに変わりはなく、"Causation"で扱われるような形而上学的問題は素通りされているが、そこは筆者の関心ではないようだ。
さらに、それ以前に、因果関係を表すグラフの導入により、今までの統計が行ってきた誤りがどんどん暴かれるのも深刻な話である。著者の言うところでは、伝統的な統計学の方法は、多くの場合に交絡因子を統制し過ぎており、そのせいで誤った結論を出しているという。たいてい我々は主題でない因子は統制すればするほど良いみたいに教えられているが、実際には統制してはいけない因子もあり、その判別は因果モデルを表すグラフを用いれば代数的にできる。
その辺りの詳しい話は本書を読むしかなく、わたしはこの本は統計に少しでも関わる人の必読書と思っている。それはそれとして、この本の書き方はちょっと酷いような気もしている。まず、最初から三分の一くらいは著者の言うところの"causal revolution"の能書きが延々と書かれてかなり退屈だ。do-calculusという言葉もわりと最初のほうに紹介されるが、随分読み進めないと具体的に説明されず、それまで延々と統計学史と革命の効能を聞かされる。統計学の歴史を振り返るにしても、全体的に感情過多でムダに論争的で、もうこれはネイマンピアソン以来の統計学の伝統なのだろうか。
素人が読んでいて、統計的因果推論の有効性がようやく明らかになってくるのは半分くらい読んで喫煙-肺がんの例が出てくるあたりで、そこから先は、やはりムダに感情が多いのは別として、意味が分かってくる。最後のほうの法学的または哲学的考察は、個人的には話を進めすぎだと思うが、とかく、全体的に誇大表現のような気のするところが多い。と言っても、著者の発案による統計的因果推論が重要であることは間違いない。時間ができたらなるべく早いうちに研究しようと思う。まあ、我慢して読んだ甲斐はあった。
I find this book too wordy. Considering the importance of the casal inference, it's a bit pity. Or maybe it's a tradition of the dicipline.
Basic Books (2018/5/15)
言語: 英語
ISBN-13: 978-0465097609