Causal Inference (Amazon.co.jp)
目次:1. 処置により引き起こされる効果 2. 無作為化実験 3. 観察研究:問題 4. 測定された共変量のための調整 5. 測定されなかった共変量の感度 6. 観察研究の設計の中の疑似実験的手法 7. 自然実験と中断と操作変数 8. 再現性と解像度とエビデンス因子 9. 因果推論の中の不確実性と複雑性
統計的因果推論の入門書というか、理論的基礎を考える本。似たようなタイトルでThe Book of Whyという本もかなり前に読んでいて、それも統計的因果推論の入門書には違いないが、一応別方面の本だ。The Book of Whyは統計的因果推論の特定の手法、do-calculusを紹介して技術面にも入っているが、本書は古典的な推測統計学しか前提にしていない。あまり数式を使っていないのは、数式以前の世界だから。代わりに箱ひげ図が駆使されている。そして、わたしの意見では、統計的因果推論の原理的な話について、こちらの本のほうが面倒ではあるが、遥かに説得力のある議論が展開されている。
たとえば、こういう話で典型的に出てくるのが喫煙と肺がんの関係で、疑似相関の疑いをどう排除するかだ。The Book of Whyの場合は、確か「そもそもそんな大きな交絡因子は数学的に不可能」みたいな話だった記憶がある。あの本の読んで気になったのは、そもそも交絡因子として何を想定するかが不明ということだった。
本書の場合はもっと分かりやすい。本書の話を単純化すると、喫煙者の肺がんリスクが非喫煙者より9倍(一日二箱以上なら60倍)もある以上、これが疑似相関であると主張するには、喫煙者と非喫煙者の間に9倍(60倍)の差のある因子を発見しなければ説得力が弱い。
早い話が、喫煙者と非喫煙者の肺がんリスクが喫煙のせいではなく喫煙者の特定の遺伝子のせいであると主張するためには、喫煙してもしなくてもその遺伝子だけで肺がんリスクが9倍にならないといけないわけだ。そんな劇的な効果のある遺伝子が今後発見されるとは考えにくい、みたいな。もちろん今の話もさらに厳密に考えればという話はできるが、ここまできたら、因果関係を否定する側に立証を要求するほうが普通だろう。
というような話は一例だか、この類の話をこんな雑にではなく、冷静に一つ一つ議論を積み重ねている。ただし着実過ぎてムズい可能性はある。予備知識としては統計検定二級くらいの知識で十分だが、今くらい雑にまとめてくれる先生がいたほうが理解しやすいかもしれない。書き方の問題もあるが、議論がどこに向かっているのか分かりにくいかもしれない。その意味では数式は確かに少ないが、数学書を読むくらいの覚悟が必要だ。
The MIT Press (2023/4/4)
言語 : 英語
ISBN-13 : 978-0262545198
0 件のコメント:
コメントを投稿