Judea Pearlによる The Book of Why

ボストンも日本もCovid-19で大変です。
この研究室ブログだけでも通常営業を進めるために、もう一つおすすめの本を紹介します:

Judea Pearlによる 『The Book of Why』。

題名からして読書欲をくすぐります。”Why”は僕らの原動力だから。

Pearlは僕のintellectual heroesの一人。コンピューターサイエンティスト・AI研究者として有名(その業界のノーベル賞とも言えるTuring賞をとっている)です。他には(パートタイム)哲学者および統計的因果推論の始祖の一人といった複数の顔を持ちます。

僕が不勉強なだけかもしれませんが、この本が日本の医学・疫学界隈で話題になったと聞いたことはありません。一方で彼の教科書はいくつか和訳されていますね。この『The Book of Why』は僕の近年のお気に入りの一つで、現在3周めに入っています。そこそこボリュームもあり英語がやや難しめなので、書籍とaudiobookの両方で読み進めるのがおすすめです。


疫学業界ではハーバード公衆衛生大学院 (HSPH)のJamie Robinsがcausal diagramの始祖として祀られていたりします。しかし、それを体系立てたのはPearlというのが歴史的事実です。そもそもは遺伝学者のSewall Wrightのpath diagramが近親であり、確率論とMarkov conditionをもとにするBayesian networksの特殊ツールです(つまり数学・コンピュータサイエンスが発祥で、疫学の”DAG”はその応用例の一つ)。

つまりJamie RobinsやMiguel Hernánはcausal diagramを疫学・臨床医学の疑問に答えるべく応用・普及させてきた第一人者というのが妥当な位置づけです(註1)。僕もRobinsを尊敬していますし(あの難解なEPI 207は噛めば噛むほど味が出るスルメのよう)、Hernanの尖った姿勢も大好きです(註2)。しかしHSPHの一部の学生・TAらが彼らを唯一神(およびその預言者?)のように無批判に扱っているのには辟易しました。ハーバードといえど小さな井戸の一つに過ぎません。またその哲学的背景にあるinterventionism (または”no causation without manupulation”)が、推測対象(および識別される効果)を狭めてしまっているようにおもえます。簡単にいえば、RCTs (およびtarget trials)で定義される効果をいかにして観察データで識別・推測していくかかというフレームワーク。そのフレームワークは確かに納得いく感動ものなのですが、これだとcausal mediation analysisみたいなものが概念的に扱えないですし(註3)、今後のomics研究への応用が困難になりそうです。

一方で、より数学的な色合いの濃い(そして理想主義的ともいえる”causation before manupulation”の哲学)Pearlの考え方のほうが応用性が高くなります。つまりRCTで定義できない因果効果も識別・推測できるパワフルな方法であるという考えです(もちろん諸刃の剣でもある)。僕にとっては、そのリスクありの応用性、およびデータを作り出している(と仮定される)因果の「力」ーすなわちdata generating process(註4)ーを強く意識しているあたりが好みです。


小難しいことは置いておいて、面白い本で読むたびに学びがあります。
普通にPearlのstructural causal models(とくにcausal diagrams)とその応用例(mediationなど)の入門本とも読めますし、人工知能学者Pearlによる現時点のdata’ismや機械学習・AIへの批判 (註5)、汎用AIに必要な条件提示も面白い視点です。他にも彼のbiasがたっぷりと入った現代統計学への歴史的批判、Don RubinやJamie Robinsに対する考えを知るというオタクな面白みもあります (註6)。

“Why”にドライブされる人にオススメの著作です。


註釈

註1: Neyman-Rubinモデルもフレームワークに加えてますね。他にもg-methodsやSWIGなどの発案と理論整理といった偉業があります。Jamie Robinsは実践的な人には評判が良くないですが(僕のmentorのCarlosは苦手としている?)、そんな彼も明らかに「知の巨人」です。
註2: Hernanの EPI 289(評判ほど難しくない因果推論の入門授業) は今学期から弟子のBarbra Dickermanに受け継がれるようです。彼女は武闘派 (?) のHernanと違う秀才タイプですが教え上手です。
註3: Natural direct / indirect effectsで定義に使われるcross-world counterfactualsはRCTなどのexperimentでは想定できない。でも僕らはそれを識別・推定しています。直感的な例が『The Book of Why』 第九章にあります。この勝負はPearlに軍配が上がると思います。
註4: Causal diagramsはその質的な表現(他にももう一つ大事な役目があります)。Potential outcomesとその欠損値問題から始まるNeyman-Rubinモデルでは、data generating processがあまり議論にならない気がします。
註5: Pearlがgenerative adversarial network (GAN) について触れていたらもっと面白いかったかも。
註6: 犬猿の仲であるGeorge Davey Smith (Mendelian randomizationで有名)のことはさすがに触れていないですね。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です