今回は伊藤公一朗著『データ分析の力 因果関係に迫る思考法』を紹介したい。
この本は、データ分析を平易な言葉で解説した本だ。数式等は出さず、「感覚的」にデータ分析を理解してもらうために書かれている。
本書の内容
データ分析の利点
データから因果関係を明らかにすることは難しい。というのは「ある要素(X)が結果(Y)に影響を与えたか?」という問いを証明するには様々な困難が伴うからだ。他の要素の影響があったり、またそもそも相関関係でしかない場合があるからだ。
データ分析の手法としては以下のものがある。
RCT、自然実験(RDデザイン、集積分析、パネル・データ分析)だ。
これらのスキルは政策形成やビジネスの場面で取り入れられているが、個々人が知って置いた方がいいスキルだと思うし、少なくとも原理くらいは知っておくべきだと思う。
たとえば、政府によるデータの改ざん((日銀にGDP算出の妥当性を問われる内閣、労働政策における安倍首相の答弁などや政策の有効性、事業の有効性を明らかにして政策形成を批判的に見る上でも、そうした間違った「因果関係」(すなわち相関関係でしかないもの)に踊らされないためにも、情報を取捨選択できるよう身につけたい思考・スキルと言えよう。
データ分析を錦の御旗にしてはいけない
ただし注意としてはデータ分析至上主義に陥ってはいけないという点である。
データの取得に際する信頼性、データを解釈する恣意性、外的妥当性(他の事例へ適用できるか否か)、前提条件の相違などデータ分析には様々な限界があるからだ。
データ分析のこれから
人が行うデータ分析
データ分析においては、最初に仮説を設定し(課題を設定し)、そして現状の認識を行う。そうして、仮説を検証するにはどのような手立てがあるのかを考える。
現状は仮説に必要なデータが取捨選択されるので、ビッグデータといえどもふるいにかけられ、特定種類のデータしか残らない。人間の疑問ありきでデータが活用されているのが現状だ。
しかし、シンギュラリティ(AIが人間の思考力を超える段階)が起これば、仮説ありきのデータ分析ではなく、データから仮説を立てて、データ分析を行う(つまり、人間が仮説を立てる必要がなくなる)かもしれない。データありきで疑問が生成されていく逆転現象が起こるかもしれないのだ。
ちなみにシンギュラリティとは、AIが人間の能力を超える段階であり、一説には2029年に起こると言われている。
シンギュラリティ以後のデータ分析
そうなれば、AIが政策立案・評価、事業立案において絶対的な存在になるかもしれない。
近代以降の科学においては仮説を基にして実験、検証を行い、再現性のある手立てを探していた。しかし、シンギュラリティが起これば、その営みは、AIがすべて担うようになり、われわれは科学に変わってAIを盲信する時代に突入するかもしれない。
まさに古代ローマから中世ヨーロッパのキリスト教的世界観へ突入したような感覚なのだろうか。もちろん、宗教のような非合理的なモノへの信頼とAIという合理的なモノへの信頼は違う。けれども、そもそもシンギュラリティが起きて「人間が思考するよりも合理的だ」という前提にたって信頼「しなければならない」のであれば、それは思考停止であって、非合理的な世界を生きることになってしまう。
最後に
壮大な話になった。話を個人レベルに落とそう。
因果関係の特定は難しい。そもそも何が原因なのか、あらゆる要素を検討することは不可能である。
だからこそ、日常的に「果たしてこれは本当に原因なのか」と自問し、他の要因を探す癖がついた。そういう思考の習慣に変化があったのも、この本を読んだおかげである。