agarieakiko
2019/03/15
agarieakiko
2019/03/15
伊藤公一朗『データ分析の力』(光文社新書)2017年
連載第13回で紹介した『データはウソをつく』に続けて読んでいただきたいのが、『データ分析の力――因果関係に迫る思考法』である。本書をご覧になれば、そもそも因果関係とは何か、どのようにビッグデータを分析すればよいのか、なぜ因果関係を見極めることがビジネスや政策を成功に導くのか、明らかになってくるだろう。
著者の伊藤公一朗氏は、1982年生まれ。京都大学経済学部卒業後、カリフォルニア大学バークレー校大学院博士課程修了。スタンフォード大学経済政策研究所研究員、ボストン大学ビジネススクール助教授を経て、現在はシカゴ大学公共政策大学院助教授。専門は計量経済学・産業組織論。国際的に活躍する新進気鋭の経済学者であり、専門論文は数多い。
本書は、伊藤氏が初めて一般向けに公表した単著だが、「第一級の啓蒙書であると同時に、彼自身の最新の研究成果を紹介しているという意味で研究書」でもあると高く評価され、「2017年度サントリー学芸賞」を受賞している。最先端の研究成果を社会に還元するという意義深い作品であり、今後このようなレベルの「新書」が出版されていくことを願っている。
さて、読者が、アイスクリームを製造し販売する会社のマーケティングの担当者だとしよう。今年度、初めてウェブサイトにアイスクリームの広告を掲載したところ、昨年度10万個だった売り上げが14万個と40パーセントも増加したとする。ここで「広告のおかげで売り上げが40パーセント上がった」と結論付けられるだろうか?
一般に、ある要因(X)が変化するとき、別の要因(Y)がランダムではなく変化する関係を「相関関係」と呼び、ある要因(X)が原因で別の要因(Y)が結果である関係を「因果関係」と呼ぶ。したがって、「(統計的に有意な)相関関係」は「因果関係」の前提(必要条件)ではあるが、相関関係があるからといって、必ずしも因果関係があるとは限らない。
もしかすると、今年度のアイスクリームの売り上げが増加した本当の原因は、広告ではなく、今年度が昨年度に比べて「猛暑」だったからかもしれない。あるいは今年度は昨年度に比べて非常に「景気」がよく、消費者の購買意欲が旺盛だったからかもしれない。要するに「X以外の要因Zの影響でYが変化した」可能性を排除できない点に注意が必要なのである。
「アイスクリームの売り上げが伸びると、水死者が増える」という相関関係がある。実際にグラフに描いてみると、どちらも夏がピークになるような分布曲線になる。だからといって、アイスクリームが水死の原因でないことは明らかだろう。
また、実は「YがXに影響を与えていた」という可能性もある。今年度は猛暑の影響から6月末時点でアイスクリームの売り上げが伸びていたため、会社はその売上金を使って7月と8月にウェブ広告を出したとしよう。このように、現実に起こりそうなケースでは、売り上げと広告が相互に影響を与え合っているため、どこまでが広告の成果なのか測り難い。
ある要因(X)と別の要因(Y)が「因果関係」だと断定するためには、(1)Xが時間的に Y に先行していること、(2)X が生じなければYも生じないこと、(3)X が生じたらYも生じることを満たさなければならない。どうすれば、現実世界の因果関係を見極められるだろうか?
過去には、できるだけ関係のありそうな要因を集めて、その影響を統計分析で取り除く方法が取られてきた。アイスクリームの例では、気温や景気のデータを集めて、広告の影響から除外していくわけである。しかし、すべての可能な要因を除外できないことは明らかだろう。
そこで用いられるようになったのが「ランダム化比較実験」である。この方法は、薬の効果を客観的に測定するために、医師も患者も対象薬か偽薬かを不明にして行う「二重盲検法」の応用で、ランダムにグループ分けしたデータ分析から「因果関係」を導く方法である。本書は、オバマ前大統領が行った選挙活動におけるマーケティング戦略を紹介し、実際に行われたランダム化比較実験について興味深い分析がなされている。
仮に自分自身がデータ分析を行う立場でない場合であっても、職場での重要な決定が「誰かのデータ分析」に基づくようになる機会が増えてきています。そのため、自分が分析の当事者でない場合にも、「誰かのデータ分析に騙されないために」データ分析の結果を見極める力が重要になってきているのです。(P.6)
世の中に氾濫する「ビッグデータ」をどのように扱えばよいのか、真の「因果関係」を見極めるためにどうすればよいのかを理解するために、『データ分析の力』は必読である!
株式会社光文社Copyright (C) Kobunsha Co., Ltd. All Rights Reserved.