人間の直感を信じる「ベイズ統計学」が科学者からdisられまくったわけ

長江貴士 元書店員

『異端の統計学ベイズ』草思社
シャロン・バーチュ・マグレイン/著 冨永星/翻訳

 

 

「ベイズ統計学」というのは、現代であれば当たり前に使われているだろう。特に、ビジネスの世界で重宝されているのではないか。「ベイズ推定」という名前の方が有名かもしれないが、今では、「統計学」の一つとして、当たり前に受け入れられている。

 

しかしこのベイズ統計学、誕生から200年ほどの間、とにかく嫌われまくっていた。「こんなものは統計学/科学じゃない」と受け取られていたのだ。

 

とはいえ、その気持ちも分からないではない。まずその辺りから説明していこう。

 

統計学の主流派は、「頻度分析」と呼ばれるものだ。これは、とても分かりやすい。同じ条件でたくさん実験や試行を繰り返して、その結果を元に確率を導き出す、というものだ。例えば、重心の位置から外れた場所に重りを埋め込んだサイコロのことを考えてみよう。このサイコロは、1~6の数字を、恐らく等確率で出さないだろうと予想できる。じゃあ、それぞれの数字が出る確率はどうやって求めればいいだろうか。簡単だ。サイコロをとにかくたくさん振りまくって、それを記録し続けるのだ。何万回と繰り返せば、それぞれの確率を求めることが出来るだろう。これが「頻度分析」である。

 

しかし、これでは求めることが出来ない種類の確率がある。「これまで一度も起こったことがない出来事が起こる確率」である。例えば、2010年、つまり福島第一原発事故が発生する以前の日本で、「原発事故が起こる確率」を考えなければならないとしたら、どうしたらいいだろうか?「これまで一度も起こったことがないのだから、今後も起こらない」という主張はどう考えても成り立たない。つまり、何らかの確率が存在するはずだ。しかし、「頻度分析」という手法では、この種の確率は導けない。他にもそういう種類の確率はあり、とにかく、「頻度分析」では太刀打ちできない領域が存在する。

 

では、ベイズ統計学では、そのような確率をどう導くのだろうか。ベイズ統計学では、「事前確率」というものを導入する。これは、平たく説明すれば、「人間の直感」である。「原発事故って、どのくらいの確率で起こりそうだろうか」という、人間の直感を、「事前確率」として組み込むのである。

 

そう、まさにこの点こそが、ベイズ統計学がメチャクチャ嫌われたポイントなのである。

 

(※ベイズの法則に何故拒絶反応を示したか、という問いに対する)答えはしごく単純で、ベイズの法則の核となるものが、科学者の心に深く根ざした「近代科学には正確さと客観性が求められる」という信条に反していたからだ。ベイズの法則では、信念が尺度となる。この法則によると、欠けているデータや不適切なデータ、さらには近似や無知そのものからも何かがわかるのだ

 

まあ、嫌われても仕方ないか、という気はする。確かに、「人間の直感を組み込む」なんていうのは怪しそうだ。しかし、結果的に現在では、ベイズ統計学は評価されている。それは、細々とではあったが、使われて続けていたからだ。何故だろうか。それは、人間の直感なんてものを使ってるのに、ベイズ統計学が正しい答えを導き出すからだ。とにかく、ベイズ統計学は実用的だったのである。本書には、こんな文章もあるほどだ。

 

チャーノフはベイズ派ではなかったが、当時研究者として第一歩を踏み出したばかりだった統計学者スーザン・ホルムズに、難しい問題に直面したときの構えを次のように説いている。「その問題について、まずベイズ流のやり方で考えてみる。すると正解が得られるから、あとはそれが正しいことを、好みの方法で証明すればよろしい」

 

何故、ベイズ統計学ではなく、「好みの方法」で証明しなければならないかと言えば、ベイズ統計学があまりにも嫌われていたために、「ベイズ統計学を使っている」といだけで「頻度分析」派の人たちにボロクソ言われてしまうからだ。

 

科学的なスタンスからかけ離れているという理由で科学者からは嫌われたが、ビジネスマンや実際上の問題を抱えている人たちは、窮余の策としてベイズ統計学を使っていた。その中でも最大の成果と言っていいのが、第二次世界大戦でドイツが使った暗号機・エニグマの解読である。エニグマの解読にベイズ統計学が使われたとなれば、その後一気に広まってもおかしくない。しかし、エニグマ解読に関する情報は一切の機密とされてしまったために、その功績が広まることはなかった。

 

他にも、「各国が核兵器を保有するようになったために、水爆事故が起こる可能性を見積もらなければならない」とか、「行方不明になった水爆の在り処を探し出さなければならない」とか、「世論調査への信憑性が失われていた時に、僅差で決着すると考えられていた大統領選挙の勝敗を予想しなければならない」など、それまでのやり方では対処不可能な現実的な問題に対してベイズ統計学が使われることがあった。とはいえ、ベイズ統計学が市民権を得るまでには時間が掛かった。

 

その別の理由として、計算が大変だったということが挙げられる。しかし、「マルコフ連鎖モンテカルロ法」という、計算を単純化する手法が開発されたり、単純にコンピューターの性能が向上したりしたことで、それまでよりもベイズ統計学が使いやすくなり、少しずつ広まっていくことになる。

 

そして今では、多くの理論家が、「正しい問いへの近似的な解のほうが、まちがった問いへの正確な答えよりもはるかによい」という意味で、ベイズ統計学を評価している。この意味を説明しよう。頻度分析の場合、理論的には正確な答えを導くことが出来る。しかしそもそも、正しく問いを立てることが難しいし、問いを立てられないことさえ多くある。一方のベイズ統計学は、100%正確な答えというわけではないが、現実的な問題に対して「正しい問い」を立てることが出来る、ということだ。そしてようやく、後者の方が有用だと認められるようになったのだ。

 

現在、ベイズ統計学がどのように使われているのか、抜き出してみよう。

 

今ではベイジアン・スパム・フィルタが、ポルノ・メールや詐欺メールをすばやくコンピュータのゴミ箱に運ぶ。どこかで船が沈んだら、沿岸警備隊は生存者が何週間も大海原を漂流しなくてすむように、ベイズ推定を使ってその居場所を探り出す。さらに科学者たちは、遺伝子がいかに調整され、規制されているかを突き止める。ベイズ派からはノーベル賞受賞者も出ており、オンラインの世界では、ウェブで情報を広く集めたり歌や映画を売るのにベイズの法則が使われ、コンピュータ・サイエンスや人工知能や機械学習、ウォールストリートや天文学や物理学、安全保障省やマイクロソフトやグーグルにまでベイズの法則が浸透している。この法則のおかげで、コンピュータによる言語の翻訳が可能となり、何千年にもわたって立ちはだかってきたバベルの塔が瓦解しようとしている。

 

まさに、科学の最先端領域にはなくてはならない手法になっていると言っていいのではないかと思う。

 

ベイズ統計学は、名前の通りベイズという人物が発見したのだが、この法則を定式化し、実際に使える形に仕立て上げたのは、ベイズとは独立にこの法則を発見したフランスの巨人・ラプラスである。しかし二人とも、正当な評価を受けることなく亡くなってしまう。ラプラスは、ベイズ統計学以外にも多くの功績があるのだが(有名なのは「ラプラスの悪魔」である)、それでもベイズ統計学を生み出したことで謂れなき中傷を受けることにもなってしまった。しかし、彼らが生み出し、細々とながら使い続けてくれた人たちがいたお陰で、僕らは今、ベイズ統計学の恩恵を受けることが出来ている。その歴史を、是非読んでみてほしい。

 

 

『異端の統計学ベイズ』草思社
シャロン・バーチュ・マグレイン/著 冨永星/翻訳

この記事を書いた人

長江貴士

-nagae-takashi-

元書店員

1983年静岡県生まれ。大学中退後、10年近く神奈川の書店でフリーターとして過ごし、2015年さわや書店入社。2016年、文庫本(清水潔『殺人犯はそこにいる』)の表紙をオリジナルのカバーで覆って販売した「文庫X」を企画。2017年、初の著書『書店員X「常識」に殺されない生き方』を出版。2019年、さわや書店を退社。現在、出版取次勤務。 「本がすき。」のサイトで、「非属の才能」の全文無料公開に関わらせていただきました。

関連記事

この記事が気に入ったら
いいね!しよう

最新情報をお届けします

Twitterで「本がすき」を