「天才たちの幼少期の変わった逸話が自分にも欲しい!」ときに効く、アソシエーション分析を基にした、ジーニアスエピソード理論
ピックアップ

ryomiyagi

2022/11/25

2022年11月24日発売の書籍『となりのアルゴリズム 自分で答えを出すためのデータサイエンス思考』(篠田裕之著・光文社刊)より、広告会社のデータサイエンス部門に勤める著者が、部署の後輩たちと生き方の指針になるようなアルゴリズムを語り合う様子を抜粋してお届けします。情報工学的な知識で、あなたの心がちょっと軽くなるかも?しれません。※本書はフィクションです。

 

会社の後輩の小池くんと、業務に関連するマーケティング関連のセミナーイベントを聴講しに行った。そのセミナーでは私たちの会社の同僚であり、小池くんの同期にあたる人物も登壇していた。小池くんはセミナー中、何度もため息をつき、ロクに話が頭に入っていないように見えた。

 

内容はビッグデータとテクノロジーを活用した様々な企業の新しい取り組みについてであり、専門的なトピックも多く、小池くんはセミナー内容を咀嚼できていただろうかと思い、休憩時間に感想を尋ねた。彼は「登壇していた同期が妬ましい」と言った。「登壇していた彼が自己紹介で“僕は幼少の頃からテレビの裏側を覗いたり、椅子を下から眺めたり、人と違う視点でものを見る癖がありました”と言っていましたよね。僕も今日からそうします」と小池くんは続けた。

 

私はこの手の「天才の幼少期の奇人的な逸話」、言うなれば“ジーニアスエピソード”が好きだ。

 

語弊を恐れずに申し上げると、エピソードへの憧れや尊敬、あるいはそのエピソードの行動を真似ようという気持ちは全くない。「頭が良い」や「変わっている」という言葉を直接的に使わずに、いかにエピソードから奇人性を醸し出すか、という表現のバリエーションが好きだ。

 

しかし、そもそも幼少期は誰しもがひとつやふたつと言わず、無意識に奇行をした思い出があるのではないだろうか。もしかしたら、その当時にその振る舞いを注意されたり笑われたりしたことでその行動を直し、いつしか忘れてしまっただけかもしれない。私は「小池くんだって小さい頃はいろんなものを嚙んだり壁に落書きしたりしていたと言っていたじゃないか」と言ったが、「そういうありふれたものではないエピソードが欲しいんです」と小池くんは答えた。「それなら小池くんの思い出の中から珠玉のエピソードを発掘するためにジーニアスエピソード理論を用いるとよい」と私は言った。

 

良いエピソードとは漠然とした印象ではない

 

ジーニアスエピソードを、その人の天才性、奇人性を象徴する一風変わった振る舞いに関する出来事とする。例えば「親がおもちゃを買ってくれなかったので、目をつぶって妄想の世界の中で自分が考えたおもちゃと遊ぶ癖がついた」、「小さい頃から漫画や小説などよりも辞書が好きで、家の近所を散策しては看板など目についた言葉を片っ端から辞書で調べる趣味があった」などの例が挙げられる。なお特定個人を揶揄する意図はないため、これらのエピソードはいかにもありそうなものを私が創作した(ただし、たまたま本当にこういうエピソードを語っている人はいるかもしれない)。

 

ジーニアスエピソードは一風変わっていればなんでもよいわけではない。良いジーニアスエピソードにはいくつかの条件がある。

 

まずは「新規性・独自性」だ。例えば「知育ブロックが好き」「ものを分解することが好き」などのエピソードはあまりに巷に溢れており、もはやエピソードとして語られるというよりも、本当に天才性はそのように育まれることもあるのでしょうね、としか言いようがない。一方で「信憑性のバランス」にも気をつける必要がある。「家中の家具や家電に番号をつけて全てのものを番号で呼ぶ癖があった」と言われた場合、もしかしたら本当にそういう人もいるのかもしれないが、「いやさすがに話を盛っているのでは?」という疑念が先に来てしまう。噓か本当かが重要というよりも、納得感が重要である。

 

そして最後に「エピソードの重要度」だ。そのエピソードがその人を構成する重要な要素なのか、それとも些細な日常のいちエピソードにすぎないのか、この指標にも絶妙なラインが求められる。例えば「布団の中にまでサッカーボールを持ち込み、寝ている間も足にボールの感覚をなじませていた」というエピソードをもつ天才的なサッカー選手がいた場合、エピソードとその人のタレント性が近すぎて、大喜利的な発想のジャンプがない。一見、エピソードとタレント性の関係性が希薄で、うっすらその後開花する才能の発露を感じさせる距離感が良い。これらの3つの指標による閾値条件をみたすエピソード群によって、漠然とした印象をメタ的に解釈し明確にしていく方法をジーニアスエピソード理論と呼ぶことにした。

 

 

膨大なログの中から特徴的な行動を抽出する

 

「ジーニアスエピソード理論はアソシエーション分析と呼ばれる購買データの分析などで用いられる手法をヒントに編み出された」
「アソシエーション……? まあ、聞きましょう」
「例えば購買データの中からマカロニと一緒によく購買される商品を抽出したいとする」
「マカロニを買った人の中で各商品を買った人の割合を計算してみたらいいのではないですか?」
「その値を“信頼度”という。小池くんの言うようにその値ももちろん参考になる。しかし、信頼度が高い商品は全てマカロニと同時によく購入される商品とみなしてよいだろうか。マカロニを買っている人は10人しかおらず、その中で他の商品を買っている人は一桁であるような場合、たまたまそういう人がいただけかもしれない」
「まあ、確かにそもそも全体の中でどれくらいの数がいるのかが重要そうですね」
「そう。そこで購買データにある全人数のうち、マカロニと各商品をどちらも買った人の数の割合を計算する。これを“支持度”という」
「わかりました。では信頼度と支持度が高い商品を選べばよいということですね」
「いや、まだ見落としている点がある」
「まだ!」
「もし信頼度と支持度から牛乳が抽出されたとして、牛乳はマカロニとよく購買されているというよりも、そもそも牛乳がよく購買される商品であり、マカロニともよく一緒に購買されているように見えているだけの可能性がある」
「まあ、そういうこともありそうですね」
「その場合、牛乳はマカロニだけに限らず、卵とも、白菜ともよく一緒に購買されていることになってしまい、“マカロニと一緒によく購買されている”という条件が意味をなさない」
「ではどうすればいいんですか」
「全体の中で牛乳を買った人の割合と、マカロニを買った人の中で牛乳を買った人の割合の比率を見ることにする。これを“リフト値”という。“信頼度”、“支持度”、“リフト値”という3つの指標を用いて、条件をみたす組み合わせを抽出する手法がアソシエーション分析」

 

 

「なるほど。これまでマカロニと同時によく購入されている商品を分析するような場合、“信頼度”的なものしか見ていなかったかもしれません」

 

ジーニアスエピソードは幼少期に限らない

 

「少し落ち着いてきました。自分の中にもそういった条件をみたすエピソードはありそうです」と小池くんは言った。「しかし元も子もないことを言えば、エピソードがジーニアスエピソードになるかは、結果としての偉業次第ではないだろうか。そうでなければそのエピソードが示すのはその人がただの変態であることだけだ」と私が言ったところ、小池くんの顔がわかりやすく歪曲したため「大丈夫。エピソードは何も幼少期に限る必要はない。小池くん、君はすでに十分変態だよ。だからあとは他人のジーニアスエピソードに惑わされることなく偉業を成し遂げればいい」と慰めた。
「劣等感、ねたみ、嫉妬はきりがないですよね。特に現代は身の回りの人だけでなく、SNSなどで自分が取り組んでいる分野の優れた人を容易に探すことができますし。冷静な気持ちでメタ的に他人のエピソードや人となりやスキル、やっていることを整理することで、他人ではなく自分にベクトルを向けることができるのかもしれませんね」と小池くんが斜め上を見て急に一般論のようなことを語り出したので、もう大丈夫そうだろうと思い、次のセミナーの会場に向かった。

 

後日。渡辺くんと会社の廊下ですれ違った際、「最近、小池が会議中に考えるときに頭のネジを回すような仕草をしたり、忍者のように印を組んだりしているんですけど、彼に何か言いましたか?」と聞いてきた。私の話の半分以上は小池くんに伝わっていない気がする。

 

アルゴリズム解説 
隠れマルコフモデル(Hidden Markov Model:HMM)

隠れマルコフモデルとは観測された状態の背後に隠されている別の要因を伴う状態遷移モデルとなる。

マルコフモデルとは、ある状態となる確率が直前の状態のみによって決まるものとなる。

図1_4の例では「休日の各行動」という直接観測できる要因に対して「その日のテンション」という隠れた状態が存在する。隠れマルコフモデルは観測できる状態遷移から、その背後に隠された状態遷移を推測するために用いられることが多い。隠れマルコフモデルをもとに観測された状態の並びから隠れた状態がどのように遷移したかを推定するためには「ビタビアルゴリズム(Viterbi Algorithm)」と呼ばれる動的計画法が用いられる。

 

『となりのアルゴリズム』
篠田裕之/著

関連記事

この記事が気に入ったら
いいね!しよう

最新情報をお届けします

Twitterで「本がすき」を