こがいだん絶賛の統計思考力読んだ。いまいちぐっとこなかった。
1.レヴィットのヤバい経済学をおすすめする。この路線を数歩先に進めている。これを読んでいたのでさほどおもしろくよめなかった。
2.sfcのカリキュラムのいいところはどの文系学生にも1.unixでメールかかせる2.データ分析の授業が必須である、の2点だった。
3.因果関係にはなしが進んでないのが物足りない。ここがインターネット的情報環境が人類史的革命につながるところだと僕は思ってるもので。
4.実は統計思考力というのはさほど能力としては役に立たないと結論してる。直感のがずっとまし。実用に耐える統計思考力というのは世の中に存在しえず、トライしたことのある人はたくさんいると思うが、みな失敗しているはずだと。この失敗を因果しているのは、統計情報量の少なさだ。この少なさを因果しているのは統計のROIの低さだ。このROIの低さを因果してるのは、サンプリングし、集計するということのコストの高さだ。この値が一定以上下がらないと統計をとることはできない。そして十分な統計がないと統計は直感ほどの価値をもつことはまずない。統計とかデータはつなぎ合わせるときに最大の価値がでる(因果関係とかそのチェーンとか)けど、それほどになるにはデータが大量に必要になり、このデータ作成のコストが下がらないと統計データ量が増えない。現状では、まあ「データよめるといい、よみかたはこれ、一時データがあるならそれを当たる努力をするとイケるぞ」は事実だが、ほとんどのケースでは主観のが遙かに精度が高い程度しか統計情報はてに入らないので、基本的にはこの本の通りに行動するとバカな人になると思う。なおこれはこれっぽいことを結構さんざんやってる自分がいうので割と批判だけの発言ではない。僕だってもっと統計データがあったら遷移したいと思ってる一人だし。
ただまあ、エンジニアとして、大量のデータ統計のクエリを投げ続け、プログラムしてきた経験上わかってきたのは、社会全体がなにかを離散可能にする動機をもって世界を長め始めており(そしてそれはモデリングであるので僕たちの起業計画の中心的ツールにとってこれは巨大な後押しであるとして)、そのついでに大量の統計可能なデータがでてくるのである。タンブラーのtumblarityなかもそんなようなものかもしれんし、スイカの行動履歴使ってなんちゃらとかそういうのもそうだけど。するとデジタル(離散)機器全盛なんだからこれからは統計もっと増えてくるかもよっていうのはそうだ。あとはおれたちに発注してくれたらなんとかするで。みたいな。
ウェブとかに近すぎない、生っぽいといかそういうデバイスがもっとログをつくってくれるようにするとすごい時代に行き着きそうではある。センシング。
渋谷の交通量とか天気予報とかそういうのももっと自動的にとれそうだよな自動車にrfidとかv6なipついてるとかいうだけで。
えーと、もう一つ重要なこと。レヴィットのがすごいと思ったのは、上に書いた「統計のROI」についてのことと強く関係もするんだが、プロジェクトベースというか、問題解決ベースというかになる。統計は、「なんかみんなにやくにたちそう」というようなデータとして国とかが出してる場合がおおい。でも、「解決したいなこの問題」とおもったその問題に絡んだデータ、というのはほとんどの場合ない。これが問題だった。ないから作ろう。というのもコストが高い=>roiが低いのでなしってなってた。「こんなデータあるよ。へーこれがはやるんだ次は」とかいうことでそれを動機にプロジェクトがスタートすることはあっても、「これが問題に思う。これはどうして起こっているのかを示すデータとりたい」といってもその調査のコストは非常に大きなものになる。レヴィットはこのあたりもうまくやっている風で、自分の問題のためのサンプリング、リサーチ、といったフェーズも統合した、ものすごい問題解決をやってのけていた。そうなったときに初めて可能になる、統計思考力ではなく統計統合型問題解決力とでもいうべきものの価値を実践的に示していた。統計思考力は所詮思考力で、おそらく直感にあと10年は(人工知能に人類でもっとも近いとこまでいくものをつくった僕がいうんだから間違いないとかあおっとくが)おいつけないと思う。