2019年2月19日火曜日

竹村 彰通/デ『データサイエンス入門』

仮定を立証する意味で、統計的手法をとることは今までも行われてきた(朝食と成績の相関関係など)ことだが、これからは、数字先行型の、とりあえず数字だけ記録しておいて、振り返ってみると、どうやら法則があるようだという段階に移りつつある、そういう話が載っていた。

 なお、統計にまつわる数学や理論は、伝統的な学習方法で身に着けてくださいとのことで、この本を読んで身につくわけではない。あくまでこういうことができて、きっとこういう可能性がありますよと言う紹介にとどまるもの。

Amazon商品詳細

数字の意味を見易くする新しい眼鏡


 インターネットの登場と電子記録媒体の発展によって、数値の記録などは義務のように行われている。あまり意識されていない方も多いようだが、ネット上のすべての行動は記録されているといっても過言ではない。ビッグデータと呼ばれているものの一つである。『我がままな感想』のアクセス数は微々たるものなので、統計的には大したデータにはならないが、大きくなればなるほど人の動きの大きな傾向を把握する事が出来る。どの記事がよく読まれているかを把握するのはもちろんのこと、どういったテーマが読者の関心を引き付けるのかなどなど。ビッグデータは、社会科学の領域を、理念系と呼ばれる人形を超えて、より身近な生の行動に即した領域へと広げたといっても良いだろう。

  しかし、気をつけなければならないのは、統計の真理は、計測可能領域に限られるということだ。例えば、大手検索サイトのデータは凄まじい量だが、それは積極的に探したいものがある人間を対象としたアンケートに過ぎない。それを、全人類の意図と受け取るのは誤りである。

  数値先行型は、仮定を抜かしているという点で、数字の大きさに惑わされ易い。数値が新たな視点を提供し、問題解決の大きな助けになることは違いないのだが、有無を言わせない大きな傾向をそのまま回答として受け取るのは危険である。やはりここは、バルザックが『幻滅』で書いたように(統計自体は別に新しい学問ではないのだ)、「濫用しなければ便利な道具さ」という気分で利用するのが、妥当なところなのではないだろうか。ビッグデータは、社会を見えやすくする数字をもたらしたと捉えるべきだろう。その意味するところを見るための眼鏡を磨くのが、データサイエンスという分野ではないかしらん。

幻滅 ― メディア戦記 上 (バルザック「人間喜劇」セレクション <第4巻>)
バルザック 鹿島 茂 山田 登世子 大矢 タカヤス
藤原書店
売り上げランキング: 204,457