データエンハンサーの戯言置き場

データサイエンティストを挫折した人がデータとアナリシスのエンハンスメントについて考える

はじめての方へ

このページは初めての方に向けた自己紹介とその他諸々のページです。よしなに。




自己紹介

某インターネット企業にてデータアナリストを経てデータサイエンティストになれず、データエンハンサー(自称)、アナリシスエンハンサー(自称)をやっております。 ブログの内容は個人の意見・見解であり、所属組織の意見・見解とは異なる事があります。




データエンハンサーとは

自称です。

lucies.hatenablog.com




↓それでは最新記事をどうぞ↓



【読書記録】誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性

 

誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性

誰もが嘘をついている ビッグデータ分析が暴く人間のヤバい本性

 

 お久しぶりになってしまいました。

本を読んでないわけでもないし、ブログネタが無いわけでもないんだけど、なんか当たり本を引かなかったり、ブログネタも推敲するほどの時間がなかったりでとても時間が空いてしまいました。

 

これも別にすごく当たりの本っていうわけでもないのだけれど、分析の本。ビッグデータ分析というが、中身の8割はGoogle検索の話。8割のうちの半分がポルノで、半分が政治の話。分析の本を買ったはずなのにずっとPornhubデータの話をされるのはちょっとつらいものがあった。

 

主旨としては、ビッグデータ≒検索データを見ると、アンケートとは全然違う結果が出るよ、という話。人はアンケートを答えるときに無意識に、客観的な事実よりも「こうありたい」あるいは「こうあるべき」というような回答をしてしまうことがある。前回の大統領選も、アンケート結果と実際の結果はずいぶんと違ったみたいな。

 

特に、エロとか差別みたいなセンシティブなものの例がひたすら列挙されていて、たとえばアンケートをすると人種差別はほとんど無くなったことになるけど、検索データ見ると「nigger joke」みたいな検索が未だに一定数ある、とか。

 

これが実務に活かせるのか、っていうと割と微妙ではあるのだけれど、でも調査方法によってバイアスはかかるよね、という話は結構あって。googleの検索結果をこの本では漁っているけれども、実際日本の検索データみるとGとYでも結構差が出たりとか。

 

まあアンケートだろうが検索データだろうが国勢調査ですらもサンプリングバイアスはどうしてもかかるので、そういう事象が起こるよっていうのを確認してみる意味では良いのかもしれない。

 

 

まあ別にあえて買うほどの本でもないかなあとは思うけど、事例としてこういうのもあるよっていうことで頭に入れておいてもいいかなあとも思う感じ。