何が「あなた」を表しますか?

ビッグデータの時代になって、いろんな組織があらゆる機会を利用して、個人データを収集しています。


これに関してよく起こる議論は個人情報の漏洩であったり、プライバシーの侵害や犯罪(ストーカーなど)の懸念であったりするわけですが、今日はちょっと違う視点で考えてみましょう。

それは、いったいどのデータがあたしを(もしくは、あなたを、つまりは「自分」を)、もっとも正確に浮かび上がらせるだろうか、ということ、そして、

それらのデータにより、自分という人間はどこまで正確に理解されるのか、ということです。


たとえば、現時点で集められているデータには、下記のようなものがあります。


1)過去一ヶ月間分の Suica (ICOCAなど)の記録
都市部に住む人の場合、このデータで自宅の場所、会社の場所、休日や勤務後に遊びにいく場所などが、タイムスタンプ付きで把握できます。これからは会社の勤務記録でなく、こういった記録で労災判断(残業時間の長さなど)が判定されるようになるかもしれません。
車で動く地方の場合は、自動車の走行記録と読み替えてもよいでしょう。


2)過去一ヶ月分の電子マネーの使用記録
nanaco や Edy もしくは Suicaなどの購買記録。これにより、あなたが買った商品、その店、買い物時刻などがすべて把握できます。住んでいる場所や大体の経済状態、食生活の様子もわかるでしょう。


3)過去一ヶ月分のクレジットカードの使用記録
電子マネーの使用記録と異なり、こちらでは、あなたがここ一ヶ月、どこに旅行したか、どんな洋服を買い、どこのレストランで食事をし、どんな趣味を持っているか、などが把握できるでしょう。


4)過去一ヶ月分の銀行口座データ
これにより、給与額や、電気代やガス代がどれくらいかかっているか、クレジットカードをどの程度使ったか(それが給与の何パーセントか?)、家賃や住宅ローン、管理費がどれくらいか(どんなところに住んでおり、ローンが給与の何%に当たってるか?)、車を持っているか、どういう頻度で買い替えているか、さらに、子供の学費や定期的な習い事についてもわかりそうです。


5)過去一ヶ月のスマホ GPS データ
これで「移動の記録」がすべて手に入ります。いったい、いつ、どこに行き、どれくらいの時間、滞在したのか。おそらく使った交通機関も推測できるでしょう。


6)過去一ヶ月の個人的な通信記録
昔なら電話ですが、今なら LINE や、電子メールの記録などです。これにより、誰が友達で、彼らとどんな会話をしているか(喧嘩したとか、口説いてるとか・・)、もしくは、仕事の内容(分野)や進み具合、付き合いの広さや深さなどもわかりそうです。


7)過去一ヶ月間分のツイッターでの呟き
LINE やメールとは違った個人の正直な気持ちが推定できそうです。何に愚痴を言っているか(=何にイラついているか)、どんなコトを楽しんでるか。また、どんな情報を得て、何に驚いたり感動したりしているか。関心を持っているコトは何なにか、などなど。
メールの情報と併せると、裏表の感情などもマッチングさせて理解できそう。(メールでは丁寧に回答しながら、ツイッターでは愚痴っているとかね)


8)過去一ヶ月間のブログエントリや Facebook への投稿
どんな内容を post しているかに依りますが、私の場合ならブログを見てれば、どこに行ったか、どんな本を読んだか、そして何より、何についてどんなことを考えたかがわかります。Facebook を熱心に更新している人なら、写真付きで、「いつ、どこで誰と何を食べたか」などもすべて把握できます。


9) 過去一ヶ月に検索したすべてのキーワード
グーグル様はすべてお見通し。こちらのデータの方が、ブログエントリや FB のポストよりビビッドかつストレートに「この一ヶ月に自分が関心を持ったこと、買ったもの」などを浮かび上がらせる可能性もあります。


10) 過去一ヶ月に閲覧したすべてのウェブサイトの記録
これも、かなりのことがわかりますねー。ニュースなのかブログなのか、ヤバいサイトなのか、特定の趣味に関するサイトなのか。個人の趣味嗜好、そして、関心事がすべてわかりそうです。


11)過去一ヶ月にネットを通して取引した金融の記録
FX や株式の取引のほか、銀行振り込みなどからは納税額や大きな買い物の額、キャッシングの有無や額もわかるでしょう。


12) 駅や空港、コンビニ、繁華街のメインストリート、オフィスのエレベータ等についてる監視カメラの映像
これで、ビジュアルにあなたがいつ、どこにおり、その時誰と一緒で、どんな服装をしていて、どんな言動をしていたかがわかります。コレ、最近ほんとーに多いので、「いつも誰かに見られている」ことを忘れないようにしましょう。


13) 公的な記録
住民票や納税記録、パスポートのデータや不動産登記、抵当権設定や会社設立時の記録など、公的な書類を数年単位で見れば、誰がどこに住んでいて、どの程度の収入があったか、結婚したか離婚したか、子供が生まれたか、会社を設立したり倒産させたりしたか、渡航歴は? などがすべてわかります。健康保険や介護保険の支払記録により、病歴や健康状態も把握できますね。


14) 特定ショップの利用記録
アマゾンや楽天での購買記録はもちろん、特定のレンタル DVD ショップなどの会員になり、あれこれ借りている人はその履歴、図書館の貸し出し記録や、Tポイント、ポンタカードの使用履歴も個人の趣味嗜好、生活の様子をあからさまに反映しているはず。


15) その他
他にも電話をよく使う人なら通話記録、特定のウェブサービスの会員となり、頻繁に何かを投稿しているならそのデータ、最近はまってるネットゲームの記録など、いろんな個人記録が残っています。

パソコンやスマホ上では、「どのアプリを、いつ、どの程度使ったか」というデータもあります。複数の端末を使っている人の場合、いつ、どこから、どんな環境でネットとつながっているか、もわかります。

一般的ではないですが、あなたがアーティストやスポーツ選手なら、作品やプレイの映像なども残っているはずです。


★★★


さて、上記はすべて現時点で集められている(集めることが可能な)データですが、このうち、どれとどれを組み合わせれば「あなた」のことが一番わかるでしょう?

また、リアルなあなたには一度も会ったことのないデータサイエンティスト(かつ、プロファイラー)が上記すべてのデータを把握したら、

その人がデータから形成する「あなたのイメージ」は、本当のあなたの姿を、何%くらいまで捉えることができているでしょう?


そんじゃーね!