データサイエンスで取り扱うデータとは

「データ活用」と言って活用される「データ」とはそもそも何か、という話

データサイエンティストは魔法使い?

「データ活用」と言って活用される「データ」とはそもそも何か、という話

どーもこんにちは。アイズファクトリーのデータサイエンティストです。

昨今、やたらと使われる「データ活用」。唱えれば業績が急上昇するかのような、もしくは極楽浄土に救われる念仏のような使われ方をしています。
しかし、ご存知のとおり「データ活用」を唱えるだけでは、業績が伸びるわけでも、ましてや極楽浄土に行けるわけでもありません。
そんな魔法の呪文があったら、額にキズのある魔法使いだってビックリでしょう。
「魔法省仕事しろ!!」とか言って。

そもそも「『データ』とは、なにか」

さて、我々データサイエンティストは、業務として日常的にデータを扱いますが、そもそも「データ」と聞いて読者の皆様はどんなイメージを持たれるでしょうか。
イケメンのお兄さんが黒縁のメガネをクィっとしながら「その案件の受注確率は○○%です」とか言い放っているイメージでしょうか。そうだとすれば、マンガや小説の影響を受けている可能性が高いです。
残念ながら、世の中そんなにイケメンばかりではないし、女性のデータサイエンティストもちゃんといらっしゃいます。

データ(data)とは、『何かを文字や符号、数値などのまとまりとして表現したもの』(*1)と定義されています。
そして、人間にとって意味があるようにデータを解釈した結果のことを「情報(information)」と呼んでいます。
つまり、「データ」というのは「情報」と表裏一体の関係にあって、人間が何かを判断するための根拠となりうる存在、と言えますね。

そもそも「『データ活用』って以前から行なわれてきたのではないか」

何か目新しい手法のように語られる「データ活用」ですが、実のところビジネスシーンでは昔からデータは活用されていたわけです。
むしろ、ビジネス上の意思決定にデータを使わないなんて滅多に無かったのではないでしょうか。
では、従来活用されていた「データ」と昨今語られる「データ」とでは、一体何が異なるのでしょうか。
ヒントは、データの量と質の両面にあります。

IT技術の発達によって、データを収集しやすい環境が徐々に整ってきました。
会員カードの普及やオンラインショップの利用履歴から、個人の購買履歴を記録できるようになりましたし、その履歴を貯めておくために必要な環境も用意できるようになりました。
そして、データの解析技術の発達により、大量のデータからビジネスに有用な情報を導き、ビジネス上の意思決定に活用できるようになりました。
また、数値データだけではなくテキストデータも収集できるようになったことと、テキストデータの分析技術が向上したこともあり、数値以外のデータ活用の可能性も拓けてきました。

このように、従来のデータ活用と今後のデータ活用には、データの量や質という点で大きな違いがあります。
単に「データ活用」と言うだけではなく、具体的にどんなデータをどのように活用するのかも明確に語れるように意識できることが、データサイエンティストの第一歩なのかもしれません。

「データが役に立つのは当たり前。問題は誰がどのように役立てるのか」

収集されるデータというのは、業種によって、企業によって、もっと言えば部署によっても大きく異なります。
工場なら工場のデータが、店舗なら店舗のデータが収集できるように、多種多様なデータがあります。立場が異なればデータを活用の目的も異なりますし、当然ですが、目的の達成に必要とされるデータも変わってきます。

多種多様なデータを効率よく活用するためには、部署横断的に役立てるための作戦が必要になります。
具体的には、データサイエンティストがお客様のビジネス上の目的や課題に応じてデータを活用するためのロードマップを作成し、データがどのように役立つのかという道筋を明示することが必要となります。
そして、データをうまくビジネス上の成果へ結びつけられたとき、結果的にデータサイエンティストの判断は正解だった、となるのです。

前述のように、データそれ自体は、情報に解釈されない限り何の価値もありません。
ビジネスに有益となるような情報に解釈して初めて、データを活用することができます。
そこに、データサイエンティストとしての力量が問われています。

*1:【出典】IT用語辞典(http://e-words.jp/w/%E3%83%87%E3%83%BC%E3%82%BF.html

この記事は株式会社アイズファクトリーが提供しています。

株式会社アイズファクトリー

株式会社アイズファクトリーは、理学博士が中心となり設立されました。
「全ての人に成功確率UPを届ける」をキャッチフレーズに、科学を活用してより良い社会に貢献すること、その後のシステム開発を通じて、お客様企業の業務効率向上に貢献すること、を目指しております。

 近年、ビッグデータ活用の必要性が高まっており、データマイニングがより注目されています、過去300超のプロジェクトで培った解析力と実ビジネスへの応用力は、グルメ情報提供サイト、ECサイト、広告関連企業、教育関連企業、自動車メーカー、公官庁、といった幅広い業界の大手企業・団体様から高い評価を得ております。

データサイエンスの概要を無料配信中!無料セミナーの動画と講義レジュメを配信!

通勤講座は今すぐ無料で受講できます。
まずはお試しください!

登録すると無料で試せます

  • 無料セミナー
    「データサイエンスの入口」
  • 講義レジュメ(PDF)
    無料セミナーのスライドがダウンロードできます!

※無料講座の内容は予告なく変更される場合があります。
あらかじめご了承ください。