第5問にはこんなリード文があった。
2段落目で示されているのはデータ分析である。
第4次産業革命の流れの中でビッグデータに注目が集まっている。
中には貨幣ではなく情報が価値を生むようになる、と言う者もいる。
そうした世相を反映してか、多くの大学でデータサイエンス関連の学部新設が続いている。
国公立大学では東京大学や広島大学や滋賀大学、山形大学、横浜市立大学など。
私立大学では津田塾大学、東京理科大学、中央大学、武蔵野大学、工学院大学などが続く。
データサイエンスに従事する友人に聞いたところデータ関係の研究者は人材難で引く手あまただそうだ。企業のリクルート活動は非常に盛んらしい。
グーグルやアマゾンも本腰を入れてリクルートしているというデータサイエンティスト(この記事ではデータアナリストとは区別せずにデータサイエンティストと呼びます)。
学問分野として未知数であり、ビッグデータという概念も近年注目され始めたもの。
だが、社会の変化はいやがおうにも進んでいく。進路指導をしていてデータサイエンス学部を志望する生徒もちらほら出てきた。
後々のためにも色々と調べようと思ったが、まずは初歩から。
そもそもデータとは何なのか?
そこから整理していきたい。
データとは-日本語から
大辞林にはこう書かれている。
①判断や立論のもとになる資料・情報・事実。
②コンピューターの処理の対象となる事実。状態・条件などを表す数値・文字・記号。(大辞林第3版より)
一方で、図書館情報学用語辞典には以下のように書かれている。
既知の事項や判断材料。研究に活動においては、調査や実験により得られ、考察の材料となる客観的な結果である。一方、情報処理システムの処理対象でもある。また、データは情報を生み出す材料とみなされることがあり、評価の加えられたデータを情報と定義し、データ、情報、知識という階層関係を強調する立場がある。データを情報といいかえても差し支えない場合も多く見られ、こうした関係付けの一般化には十分な根拠はないが、これにより潜在的な情報(データ)と実際に受容された情報とを便宜的に区別することができる。(図書館情報学用語辞典 第4版)
データとは考える材料としての事実や資料であろうか。
英語ではどうか?
dataを英英辞典で引くと以下のように書かれている。
information,especially facts or numbers, collected to be examined and considered and used to heip decision-making, or information in an electronic form that can be stored and used by a computer
これを訳せばこんな感じだろうか。
(学術研究などの)調査や考えるために集められたり、意思決定の助けになったりする事実や数字などの情報。
あるいはコンピューターによって保管・処理が可能な電子的な形の情報のこと。
考える材料という点では日本語の定義と共通している。
結局データとは?
データとは単なる事実である。それを加工すれば情報となる。
つまり、データを活用して判断したり、解釈した結果が情報となるのだ。
ビッグデータの時代においては解釈の材料が大量にある。
それを活用するのが人間の力量というわけだ。
したがって、データは考える時に使われて初めて価値を持つ。
ビッグデータがあっても解釈できなければ意味がない。データ分析のスキルを持つ人材が求められているわけである。
ただしデータ至上主義に陥ってはいけない
大量のデータによって様々な情報が手に入るようになった。
ただ留意しなければならないことがある。
それはデータ至上主義に陥ってはならないということだ。
そもそもデータ自体の信用性は担保されているのか?
意図的に改ざんされていないだろうか?
常に批判的な眼差しをもってデータに接しなければならない。
企業のデータ改ざんや省庁の隠蔽が多く取りざたされる昨今。
データが価値を持つ一方で、データの価値を貶める出来事が続いているのは皮肉なことだなあと思う。