「データを説明するデータ」と言われるメタデータとは??

みなさんこんにちは。前回の投稿からかなり時間がたってしまいました。
また少しずつ投稿していこうと思います。
今回は、ビッグデータの存在により、その重要性が改めて認識されているメタデータについて取り上げようと思っています。
メタデータとは何ぞや?を出来るだけわかりやすくまとめていきます。
ITに直接かかわる方もそうでない方も知っていて損にならないと思いますので、是非ご覧ください。
※データマネジメント初学者の内容となっておりますので、予めご了承ください。

 メタデータとは?

DMBOK第2版によると、メタデータは"データに関するデータ"と記載されています。しかし、同様にこの言い回しは単純すぎて誤解を招きやすいとも。
もう少しわかりやすく言うとすると、メタデータとは"データを管理・利用するためのデータ"とも言い換えられます。とはいえ、メタデータとは曖昧かつ範囲が広い言葉であるためこの説明でもわかりくいかもしれません。そんな時は以下のようなイメージを持つとより一層わかりやすいかもしれません。 例えばこのような缶詰があったとします。

この缶をデータだとするとメタデータはこうなります。

 

つまり、缶のラベルがメタデータです。 ラベルがあることで「これはビールで、キリンから発売されていて、アルコール度数が〇%・・・」といったように、缶の情報を知ることができます。これがデータを説明するデータ(=メタデータ)です。
ラベル(メタデータ)がついていないまま、家に様々な種類の缶があることを想像してみてください。気軽に缶を口にしたりできないと思います。さらにお子さんが家にいる場合、誤ってビールを飲んだりしたら大変です。

メタデータを管理せずデータを使うということは、こういうことです。

また、特にビッグデータが浸透しつつある現在、今までの構造化データ(Excelやデータベースなど予め構造が決まったデータ)だけでなく、非構造化データ(テキストデータや位置情報データなどネイティブなまま使用されるデータ)も貴重な資産となる時代です。

非構造化データは説明の通り、ネイティブなまま使用されることが多いです。
そのため、データを説明するためのデータ、つまりメタデータがより重要となります。

今回はメタデータの概要について簡単にご説明しました。次回は、メタデータにはどのような性質があるのか?どのように作成、管理、維持していくべきか?等についてご紹介できればと思います。

というわけで、久しぶりとはなりましたが、今回は以上になります。
スマホの写真にも実はメタデータがついていたり、かなり身近に存在しますので、これを機にメタデータを調べてみてはいかがでしょうか?