「ビックデータ」について

-目次-
1.ビックデータとは?
2.ビックデータの特徴(3V)

1.ビックデータとは?
 ビッグデータ(big data)とは「ある目的を持って集められたデータ」と考えることができます。 しかし、実際にはすでに多方面で多くのデータが蓄積されており、これらのデータから必要な情報を見つけ出すということが求められます。このため「ある目的を達成するために必要な情報が含まれるデータの集まり」がビッグデータと考えることができます。


2.ビックデータの特徴(3V)
 ビッグデータ(big data)の特徴は、データの「量(Volume)」「種類(Variety)」「発生頻度・更新頻度(Velocity)」の3つのVから成ります。つまり、日々、膨大に生成・蓄積されるさまざまな種類・形式のデータを指します。

 データの種類は、分類の仕方によって「定量データ/定性データ」「フローデータ/ストックデータ」などいくつかの方法で表現できますが、ビッグデータにおいては「構造化データ/非構造化データ(半構造化データ)」と区分します。

①構造化データ
 ExcelファイルやCSVファイル、固定長ファイルなどで表現できる「列と行」の概念を持つデータを構造化データとよびます。SCMやERP、CRMといった業務ソフトウェアのデータベースで利用される売上データ、顧客データなどが挙げられます。

②非構造化データ(半構造化データ)
 非構造化データとは、構造化データのように「列と行」では定義できないデータをいいます。具体的には、文書データや電子メール、デザインデータ、音声データや動画データ、電子書籍、Webページ(HTML)、SNS、GPSやセンサーから得られるデータなどが挙げられます。

タイトルとURLをコピーしました