⇒【東証プライム企業も多数利用!】最先端のSNSマーケティングツール「Tofu Analytics」、「InstantWin」とは?
近年においてよく囁かれるようになった「ビッグデータ」という用語。
「なんとなくIT用語ということは分かるけど・・・」とビッグデータの意味を具体的に説明できる方は多くないのではないでしょうか。
本記事では、ビッグデータという用語について分かりやすくご説明するとともに、ビッグデータ活用のメリットや活用事例も併せてご紹介していきます。
1.ビッグデータとは
まずは、ビッグデータの基礎知識を押さえておきましょう。ビッグデータの定義と意味、歴史についてご紹介します。
1-1.ビッグデータの定義と意味
ビッグデータ(big data)と聞くと、なんとなく「膨大なデータ」というイメージが沸くのではないでしょうか。たしかに、それもビッグデータの意味に含まれますが、それだけではありません。ビッグデータは、データの「量(Volume)」「種類(Variety)」「発生頻度・更新頻度(Velocity)」の3つのVから成ります。つまり、日々、膨大に生成・蓄積されるさまざまな種類・形式のデータを指します。
「平成29年版 情報通信白書」によれば、
”デジタル化の更なる進展やネットワークの高度化、またスマートフォンやセンサー等IoT関連機器の小型化・低コスト化によるIoTの進展により、スマートフォン等を通じた位置情報や行動履歴、インターネットやテレビでの視聴・消費行動等に関する情報、また小型化したセンサー等から得られる膨大なデータ、すなわちビッグデータを効率的に収集・共有できる環境が実現されつつある。”
とあり、先述の定義と同範囲を指していることがわかります。
また、ビッグデータには、多量性、多種性、リアルタイム性という特徴があるといいます。
(出典:「平成25年版 情報通信白書」「平成29年版 情報通信白書」総務省)
データの種類は、分類の仕方によって「定量データ/定性データ」「フローデータ/ストックデータ」などいくつかの方法で表現できますが、ビッグデータにおいては「構造化データ/非構造化データ(半構造化データ)」と区分します。
■構造化データ
ExcelファイルやCSVファイル、固定長ファイルなどで表現できる「列」と「行」の概念を持つデータを構造化データとよびます。
SCMやERP、CRMといった業務ソフトウェアのデータベースで利用される売上データ、顧客データなどが挙げられます。
■非構造化データ(半構造化データ)
非構造化データとは、構造化データのように「列」と「行」では定義できないデータをいいます。
具体的には、文書データや電子メール、デザインデータ、音声データや動画データ、電子書籍、Webページ(HTML)、SNS、GPSやセンサーから得られるデータなどが挙げられます。
ITの進歩に伴い、企業が扱う非構造化データは増加し、構造化データに対する比率も上がっています。
日本で「ビッグデータ」という言葉が広がり始めたのは2010年頃からですが、ビッグデータという概念が生まれる以前から、ビジネスや自然現象において測定した数値をデータとして活用されてきました。これを効率化してくれたのが、コンピュータです。
計算機を起源に持ち、おも主に演算処理に使われていたコンピュータが扱っていたデータベースは構造化データのみでしたが、パソコンの登場やプログラムの進化により数値以外にも文書、画像、音声、動画といった非構造化データを扱うようになりました。
ただし、最初から「構造化データ/非構造化データ」という言葉があったわけではなく、まずリレーショナルデータベース(RDB)ができ、後からRDBのテーブルに合うものを構造化データ、それ以外を非構造化データと呼ぶようになったという経緯があります。
この非構造化データはRDBでは扱うことができません。RDBの後、データベースは時代の要求に応えながら変遷していき、現在はGoogleやAmazonで実装されているNoSQLを採用する企業が増えています。
NoSQLはNot only SQLの略で、RDB系統以外のデータベース管理システムの総称で、キーバリュー型、ワイドカラムストア型、ドキュメント型、グラフ型の大きく四つに分類でき、非構造化データを扱えるデータベースです。NoSQLという言葉は1998年に現れ、2009年に開催されたオープンソースの分散データベースについての会合で脚光を浴びました。
2010年には日本で「ビッグデータ」という言葉が普及しはじめ、2011年がビッグデータ元年ともいわれています。
インメモリデータベースの登場によりデータベースの処理速度が高速化したこともビッグデータ普及を後押ししました。
ビッグデータを活用するには、データの生成・収集・蓄積・分析が必要です。上記のデータベースの変遷は、そのうちの「蓄積」部分に当たります。
ここへ、「生成・収集」を担うICTの進歩やハードウェアの低価格化、「分析」のための膨大なデータ処理を担うクラウドの普及といった条件が重なり、ビッグデータ活用が進んだといえます。
1-2.ビッグデータの歴史
日本で「ビッグデータ」という言葉が広がり始めたのは2010年頃からですが、ビッグデータという概念が生まれる以前から、ビジネスや自然現象において測定した数値をデータとして活用されてきました。これを効率化してくれたのが、コンピュータです。
計算機を起源に持ち、主に演算処理に使われていたコンピュータが扱っていたデータベースは構造化データのみでしたが、パソコンの登場やプログラムの進化により数値以外にも文書、画像、音声、動画といった非構造化データを扱うようになりました。
ただし、最初から「構造化データ/非構造化データ」という言葉があったわけではなく、まずリレーショナルデータベース(RDB)ができ、後からRDBのテーブルに合うものを構造化データ、それ以外を非構造化データと呼ぶようになったという経緯があります。
この非構造化データはRDBでは扱うことができません。RDBの後、データベースは時代の要求に応えながら変遷していき、現在はGoogleやAmazonで実装されているNoSQLを採用する企業が増えています。
NoSQLはNot only SQLの略で、RDB系統以外のデータベース管理システムの総称で、キーバリュー型、ワイドカラムストア型、ドキュメント型、グラフ型の大きく四つに分類でき、非構造化データを扱えるデータベースです。NoSQLという言葉は1998年に現れ、2009年に開催されたオープンソースの分散データベースについての会合で脚光を浴びました。
2010年には日本で「ビッグデータ」という言葉が普及しはじめ、2011年がビッグデータ元年ともいわれています。
インメモリデータベースの登場によりデータベースの処理速度が高速化したこともビッグデータ普及を後押ししました。
ビッグデータを活用するには、データの生成・収集・蓄積・分析が必要です。上記のデータベースの変遷は、そのうちの「蓄積」部分に当たります。
ここへ、「生成・収集」を担うICTの進歩やハードウェアの低価格化、「分析」のための膨大なデータ処理を担うクラウドの普及といった条件が重なり、ビッグデータ活用が進んだといえます。
2.ビッグデータで解決できる課題
ビッグデータを活用することで、どのような課題を解決できるようになるでしょうか?少し抽象的な表現になりますが、「欲しい情報を利用しやすい形で取り出せない」「未知のことについて高精度な予測ができない」「余剰や不足が発生してしまう」の大きく三つに集約できます。以下で、具体的例とともにご説明します。
2-1.必要な情報を利用しやすい形で取り出したい
ビジネスなどにおいて意思決定が求められる場面は多々出てきます。その際に、判断材料となる情報があれば、より的確な決定を下せるようになるでしょう。
膨大なデータを生成・収集・蓄積し、そのなかから判断に必要十分なデータを、理解しやすく利用しやすいかたちでアウトプット(可視化)してくれれば、経験やノウハウのない人材でも一定レベル以上の結果を出すことが可能になります。
また、表面上のデータだけでなく深層を可視化するデータマイニングを活用することで、未知の状況、これまで見たことのない角度からもデータを捉えることができ、新規ビジネスの企画などにつなげることもできます。
例)
- 患者のデータから病気の原因究明や副作用の少ない薬の開発
- 畑の土壌にセンサーやカメラを設置し、農作物の生産性・品質の向上に活用
- 商品棚での消費者の視線の動きを分析し、よく見られる位置に主力商品を配置
- 修理依頼内容と過去の修理履歴と機器の型番データを照合し、修理に必要な部品を自動で判別
- 店舗の売上データと従業員の行動データ、商品の陳列データから顧客単価の高いエリアに従業員を重点配置
2-2.未知のことについて高精度な予測を行いたい
明日の天気や需要予測など、未来のことを予測できれば、好ましくないできごとを回避したり、予想を上回る成果を上げたりと、より良い結果を求めてあらかじめ備えることができます。これがうまくいけば、ビジネスにおいては競合に対する優位性が得られ、公共分野では安全な社会や健康な暮らしなどが実現できるでしょう。
例)
- 検索エンジンでの検索候補語の自動表示
- 過去の購買データから消費者の好みを予測してプロモーション
- 店舗に備え付けたカメラから来店者の過去の購買履歴を紐づけ、接客に活用。
- 機器や設備にセンサーを取り付けて稼働状況データを収集し、事故や故障を未然に防ぐ
- 橋梁にセンサーを取り付けて振動やひずみを計測し、劣化を早期に検知する
- アクセルの踏み間違い事故のデータと照合して異常なアクセル操作を検知し事故を防ぐ
- 過去の犯罪データから、その日その時に危険な場所をマップ表示
3.ビッグデータ活用のメリット
ビッグデータを活用することで、
- 新規ビジネスを開拓できる
- リアルタイムで精度の高い分析ができる
- 実行した後の検証が簡単にできる
といった特筆すべき3つのメリットが挙げられます。
以下でそれぞれご紹介していきます。
3-1.新規ビジネスを開拓できる
ビッグデータに含まれている様々なデータを活用することで、既存の問題に対する思いもよらない解決策を得ることが可能です。ビッグデータに含まれるデータ同士の関係性から新たなビジネスのヒントになることがあります。
3-2.リアルタイムで精度の高い分析ができる
ビッグデータは従来のデータと比較しても、オンラインで様々な箇所から様々なデータを収集し、瞬時にデータの更新・分析をすることが可能です。
例えば、「一般消費者が求めている商品」や「売れ筋商品」などのデータを従来のデータよりも格段に早く、また精密に分析することができるので、より正確な情報をベースに課題解決に生かせることができます。
3-3.実行した後の検証が簡単にできる
ビッグデータを活用し、新たなビジネスやサービスを実行した後にはその「効果」を簡単に検証することが可能です。
ビッグデータの中には既にデータの把握方法や検証方法が含まれています。
そのため効果検証をするためのデータ分析ですら、ビッグデータを活用することで簡単に行うことができるのです。
4.ビッグデータの活用事例
デジタル社会において、様々なシーンで活用されているビッグデータ。
ここでは、私たちの日常においてビッグデータが活用されている有名な事例をご紹介していきます。
4-1.SuicaやPASMOなどの電子交通カード
SuicaやPASMOなど、私たちが駅の改札を通過する際に使用する電子交通カードにもビッグデータが活用されています。
電子交通カードには、電車に乗る利用者の支払いに使われるだけでなく、タッチした際の利用者の情報が鉄道会社にデータとして送られる仕組みになっています。
また電子交通カードでショッピングをした際には、「どのような人物が」「何を購入したのか」などのデータが送信され、ビッグデータとして蓄積していくのです。
4-2.防犯カメラ
かつては防犯を抑止するためだけに活用されていた防犯カメラは、いまでは膨大なビッグデータを収集するための手段としても活用されています。
店舗内の防犯カメラには、「カゴに大量入れた商品」「一旦カゴに入れたけど棚に戻して買わなかった商品」など客の購買行動に関するデータを保存し、ビッグデータとして蓄積されていくものも存在します。
4-3.Nシステム
Nシステムとは、警察が監視目的で設置している「自動車ナンバー自動読取装置」のことです。
Nシステムによって、高速などを走行中の車のナンバーを瞬時に読み取ることができ、操作中の車両との照合を行うことができます。
ビッグデータ活用によって、犯罪リスクの低下に役立てることもできるのです。
5.まとめ
ビッグデータについて、そのメリットや活用事例を併せてご紹介してきましたがいかがだったでしょうか。
私たちの日々の生活において膨大に生成・蓄積されていく様々な形式・種類のデータとして、重要な役割を果たすビッグデータはデジタル社会において不可欠な存在です。
本記事を読んで、少しでもビッグデータについて具体的なイメージを抱くことができるようになっていただいたら幸いです。
⇒【東証プライム企業も多数利用!】最先端のSNSマーケティングツール「Tofu Analytics」、「InstantWin」とは?