早嶋です。
1億人以上のアクティブユーザーを持つツイッター。1日あたり2億5千万ものつぶやきが発生しています。2011年10月時点。1回のつぶやきは200バイトと少量ですが、平均的な1日のトラフィックを見ると48ギガ、ツイッター全体のシステムでも1日に8テラバイトものデータが発生しているといいます。
2012年2月にIPOしたフェイスブック。当時のアクティブユーザーが8億4500万人。デイリーアクティブユーザーはその半数。そして、フェイスブックによりユーザー自信が毎日コンテンツを生み出すようになりました。ユーザー全ての時間を足しあわせれば、1ヶ月に7000億時間をフェイスブックで過ごしていることになります。平均的なユーザーで1ヶ月に90個近くの情報をアップしています。全体で毎月300億ものコンテンツです。
例えば、上記のデータから自社が運営している商品や企業の地理的に近いデータを特定して、サービスの改善や次のニーズに繋がる情報を見つけて商品開発に活用する。或いは顧客サービスに活用する。例えば、上記のようなデータと日々の経済活動をひとつひとつ分析して株価や為替の動きを予測する。例えば・・・。
これまで扱うことのなかった量のデータをサンプル解析ではなく全数解析によって何らかの傾向値や分析を行う。この背景にビックデータの存在があります。これまでも企業のデータを大量に集積して分析しビジネスにつなげる活動がありました。ビックデータは、おそらくその扱う量が半端無く増大したこと。そして、ここのデータの管理の仕方や分析の仕方はまったく異なることがあります。その結果、大量多様なデータを処理する新しい技術や担い手が注目されるようになったこと。があります。
ビックデータ。定義はあいまいですが、兎に角量が膨大。データが多様。そしてスピードという特徴があります。現在では数テラバイトから数ペタバイトが管理できる情報量だと思いますが、この量をドンドン超えていきます。数年もすると数エクサバイト単位のデータが扱われていることでしょう。
これまでの企業内にあった管理データ、販促データ、顧客データ、財務データ。これらに加えウェブのログ、アクセス記録、コールセンターへの問い合わせ情報、実際の商品の稼働情報、ツイッターやフェイスブックなどのSNS情報、携帯やスマフォなどの情報。とあらゆるデータが企業に集められ分析解析の対象になっています。分析する対象は数年前と比較して桁違いに増えています。
そしてスピード。1秒の間に数万の取引が可能になっている株の世界があるように、データ解析や処理速度がめまぐるしく増加しています。これらのデータもリアルタイムで収集処理され、これまで考えることが出来なかったことがドンドン可能になってきています。
ビッグデータ。つまり、既存の枠組みでは、一般的な技術では管理するのが困難だった大量のデータ群、と解釈できるでしょうか。これが注目している背景は?1つは、といいながらも、このようなことを実現するための技術が個人事業主でも可能になる日が近づいていること。そして、日常的に使用している商品が全て何らかのデータを発信している。つまりデータを作っているということ。があるでしょう。更に、全ての情報が個別デバイスから雲の上、つまり無意識の内にクラウドの中に蓄積される仕組みができていることもあります。
これに伴い、過去の動きを整理することから、将来を正確に予測する動きに進むことは、何も不思議な方向性ではないということです。