IT系のニュースを見てるとかなりの頻度で出てくる「ビッグデータ」。もちろん大量のデータを指していることは疑いようがないのですが、ビッグデータという言葉が使われる前から大量のデータを処理することは行われていたわけですし、ここ最近になってこの言葉が使われる意図は何かあると感じてました。と、考えていたらちょうどよく下記記事を見つけたので紹介します。
http://www.hitachi.co.jp/products/it/bigdata/column/column01.html
従来はきちんと正規化されたテーブルに対し、バッチ処理で集計を行うのがセオリーでした。最近だとテーブルの型にはめにくい元データも増えており、かつリアルタイムでの集計も求められる感があるので従来のシステムでは対応できない部分が出て来ていたりします。
こういった多種多量のデータが大体ビッグデータが指すものかなと考えていますが、記事にもある通りRDBMSとNoSQLの使いわけが中々判断しにくい部分だと思います。両者の特性を十分考慮したデータベース設計が、今後求められてくるのではと感じます。