White scenery @showyou, hatena

If you have any comments, you may also send twitter @showyou.

ビッグデータは目的ではなく手段ではないか

まず始めに、この考えは私個人のものなので、一般的な定義と違う可能性があります。おかしいとこあれば指摘ください。

さて、このビッグデータっていう単語、そろそろクライアント側とかも聞き飽きて来たんじゃないかと思うですが(そもそもビッグデータって単語、それ以前にビッグデータっぽいことやってたひとが嫌いな単語ですが)。

そもそもビッグデータって単語は定義が曖昧なんですが、個人的には以下のような感じだと考えています。

マシン一台とか数台のSQLサーバじゃ速度、容量的にやってられない。根本的に別の仕組み考える必要がある。そのためにHadoopみたいな並列分散技術をいれると。

当然Hadoop限定でも無いが、少なくとも今までの単純な構造ではない。

んでこれは何か解くべき課題があるときに対しての解き方ではあっても、これを使うことをゴールにしてはいけないと感じています。

ところで全然関係ないですが、データマイニングって言葉があります。データ+マイン(鉱山)+ingでデータマイニングです。データの鉱山掘りです。

「POSデータをBIツールで見える化しましたー」っていうのをビッグデータと題して紹介してるのありましたが、あれはデータマイニングって呼んだほうがしっくり来ませんかね?

以上、非常にどうでもいい話でした。

追記:車内広告で「ビッグデータ時代のExcel」とか見て「いやいやお前100万行以上使えないだろ」と突っ込みたくなりました。