White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

しゃけぞうさんの「データサイエンティストになりたい学生の為の就職先の選び方」への補足

データサイエンティストになりたい学生の為の就職先の選び方 shakezoの日記

http://d.hatena.ne.jp/shakezo/20130104/1357273241

「データサイエンティスト=データ分析者」という意味で捉えるなら、大筋合ってんじゃないかって思います。ただデータサイエンティストってそういう意味だけだっけ?というのが一つの疑問として出てきます。

先に結論だけ書いてしまうと、「浅草なとこから斧が飛んできそう」。というのが浮かび上がります。

--

http://www.slideshare.net/shoheihido/120913-pfi-dist

PFIの@slaさんとこから引用すると、データサイエンティストの仕事としては以下の様なものがあります。

スクリーンショット 2013-01-05 13.33.53

よく目立ちやすいのが、2の「仮説立案」,7の「データ集計(特にHadoop)」,8の「データマイニング機械学習」あたりですが, 4の「データ収集」, 5の「データクリーニング」,6の「データの可視化」とかも意外と重要だったりします。この辺って統計的な知識だけでなくOSとかシェルの知識とか知ってると便利なこともあります。

んでデータの処理を制御するフレームワークを作ってるとこもあるわけです。例として上にちょっと書いたasakusa framework、Fluentdなどがあります。

大規模データ処理に特化したフレームワークを作る場合、あれば便利ですが特に統計の知識が必須というわけではありません。むしろデータの一貫性の保ち方とかの方が重要になると思われます。

なので、shakezoさんの(4)にあるようなSIerで分析屋がいないとこでも、データ処理としてのお仕事に着くことは可能です。尤もほんとにただ騒いでるだけのとこも結構あると思いますが。。。特にBtoBのコンサル営業あたり。ビッグデータでできたこと、ビッグデータのツールについては触れてくるけど、具体的なデータ処理の仕方を知らない人ら。

余談ですが自分はデータ分析とか一切関係ない部署からデータ扱うとこに入ってるし(自分自身が機械学習Hadoopとかに興味があったのが大きいですが)、もし最初の就職で違うとこ行ってもキャリアパスとして挽回は可能です。Tokyo Web MiningとかTokyo.RとかPRMLとかHadoop Hackathon等勉強会もやってたりするんで参加してみるのもいいんじゃないでしょうか。

追記

ところでビッグデータ絡みだと最も強そうなのってgoogleですが、あそこだけはビッグデータうんぬんとかあまり触れないですね。彼らに取っては当たり前すぎるからでしょうか。