日本のデータサイエンティストが(笑と呼ばれてる原因について
こんばんわ。showyouです。自称データマイニングエンジニアです。データサイエンティストかどうかは知りません。
なんかデータサイエンティストに対して懐疑的な話が浮かび上がってきたので、ここでまた再度主張します。
ちなみにこれはあくまで主観的な主張であり、間違ってる可能性も
データサイエンティストって何ですか?
・・正直知りません。恐らくデータの分析者+分析のための環境(全部じゃなくても、補助できるくらいの環境)を構築出来る人ぐらいのイメージですが。ただUSのdata scientistと日本のデータサイエンティストは違う気がします。
この辺は@slaさんのスライドを参考にした方がいいかもしれません。
http://www.slideshare.net/shoheihido/120913-pfi-dist
大元のデータサイエンティストの定義について
恐らくO'reillyの資料だと考えています。http://www.slideshare.net/shoheihido/120913-pfi-distもし他に起源があれば教えてください。
日本でデータサイエンティスト(笑と言われる原因について
これははっきりしてて、とあるIT向けメディアが、元の意味合いと少し違う形でビッグデータと共に濫用したせいです。割と特集組んでるとこです。きっと日本のお偉いさんに聞こえのよい用に加工したんでしょう。
データサイエンティスト養成のPR連発について
その会社は結構前から分析作業をやってるとこなんで、分析に関してはノウハウあると思いますが。しかしなんでこんなPR作業してるんですかねぇ。
大規模データ分析=個人情報流出=分析やめろという論調について
大規模の(に限らずデータを扱う際には)データを扱う際には、個人情報云々はつきまとってきますす。。恐らく分析やってる方々がデータの格納には気を使ってると思います。それ以外にも研究サイドでk-Anonymousなど一つの情報だけで個人を完全に特定できないようにする取り組みもされています。 なので、個人情報が流出するから分析用のデータ格納自体全体やめろ、という話は勘弁して欲しいと思います。というかもし指摘側が研究者とかなら、じゃあどうすべきか提案して欲しい気もします。 なおデータサイエンティスト協会の個人情報に関する資料は読んでません。