White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

日本のデータサイエンティストが(笑と呼ばれてる原因について

こんばんわ。showyouです。自称データマイニングエンジニアです。データサイエンティストかどうかは知りません。

 

なんかデータサイエンティストに対して懐疑的な話が浮かび上がってきたので、ここでまた再度主張します。

ちなみにこれはあくまで主観的な主張であり、間違ってる可能性も

データサイエンティストって何ですか?

・・正直知りません。恐らくデータの分析者+分析のための環境(全部じゃなくても、補助できるくらいの環境)を構築出来る人ぐらいのイメージですが。ただUSのdata scientistと日本のデータサイエンティストは違う気がします。

この辺は@slaさんのスライドを参考にした方がいいかもしれません。

http://www.slideshare.net/shoheihido/120913-pfi-dist

大元のデータサイエンティストの定義について

恐らくO'reillyの資料だと考えています。http://www.slideshare.net/shoheihido/120913-pfi-distもし他に起源があれば教えてください。

日本でデータサイエンティスト(笑と言われる原因について

これははっきりしてて、とあるIT向けメディアが、元の意味合いと少し違う形でビッグデータと共に濫用したせいです。割と特集組んでるとこです。きっと日本のお偉いさんに聞こえのよい用に加工したんでしょう。

データサイエンティスト養成のPR連発について

その会社は結構前から分析作業をやってるとこなんで、分析に関してはノウハウあると思いますが。しかしなんでこんなPR作業してるんですかねぇ。

大規模データ分析=個人情報流出=分析やめろという論調について

大規模の(に限らずデータを扱う際には)データを扱う際には、個人情報云々はつきまとってきますす。。恐らく分析やってる方々がデータの格納には気を使ってると思います。それ以外にも研究サイドでk-Anonymousなど一つの情報だけで個人を完全に特定できないようにする取り組みもされています。 なので、個人情報が流出するから分析用のデータ格納自体全体やめろ、という話は勘弁して欲しいと思います。というかもし指摘側が研究者とかなら、じゃあどうすべきか提案して欲しい気もします。 なおデータサイエンティスト協会の個人情報に関する資料は読んでません。

#TokyoWebmining #35 O'reillyの2013年の年収調査について発表しました

英語だと読めないorお前の英語が間違ってて理解できないって場合は連絡ください。
日本語でスライド作ります。
 
4/26 追記:
Tokyo Webminingのメンバーに対して、Tool使用率を採ってみました。
ただしExcelならツールをデータ集計に使ってるか、Hadoopならコマンドを叩いてるだけかメンテしてるかなどの区別をしていないので注意してください。
 

f:id:showyou:20140426161305p:plain

member: Japanese, Tokyo, almost people are analyst, enginner, or researcher. Maybe there is a few people belonging Hadoop developer.

用途はっきりしてないのでExcelは全員使ってるって結果になります。軽い計算でも使いそうですが・・

R, pythonは(予想外に)高いですが、Hadoopが低く、SAS/SPSS, JavaScriptが多い感じです。Hadoop使い手はHadoopハッカソンとかに多く、Webminingへの参加率が低いのだと考えてます。

 

追記2:

スライド後半の、年収レンジと平均の出し方の質問を受けましたので書いときます。

  1. http://www.indeed.com/ (US), http://jp.indeed.com/ (JP)にアクセス
  2. what (US), キーワード(JP) に、HadoopとかHiveとか入力する
  3. where(US), 勤務地(JP)に、働く場所を入れる。USなら"San Francisco Bay Area, CA", JPなら"東京"
  4. すると以下の様な画面が出るので、画面左下赤枠部分を見る。すると年収レンジと件数が出る。

    f:id:showyou:20140426221238j:plain

  5. 今回は(年収レンジxそのレンジの件数)/全件数で期待値を出しています。

     

  6. 余談ですがHadoop, 大阪とか入れるとほとんど出ません。。
 

Wordpressからまた戻ってきました

一旦はてなDiaryから自宅サーバWordpressに移ってたんですが、いくつかの事情によりはてなblogに戻ってきました。

 

理由としては2つあって、

  1. dyndnsの無料提供が終了するため、別のddnsを借りないといけない
  2. 独自ドメインは流入が少なかった

ってあたりです。

移行作業はhttp://www.eitaro-weblog.com/entry/2013/12/25/105610を参考にしました。

今後もうちの日記をよろしくお願いします。

横浜元町を歩いてみた(Clover day's 聖地巡礼)

Walking Motomachi,Yokohama because there is the area of Clover Day's and Clover Heart's setting.

If you have any questions, please let me know.(@)

 

Clover Day's(及び前作のClover Heart's)が思いっきり横浜っぽい感じなので、ちょっと横浜の元町エリアを歩いてみました。

 

その前にまずみなとみらい駅からスタート。

 

Queen's Square

みなとみらい駅出てすぐ。というか駅直結。パシフィコ行く時に大体中を通ります。

 

コスモワールド

Queen's Squareの写真の裏にある遊園地。これは探して見つけたっていうよりプレイ前から通ったことがありました。この観覧車、元々は横浜博の時のだよね(おっさん発言)

 

ここから近くの赤い靴バス(100円)に乗って港の見える丘公園へいきました。

海の見える丘公園

バス停降りて公園まっすぐ向かえば目の前にありました。日中なんで人が多いけど、撮るポイントとしては画面右まん中の本牧JCTの看板が入るとよさ気です。ってか帰ってから見なおしたら遠くのビルの形まで一緒だなぁ。

 

バスロータリー

上のポイントからちょっと南、イギリス館の裏にある噴水。バスがここで転回するので撮影の時はバスが来ないか注意です。ポイントは赤い建物がちょっと遠目なのと、左から建物、噴水、木といった順番に並ぶことあたり。あと実際の噴水は楕円っぽい感じけど、ゲーム中のはそうでもない感じに見えます。

 

 

そして公園の出口からイタリア山の方へ向かう道へ。ちょっと(1km程度)歩きます。

途中にベーリックホールがある。今の時期は17:00までの開館なので注意して下さい。

ベーリックホール、台所

・・そもそもなんでこの建物に冷蔵庫があるのか謎だけど(市あたりが管理してる建物)、ちゃんと台所に冷蔵庫が置かれてました。中に期限切れのオレンジジュースが入ってました。あとガスコンロもあります。

 

娘さんの寝室

・・よく考えたらゲーム中この部屋におもちゃ箱があることに違和感持ったほうが良かったのかもしれないです。

 

来客用寝室の洗面所

これもワイングラスがなんであるのか気にしたほうがよかったですかね?

 

奥様の寝室

ベットはひとつしかないです。撮るポイントはオイルヒーター2つかな?

 

そしてベーリックホールを出てまたイタリア山の方へ。

途中の道の風景。

通学路

結構似た感じのものが多いのでわかりづらいと思います。ポイントは車庫と電灯と右カーブってとこです?手前が港の見える丘公園、奥がイタリア山方面。

 

そこから少し行くと、イタリア山右って看板が出るのでイタリア山に向かいます。

外交官の家外交官の家を外から。今日は休館日だったので入れず残念(続編で入っています)。

 

ブラフ18番館のベンチ

これ実際行ってみればわかりますが、左の木の背後にベイブリッジが見えます。なのでベイブリッジを左の木で隠して、ベンチと右の木が入るようにするといいです。

 

ベンチを撮ったらブラフ18番館の裏から坂を降りて行くと、石川町駅、石川町郵便局があります。

 

石川町郵便局前

ちょうど右を(京浜東北)根岸線石川町駅があります。後ろにマンションがあったっぽいけど解体されたようです。

 

降りたら元町・中華街駅方面へ。

途中に元町商店街があります。

元町商店街

目印は薬屋さん。次にベンチ2つ。そしてSELECTED BYの看板。奥が石川町駅方面。

 

 

・・で、歩いてみて思いましたが、これ聖地巡礼だけでなく普通に散歩とかデートコースとしてもいいと思います。自分横浜の保土ヶ谷や踊場に住んでましたが、元町や山手の方は来たことがなかったので勿体なかったです。渋谷からも東横線乗れば一本で着くのでたまに来るのもよさげですね。

 

 

最後に横浜駅西口です。

横浜駅西口

JR/東急/京急横浜駅西口を地上に出て、地下街の入り口手前を左に曲がってロータリーに沿って歩くとあります。ポイントはヨドバシカメラ

 

 

横浜駅自体はよく来てますが、実は自分は3.11の地震の時にもここに来ていました。その時の写真が見つかったのでのっけておきます。

2011-03-11 15.34.25

ほぼ同じ地点で、駅に向かって撮影した様子。当時は鉄道がすべて止まり駅にも入れなくなり、駅前が人でぎゅうぎゅうになっていました。しかたないので緊急避難場所の公園まで歩き、そこから家まで近かったので家まで歩いて帰りました。

続き

Clover Day's 感想(ネタバレ無し)

0. 未プレイの方へ

まずは以下から体験版を入手してプレイしてください。

http://www.alcot.biz/product/cld/page_sp/sp_tri.html

プレイして面白いと思ったら買いでしょう。

尤もAmazonとか入荷1ヶ月待ちorプレミアとかなってますが。

前作はざっと少し知っとくとお得なシーンがありますが、知らなくても全く問題ないでしょう。せいぜい共通点は舞台とあすりん、西園寺先生、双子というテーマ、それともう一つ位です(これは伏せられてるのでここでは書きません)。

1. きっかけ

きっかけは、

ニセコイが連載物で原作引き伸ばし感がある

・一方で凪のあすからは26話で終わったけど、もうちょっと続いて欲しかった

とかいちゃラブなゲームが無いかと聞いたところ、これを紹介された感じです。

プレイした結果、とてもよかった作品でした。久々に終わらせるのがもったいないゲームと感じました。

以下ネタバレありの感想なので別ページヘ移します。こちらhttps://gist.github.com/showyou/11180788

横須賀までカレーを食べに行ってきた

ちょっとふらっと食べに行こうと思ったら、とんでもないお祭り騒ぎでした。。

まず知ったのが数日前からTwitterで話題になっていたところ。まあ自分の観測範囲だと艦これの提督も多いし、いくら話題とはいえゆっくり行って食べれるだろうと思ってました。

当日朝。普段は8時とかに起きるのですが、珍しく7時前に起きたので開場前につきそうでしたが出発しました。

横須賀のカレーフェスタの会場は横須賀基地で、京急ではなくJR横須賀駅の近くになります。なので横浜まで東急で行き、横須賀線に乗りました。元々横須賀の市街地に行くには京急を使う人が多く、横須賀線は鎌倉や逗子から先がガラガラになると思われるのですが、この日は逗子を過ぎても立っているぐらいでした。そして横須賀駅到着直前に護衛艦が見えたときには乗客が全員歓声を上げてました。やばい。これは混む。

1397869585016

そして横須賀駅に9時ちょい前についたのですが、既に行列が京急汐入駅前を過ぎて横須賀中央駅の近くまで続いていました。最後尾についたのが9時半くらい。最後尾の看板を自衛隊の兄ちゃんが持ってたのですが、その人も捌ききれなくてあたふたしてました。でも訓練された日本人は何も言わずに綺麗に2列に行列を作っていきました。

折り返して汐入駅まで戻って来た時には、基地の人が来て、現在4000番目くらいであること、8000食用意してるが1人2食までいけるので食えない可能性があると言われました(当然その後1人1食なってましたが)。この時10:30。

10247194_623464854402660_7458796210105682266_n

そして手荷物検査を受けたのが11:30。ここまで来ればカレーは直ぐか、と思ったら中でもかなり並んでました。この時警察が動いて、一定の人数以降はカレーどころか基地内にすら入れないようになってたようですね。カレー列にならんで少ししたら「カレーは今並んでる人で終わり」と言われましたが、外の行列はまだまだ続いていました。

結局カレー売り場までついたのが14時半。この時既にいくつかのカレーは売り切れてました。こんごうカレー食べたかったなぁ。でもあたご、あしがら、むらさめ、はたかぜとGetできました。

IMG_20140419_150622

たかだかカレーになんで6時間も・・って感じでしたが、並ぶの自体もお祭りだったんで楽しめました。外寒かったけど。

オチとしてこの後実は今日同窓会とか言われて横須賀から直接前住んでた場所まで直行しました・・

ClouderaがWeb上でHue/Impala/Solrを操作できるDemo環境を公開

以前から「Hueのライブデモ公開しろやゴルァ」とかClouderaの中の人にいちゃもんつけてたのですが、やっと公開されたのでこちらでも紹介します。

http://www.cloudera.com/content/cloudera/en/products-and-services/cloudera-live.html

使うのにまずユーザ登録(無料)なのが残念(とはいえ荒らし対策としてはしかたないか?)ですが、登録さえすればHueでImpalaが試せるので試したことない人は触ってみるといいでしょう。