White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

なぜバスや電車の中で携帯を禁止するのに無線LANのアンテナを設置するのか

まずは3.11ということで、黙祷をします。

それはともかくとして、バスや電車の優先席付近では、ペースメーカに影響をおよぼす為電源を切れっていう話があるのはみなさん知ってると思います。一方で現行の3G通信やLTEは影響を及ぼさないって話があるのも一部の人は知ってるかもしれません(http://www.soumu.go.jp/menu_news/s-news/02kiban16_03000187.html)。しかもバスや電車によっては無線LANのアクセスポイントを積んでるのもあります。影響及ぼさないと言われてる電波を切れと言ってて、なおかつ別の電波を発信してるのはどうしてなのでしょうか。

 

答え:ISO14117及びそれを元にしたANSI/AAMI PC69:2007等が「電波発射源から15cm」で検証を行ってるから・・らしいです。無線LANは発射源が15cm以上離れたとこにあるからいい、ってことなのかな?でも無線LANも携帯から電波返すよなぁ・・

http://www.soumu.go.jp/menu_news/s-news/02kiban16_03000187.html

http://www.soumu.go.jp/main_content/000176240.pdf

 

 

Nexus5 にMNPした

nexus5 vs galaxy4

左がGalaxy S4, 右が今回契約したNexus 5。

Nexus5はE-mobile回線で、DocomoからのMNPイーモバイル原宿店で一括0円+商品券15000円付き。ただし二ヶ月は誰とでも定額(1480円x2)が必須。

ちょっとGalaxyS4ででかく感じていたのでNexus5くらいで大きさはいいですね。あと全体的に(何も入ってないからか)Nexus5の方が軽め。

 

ぜんぜん関係ないけどPS VitaMac Book Air落として液晶映らなくなった・・出費が・・

 

Mt.Goxの閉鎖とbitcoin採掘について

えっと、実は最近はもっぱらIngressばかりやってて、bitcoin関係放置気味だったのですが・・結構ひどいとこまでなってますね。まあ割と想定の範囲ですが。

ビットコインのMt.Goxがアクセス不能──大手6社が共同声明 http://www.itmedia.co.jp/news/articles/1402/25/news139.html

http://nomad-ken.com/2812

http://nyatla.hatenadiary.jp/entry/20140225/1393311501

最近あったことまとめ(自分の知る範囲で)

  1. 2月初頭に複数の換金所(bitcoinとUSドル、日本円に換金するとこ)が攻撃を受ける
  2. Mt.Gox以外は復旧したが、Mt.Goxはダウンしっぱなし→死亡

出来事としてはこれくらいなんでbitcoinどうこうっていうかMt.Goxが終わったっていうだけの話なのですが、いくつか影響もあります。

  1. Mt.Goxは他よりも少し高めの価格をつけていたためか、余波を食らって他の取引所もbitcoinの価格が落ちた
  2. 現状日本の銀行に直接振り込めるのがMt.Goxくらいだった(ANXBTCもあるっぽいけど)ので、掘ったcoinを日本円にして振り込むのが面倒

で、結論として日本だと今のとこ掘って換金しても赤字になるとなります。

この辺(http://www.coinwarz.com/miningprofitability/litecoin)で収支測って貰えればわかるのですが、一ヶ月前は同じ条件で3$はいって2$プラスで残る、って感じだったのが今は1.5$入って0.5$プラスで残るって感じになっています。

もちろん電気代気にしなくていい環境なら掘り続けるのアリですが、気にする環境だと当分は将来に期待の賭けになります。

ちなみに自分はMt.Goxへは一回Bitcoinから日本円へ換金してそれを銀行振込した程度なので、Bitcoinの被害は0ですが、認証に使った証明書とかが他に使われないかだけ気になりますねー。

データ分析の記事を読むときに気をつけること

きのこの山」VS.「たけのこの里」戦争に決着!? 購買データ分析で“大差”あり http://www.itmedia.co.jp/news/articles/1402/04/news016.html

まずはじめに、自分のことを書いときます。自分は分析向けインフラやってますが分析自体特化してないので若干専門からずれた話になるかもしれません。あときのこ派です。

それは置いといて、上の記事を自分が読んだ時は、次のとこを見に行きました。

  • 分析対象のソース:RecoRecoのレシート
  • 期間
  • 対象レシート数:1万強

以上の範囲の中で出た結果が上の記事の内容なので、「RecoReco使ってるユーザにたまたまたけのこ派が多いんじゃないの?」というツッコミは当然出てきます。実際の売上は明治に直接問い合わせるのがいいんじゃないでしょうか。もちろん今回の記事では「RecoReco調べ」と書いてるので分析の発表自体がインチキってわけではないと思います。

それよりちょっと気になったのは、地域や年齢層でのユーザ分布がないんですよね。地域に関してはどこもあんまり差がないのでそんな問題にならないんですが、年齢層の方は以下の邪推もできます。

「30代では1:2でたけのこ有利、40代では1:1で拮抗となっているが、実はユーザの実数は以下のとおりであった。

30代 500人:1500人, 40代 500人:500人」

・・こう見ると、分布としては拮抗してるけども、40代でたけのこ買ってる人は30代より大幅に少ないってなりませんかね?

これは極端な例ですが、実は次の「大人の~」のグラフを見ると、(それまでの分析が通常のきのこたけのこだと仮定した場合)、20代までと30代以降で人数比が同数であることがわかります。なので今回の調査は実は20代までの志向が影響されやすいことがわかります。

---

ところで本件とは真逆っぽいことが、近々東京で行われます。都知事選挙です。東京の場合は世代ごとの人口構造がそれほど偏ってないようなので(http://www.toukei.metro.tokyo.jp/juukiy/2012/jy12qf0001.pdf)各世代の傾向が均一して反映されそうです。でも高齢化が進んでるとこだと20代の投票志向が選挙に与える影響が60代~の投票志向に比べて誤差にしかならないです。

眠いので中断。

 

 

 

TokibitoさんのHadoop資料の補足

Hadoopとその周辺の紹介 - BPStudy http://t.co/ywmVJOmDth

上の資料、公開頂きありがとうございます。

個人的にここは違うのではないかというのが幾つかあったので書きます。自分が書くとこも怪しいかもしれないので後ろからshiumachiせんせーとかが援護することを期待します。

> P2: Hadoopとは

分散処理基盤 というより、 大規模並列処理基盤といった方が正しいかもしれません。あと大事なのは、Hadoopプロジェクト自体がGoogleMapReduceプロジェクトの模倣品といったところです。HDFSもGFSという分散ファイルシステムの模倣品だったはず。

> P3: HDFSとは

> NameNode DataNode

Hadoop 1.0(CDH3)までは大体正しいです(Secondary NameNodeが欠けてますが)。Hadoop 2.0系だとJournalNodeが追加されてます。JournalNodeは詳しくないのでパス。

あと(1.0系から既に)でかい特徴として、1つのファイルを複数個所で持つレプリケーションという機能があります。これにより1台サーバorストレージが落ちても他でカバーできます。

> P6: MapReduceとは

> JobTracker, TaskTracker

Hadoop 1.0では合ってます。Hadoop 2のYARNというMapReduceの新しい版では名前が変わってます。尤もYARNは最早分散スケジューラでしかない感じもしますが(後述)。

>P8: Map処理とReduce処理のイメージ

この図だとReducerが1台しかないように見えますが、実際はMap処理のあとにshuffleという処理が入って複数台のReducerで処理されます。場合によっては一箇所に固まることもあります。

> P9: Apache Hive

余談ですがPigってのもあります。SQLじゃないクエリ言語ですが。

> P12: Hiveは遅い

”遅い”自体はそうです。遅さの原因に"Java VM(JVM)の起動に時間がかかる"というのを加えてください。ImpalaはJVMを使わずにllvm+c++(とシェルはpythonだっけ?)で書かれています。

> P13: Cloudera Impala

> MapReduce処理の最適化

結果としてはそう見えるんですが、実体としては最早MapReduce使われてないです。独自でcoordinaterとか用意して速度をあげています。詳細:http://linux.wwing.net/WordPress/?p=1011

ここまで散々Hadoop1.0ではとかYARNとか書いてますが、実はHadoop2.0では分散処理エンジンを選択できて、従来のMapReduceの様なスケジューラ以外にもApache HamaとかJiraphとかいう別のスケジューラも使うことができるからです。上のImpalaもその一環ですね。その為Hadoop1.0系ではImpalaは使えません(というかImpala自体ApacheじゃなくてClouderaなのでCDH4以降じゃないと使えないんじゃないかというのもあるんだけど)。

> P15: Apache HBase

KVSと言えばKVSなんですが、詳しく言うと列指向のKVS(Cassandraとか)がHadoop上で動くって感じです。これもGoogleBigTableを模倣しています。結構早くてFacebookなんかでよく使われてる感じなんですが、管理が難しいようです。

> P15: Cloudera Hue

このツールはDjangoで作られてるため、Pythonistaなら最もいじりがいのあるとこでしょう。https://github.com/cloudera/hue

あとCloudera Search(全文検索)なんかも挙げておくといいのかもしれません。もともとこれApache Solr/LuceneHadoopに対応させたやつなんですが、そもそもSolr/Luceneの作者=Hadoopの作者の一人なので。さらにHBaseがあるならZookeeper(並列同期装置)もあるといいでしょう。

> P17: CDH

rpmだけじゃなくてdebもあるよ!

> P18: Hadoopの利点, P19: 欠点

Hadoop(特にv1 のMapReduce)の利点は"一度に大量のデータを分散して処理できる"とこにあると考えています。その代わり準備に時間がかかる感じです。なのでデータ間の依存が強いようなデータ、例えば機械学習の一部なんかは、1台で処理できないサイズだろうがHadoop(MapReduce)は向いてません。このあたりJiraphとか使ったらどうなのかは把握していません。これに対してデータ間の依存に強く作られてるのがJubatus(https://preferred.jp/product/jubatus/)です。Jubatusの紹介は社員の方お願いします。

あと個人的にTezは気になってるので張っておきます。ここの図を見るとMapReduceとYARNの関連がわかるかもしれません。(http://hortonworks.com/hadoop/tez/)

さらに、だらだらと書き連ねましたが自分も知識レベルでしか知らないものもあるので実務で使ってて違うよって方いましたらコメントください。撃って良いのは撃たれる覚悟のある奴だけだ。

追記:

「100%理解しないと発表しちゃいけないとは思ってない。間違ってるかも知れない不安があるから晒して指摘もらって勉強するのが楽。」

http://twitter.com/tokibito/status/420964715737538560

これは私も激しく同意。なので指摘する側も芽を潰してしまわない様に気をつけないとなーと思いながら記事書きました。凹むとこあったらすいません。

bitcoin採掘始めて一ヶ月程度が経ちました

参考: http://nyatla.hatenadiary.jp/entry/20131231/1388467696

こちらもいろいろぶん回して一ヶ月程度経ちましたんで経過報告します。

金額は確定じゃないんで明記しづらいですが、若干の黒字になる見込みです。多分nyatla氏よりは利益率低いでしょう。

売上が減った原因は以下のところにあります。

・自分の使ってたDogecoin poolが年末から引き出せなくなった

ちょうど高騰してたときにまわしてたら手動でも自動でも引き出せなくなったのでダメージでかいです。今やDogecoinの価値も1/3まで下がってますが、まだ応答ないですね。

・Cryptsy(大手換金サイト)へのdeposit(送金)に遅延が発生した

年末に送金したコインがいまだに反映されないとかいった問題が起きています。netcoinのpoolサイトでも注意がされています(http://net.smalltimeminer.com/index.php)

自分もsupportに問い合わせてますが、応答ないっすね。

・LTCの送金でのミス

WeMineLTCからBTC-eというサイトに対して送金する際、前者も後者0.1LTC未満は受け付けないとかいった制約があります。が、前者は送金手数料で0.1LTC超えれば受け付けるため、送金時に手数料引かれた結果0.1未満で送られ、結果後者で受け付けてくれないといった問題があります。

これってどこに問い合わせればいいんでしょうねぇ。

ただ恐らく赤字にはならないでしょうし、数千円単位の黒字も出せそうです。

・・日本では変動要因激しいし夏場暑いから動かしたくないし電気代も高いしなので、普通に働いた方がいいでしょうね。日本では。

インドネシアなんかだと、給料が日本の1/10程度、電気代が1/4程度なので、数千円=10数ドルの収入でも結構影響ありそうですね(参考 http://is.gd/MZZWgb)。

個人的な懸念

個人的になぜRadeon >> Geforceなのかがわかっていないのですが、Geforce側のcudaminerの改良が進んで、数倍の威力を出した場合、AmazonGPUインスタンスが使える可能性が出てきます(相当遠い話でしょうけど)。もし仮にGPUインスタンスで元が取れるようになれば、Radeonで個人採掘、なんてのも終わるでしょう。・・ってか誰かRadeon7950あたり積んだレンタルサーバ用意してくれないっすかね。CPUとかメモリとかHDDはどうでもいいので。

今年まとめ Summary of this year 2013

English follows Japanese.

もともと安定を考えてたけど安定というか停滞してました。

前半は英語でメールできたり台湾行ったりして楽しかったですが、後半体調崩して寝込んでましたので。

(そういや台湾行った時に、できるだけ発表資料は英語でかけとも思いました。日本だと当たり前程度の知識でも海外だと新鮮な知識になることが多々ありますので。この日記も英語で書きます)

あと今まで問題になってたいくつかの家庭的事情と睡眠の問題が解決したので来年は足取り軽く動けそうです。

なので、来年は変化を望んでいきます。しかしそれが何かは今のとこ考えてません。

あと数年越しにBWTがなんなのか理解できたんですが、自分の頭云々よりとりあえず例示を書き下すってことをおろそかにしてただけでした。今後PRMLとか出るときもちゃんと中間の数式追うようにします。

-

I had thought I was living quiet in this year, but I got sick in this year.

In the first half of this year, I enjoyed writing English and enjoyed in Taiwan.

But the lest half of one, I got sick and I often was on the bed.

However some problem was solved, then I can go forward in next year.

I wish I recieved some events in next year(But I don't know what is it X)).

Have a good year.