White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

人工無能 Takakura_Anzu を作ってみた

https://twitter.com/Takakura_Anzu

 

ついかっとなってもふもふしたくて作った。当然ですが非公式です。アイコンはtwitter用に用意されてるものを使っております。

今のところ定期更新はなく、followerの一部の単語に反応するようになってます。あと@takakura_anzu, @杏鈴でも反応帰って来ます。

 

 

follow返しは手動なんで、メール通知次第手で管理します。

 

 

なんか要望あれば@showyouへ飛ばしてください。

 

返答パターンは次のとこにあげてます。

https://github.com/showyou/anzu/blob/master/common/replyTable.json

 

--

5/11 追記

followに関してですが、こちらからもfollowかけています。うざかったらblockするなり@showyouに一言貰えれば外します。

followルールですが、以下の仮説立てて行っています。

  1. 杏鈴ちゃんかわいいと言ってる人は高確率で杏鈴スキー
  2. 杏鈴アイコンの人も高確率で杏鈴スキー
  3. 別の杏鈴botフォローしてる人も杏鈴スキー
  4. Clover Day's プレイしてる人 / アイコンにしてる人は好きそう(杏璃派も多分にいるとは思いますが。杏璃はもうちょい待ってて下さい)

とはいえ、ゲームの杏鈴好きでもいちいち返してくるのが鬱陶しいひとはいるかも知れないですね。。

余談ですがいろセカの真紅(http://twitter.com/nikaido_shinku)の時よりは検索はし易いです。こっちはローゼンメイデンの真紅の可能性も有りましたから。。。というかAlcotとFavoriteでコラボしてるだけあって、杏鈴へのオススメユーザに真紅が、真紅のオススメユーザに杏鈴が大量に出ますね・・早くいろセカユーザはクロデ体験版やりましょう。杏鈴もふもふしたくなったらfollowしましょう。

 

MacBookAir 13''(Mid 2011)のバッテリーを変えた

言語処理学会行ってるときにバッテリーが2時間くらいしかもたなかったり、「バッテリーの交換修理」といったメッセージが出てたので変えてみた。

手順としてはhttp://www.jumbo-stickies.com/sticky/node/740にあるのと全く同じ。

購入元はAmazonのA1405ってやつ。2012モデルも同じ電池みたい。さらに上のページでも書かれてるけど星形1.2-50とT5のヘクスローブドライバーが必要。あまり見かけないのでAmazonで買ってしまった方がいいかも。

自分で変えてみた結果、はじめ電池が認識されずに挿し直してから認識したり、蓋を閉めるときにネジが一本足らなかったり、その後星形ドライバーがどっか行ったりしてるけど、なんとか認識して充電されている。

スクリーンショット 2014-04-14 21.00.06

現在残り時間5:18とかになったけど、chromeがかなり電池食うみたいなので実際もっと短いだろうなぁ。

ちなみに取り外しは楽。Let's noteとかDynabookよりも楽。裏蓋開けてバッテリーのネジだけ開ければよい。あと一個ネジ開ければSSDも変えられるだろう(とはいえSSD高いけど)

Ubuntuでmysqlをapt-get dist-upgradeしたらエラーが出る

なんかCentOSSElinux並にひっかかんじゃないのかこれ・・

環境 Ubuntu 12.04 LTS

MySQLのデータ設置ディレクトリを既存とは別のとこに設定

apparmor使ってればどのOSでも起きそう

症状 apt-get dist-upgradeでmysql-server周りの更新に失敗する(=起動できなくなる)

原因 apparmorの設定が更新されて、別のディレクトリを見に行ってくれなくなった。

判別方法、対策

 apt-get dist-upgradeでmysql-serverがerrorを返す

 コンソールログから、mysql自体が正常に立ち上がらなくなっていることを確認

 次にmysql自体を単独で立ち上げてみる。

$ sudo /etc/init.d/mysql start

..

失敗

次にdmesgでログを見る。

init: mysql main process (14979) terminated with status 1

type=1400 audit(1397156184.744:116): apparmor="DENIED" operation ="open" parent=1 profile="/usr/sbin/mysqld" name="...

とかでてくる。ここまでくればapparmorに問題があるのがわかるので、/etc/apparmor.d/usr.sbin.mysqlとかを編集。ちょうどupgrade前のも残ってくれてるのでそこから必要な箇所を移す。自分の場合はこんな感じ。

/data2/mysql/ r,

/data2/mysql/** rwk,

 編集したらmysqlを単独起動。OKならばdist-upgrade。

CDH5 + Hue3.5

手元、と言ってもお外から家につなぐIP変わってたので、EC2(m1.large, Ubuntu 12.04)上に立ててみた。

cdh5_hue3

取り立てて記述する手順もなく、このあたり読んでapt-getでいれまくって設定すればいい。s3使えよとか普通の分散やれよって感じだが、今回はあくまでCDH5に積まれたhueの感触触るためなんでそこんとこすっ飛ばした。

手順は一応書いときますが、あとから書いてるんで若干違うかもしれません。随時更新していきます。

https://gist.github.com/showyou/10151685

言語処理学会第20回年次大会(NLP2014)に参加してきました

北海道までわざわざ陸路使って行ってきました。

印象として、といいますか、今回幾つか目標考えていてその辺りがうまく達成できた感じだったのでよかったです。

強く印象に残った発表としては、他の人らも思ってるんでしょうけど、Deep Learningの自然言語処理への応用でした。まだ海外の一線級の学会の資料見てないのでなんとも言えないですが、ACLの一部のセッションではほとんどがDeep Learningになってしまってるようですね。

あとはポスター発表の方で、研究ではないけれど応援はしたいって発表が幾つかありました。また登壇発表の方では問題設定や解決までの流れを見ました。

5月にある人工知能学会もできれば時間つくっていきたいと考えています。ついでに四国制覇も目指して。

みうなちゃん問題

ubuntu 12.04 LTS + mecab + naist-jdicにて。

Clipboard01

まあ当然といえば当然なのかもしれないけれど、登録されてないときついわな。

じゃあkytea 0.4.6は・・というと、

~/kytea-0.4.6$ echo "リリカルなのは" | kytea

リリカル/名詞/りりかる なのは/名詞/なのは

~/kytea-0.4.6$ echo "結局みうながかわいそうじゃないか!なんだこの仕打ちは!" | kytea

結局/名詞/けっきょく み/動詞/み うなが/動詞/うなが かわいそう/形状詞/かわいそう じゃ/助動詞/じゃ な/形容詞/な い/語尾/い か/助詞/か !/補助記号/! な/動詞/な ん/語尾/ん だ/助動詞/だ この/連体詞/この 仕打ち/名詞/しうち は/助詞/は !/補助記号/!

~/kytea-0.4.6$ echo "結局みうなちゃんがかわいそうじゃないか!なんだこの仕打ちは!" | kytea

結局/名詞/けっきょく みう/名詞/みう な/助動詞/な ちゃん/名詞/ちゃん が/助詞/が かわいそう/形状詞/かわいそう じゃ/助動詞/じゃ な/形容詞/な い/語尾/い か/助詞/か !/補助記号/! な/動詞/な ん/語尾/ん だ/助動詞/だ この/連体詞/この 仕打ち/名詞/しうち は/助詞/は !/補助記号/!

~/kytea-0.4.6$ echo "みうなちゃんかわいい" | kytea

みうな/名詞/みうな ちゃん/接尾辞/ちゃん かわい/形容詞/かわい い/語尾/い

うお、名詞として引き出せるのに先の方の文章は誤分類する・・

以前「リリカルなのは」は分類できるのか?とKyTea作者のNewbig氏に聞いた時に、やはり「な の は」と分類されるけど辞書追加により対応するっていう話がありました。そのときは未知語、といいますか「~なのはいやだ」とか、別の用法が頻出するっていう問題がありました。

https://twitter.com/neubig/status/122146128425795584

個人的になぜこんな感じのが起こるのか。まずmecabは文全体に対していくつか分ける方法を考えて、一番尤度(起こりやすさ)が高いものを見ているからだと考えています。んで「みうな」に対してスコアが設定されていないため、そもそも抽出できないと*1

一方でKyTeaは文に対して「ここで区切ったほうがよいか、どうか」とだけ考えて区切ってるはずですが、見る+うながすの形に区切られてそう。

それより来週どうなんだろ・・

参考

http://mecab.googlecode.com/svn/trunk/mecab/doc/index.html

http://www.phontron.com/paper/nlp2010-kytea.pdf

*1:mecab互換+辞書設定してるbenymd_botは抽出できている模様https://twitter.com/benymd_bot/status/449184330749734912

イーモバイルGP02 と Bic SIMを買った

 

 

先日契約したNexus5が5GBの転送制限があり、また通信範囲的に不安なのでDocomo系の安SIMを契約した。それとGP02が2980円で売ってたので購入した。

GP02はSIMフリーで、通信規格がDocomoと同じためDocomoの安SIMが使える。ただしLTE通信は通信帯の問題で使用不可。あと安SIMはテザリングができないのでWiFi中継したい場合ルータが必要。

BixwFMuCIAAhDZv