White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

↑やってるときに気づいたんですが

mecabに食わせる文章、あんまり大きいとmecabがsegmentasion fault起こしました。なぜかLinux側だけで
Win機もLinux機もメモリ2GB積んでるのでメモリが足りないって事じゃないと思いますが・・
結局1文章丸まる読み込みから、1行ごとの読み込みに変更しました。行をまたぐコーパスは取れなくなるわけですが・・