White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

第三回さくさくテキストマイニング勉強会に参加してきました #sakuTextMining

詳細はnokunoさんのまとめ参照。 http://d.hatena.ne.jp/nokuno/20110604/1307178783


今回の感想としては、tokyoNLPがPRMLの延長でひたすら解析って感じに対し、sakuTextMiningがむしろ現場でつかうのよりって感じでした。アリ。
#しかし入門の筈なのに結構強そうな方達もお見えになってるw
見てるだけで発表しないと上達しないので次回くらいは発表を行ってみたいです。


#しかしどうやったらアンチべ様みたいなうまい発表できるんすか?


あとくらいおらいとセンセーと会えたのがよかった!けど懇親会の時に顔を忘れてた!ひどすぎだ自分。。。

6/5 追記

懇親会で話していたのだけど、実際業務でテキストマイニング/データマイニングなりできるとこって日本ではそんなにないんじゃないかと思う。自分などの開発部署は仕事していた限り足し算引き算ぐらいまでしか数式が出てこなくて、統計とか使った厳密な分析なんてもっての外だった。なぜそうなのかというと、みんながみんな理系大学を出たわけでなく、微分とか数式を使えるわけじゃないからで。研究所だと又違うのかもしれない。マーケティングはアンケートとかで相関をExcelで求めるくらい?


この辺りは勝手な想像だけど、今までの日本はこれでも職人的な係数値でうまくやってきたという感じがする。一方アメリカなんかだと手先が器用じゃない代わりに数式とかバンバンつかって分析してるんだと思う。んで今は日本のやり方でよくても、状況が変化したとき(例:オフショア外注)にはアメリカ的な方法の方が勝るのではないだろうか。


じゃあどうすれば今の日本の企業がテキスト/データマイニングなどを行えるようにするかだけど、saynoway66さんがおっしゃってた感じに「目的と手法の長所短所、マイニングによる利益」を説明していくしかないのかなぁと思う。もしくはやってるとこに移ってしまう手もあるけど。