White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

スムージング?

  1. 単語Aのうち応答のある奴/単語Aの出現数 で多いヤツ100件くらいを抽出したい
  2. ただし単語Aの出現数が全体の単語数に比べて極端に少ない奴はいらない

ってやりたい時に、どんなやりかたしたらうまくいくんだろ?


分母にLog状のペナルティ入れればいいかなぁ。


しましま先生よりLossy countingってのがあるらしい。http://chalow.net/2010-05-12-1.html