スムージング?
- 単語Aのうち応答のある奴/単語Aの出現数 で多いヤツ100件くらいを抽出したい
- ただし単語Aの出現数が全体の単語数に比べて極端に少ない奴はいらない
ってやりたい時に、どんなやりかたしたらうまくいくんだろ?
分母にLog状のペナルティ入れればいいかなぁ。
しましま先生よりLossy countingってのがあるらしい。http://chalow.net/2010-05-12-1.html
ってやりたい時に、どんなやりかたしたらうまくいくんだろ?
分母にLog状のペナルティ入れればいいかなぁ。
しましま先生よりLossy countingってのがあるらしい。http://chalow.net/2010-05-12-1.html