White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

計画

とりあえず明日は休んで、無脳のエンジンを改良しようかと。今のとこはblog単語頻度->k-meansのサンプルを書いた後、「むくり」→「おはよう」の数値化かなぁ。

id 単語
1 おきた
2 おはよう
3 むくり
n おやすみ
in out
1 2
3 2
n m

(n=

[w11 w12 ... w1m]
[w21 w22 ... w2m]*([x1 x2 ... xm][x1 x2 ... xm]) ただしx1〜xmは0 or 1
...
[wm1 wm2 ... wmm]

みたいな感じの行列の各要素の和でもとればいい気がしてきた。