計画
とりあえず明日は休んで、無脳のエンジンを改良しようかと。今のとこはblog単語頻度->k-meansのサンプルを書いた後、「むくり」→「おはよう」の数値化かなぁ。
id | 単語 |
---|---|
1 | おきた |
2 | おはよう |
3 | むくり |
n | おやすみ |
in | out |
---|---|
1 | 2 |
3 | 2 |
n | m |
(n=
[w11 w12 ... w1m]
[w21 w22 ... w2m]*([x1 x2 ... xm][x1 x2 ... xm]) ただしx1〜xmは0 or 1
...
[wm1 wm2 ... wmm]
みたいな感じの行列の各要素の和でもとればいい気がしてきた。