White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

libsvm 続き

実際にデータ食わせて分類させてみたけど、なかなかすんなりは行かないですね。

optimization finished, #iter = 139
nu = 0.014830
obj = -5.042259, rho = -0.824080
nSV = 42, nBSV = 0
Total nSV = 42
ただいま午前三時です : 1.0
ただいま北海道に戻りました。 : -1.0
ただいま下山します : -1.0
ただいま、パソコンなう : -1.0
ルスツはただいま雨です。スキー : -1.0
ただいまです : 1.0

学習として食わせたのは「ただいま」を含む35個の文で、「帰宅の挨拶」を意味するものと「今現在」を意味するものでそれぞれ{1.0,-1.0}とラベルをつけた。上の文章は学習データの文章を入れて正しい答えが帰ってくるかどうか見てるんだけど、この時点で間違ってる・・(ただいま午前三時ですは-1.0になるべき)。「ルスツはただいま雨です。スキー」も「スキー」を消すと1.0と判定されてしまうのでなかなかひどいとこで分類されてる気がする。


悪いのがsvm自体なのか自分のコードなのか学習データなのか判別つきにくいのが難しいところ。