Pixivのタグから見る、艦これ絵師のファン
進撃の巨人を読んだことない人がデータだけでキャラを推測してみる
これとTweetで艦隊これくしょんのタグクラウドやってるのみて面白そうだったので、自分もテキストマイニングしてみました。
ソース https://github.com/showyou/pyxv_kankore
結果の例 https://gist.github.com/showyou/6152676
結果の例 データは結果の一個前のバージョン使用(@shiumachiせんせーが頑張って名寄せしてくれました!) google docs
流れ的には、
- 艦これタグで検索、ユーザIDを取得(2500ID程度?)
- 各ユーザIDから直近10件程度の画像のタグを取得
- 各ユーザごとに、存在したタグを収集(頻度は無視。0か1のみ)
結果としては、単語:ヒットしたユーザ数となります。東方だったらパチュリーとか魔理沙とかも同時にヒットするだろうし、名寄せは特にいらないかも。
・・とはいえ、東方の件数多いなぁ。