White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

人工無脳

応答元を引き出す

自前ライブラリを使いまくってて理解できないとおもいますが、 一応こんな感じでいけたよーって報告。 # -*- coding: utf-8 -*- def getChatLog(): import time,json,twitter2,re,toDate,datetime file = open("user.dat",'r') userdata = json.read(file.re…

人工無脳オフ 感想

こっちに書いてます。 http://twitter.g.hatena.ne.jp/showyou/20080216/1203252733

ha_maの成長記録

http://twitter.com/ha_ma 最近Mai_iaMとかdabesaに押され気味っぽいですが、がんばります。http://twitter.g.hatena.ne.jp/showyou/20080210/1202658399

メモ

末尾の「。」の変換がおかしいので調べること(UTF-8関連?) 共起に順序縛りを入れる(具体的には行列の横列が前に相当、縦列が後ろに相当って感じ?) 共起+αで意味推定とかできないかな? これまでは鸚鵡返し型だったけど、返答できないかな?

ループチェック入れてみた

昨日の奴に、同じ単語が何度も出てこないようにチェックするようにした。 結果、実時間で答えが返ってくるようになった(実時間で帰ってこないこともあるようだけど・・) でも単純マルコフ連鎖より文章の質が落ちてる気がする・・ 二重マルコフ連鎖やってるか…

共起+探索で文章生成してみた

結果がこれ

オフ会用bot作った

オフ会の告知がしたいけど、全員をfollowするのは大変! そんなあなたのために、オフ会用のTwitter botを用意しました。http://twitter.com/offbot

「What are you doing?」 bot 作ってみた。

発端はtyoroの人の発言。 定期的にランダムにpublic_timeline上の誰かに「What are you doing?」とreplyして、帰ってきた返事を全体発言でユーザー名と一緒に帰すbotとか面白そうだな。 「○○さんは今「」をされています。」 的な。 どちらかといえば外人受け…

無駄な抵抗改め共起による文章生成4

一応、"「"があるのに"」"がないってのを判定するルーチンを作った。

まとめ

http://d.hatena.ne.jp/pha/20071126/1196091309 の内容に便乗して、こちらでも少しまとめてみます。順番はいい加減です。

無駄な抵抗3・・というか共起による人工無脳の文章生成

前回までのあらすじ 1文あたりの単語間の共起をまとめる=共起行列を作る(前回の表ね) ↓ hamaが生成した文に対して共起行列を使った評価関数を適用する ↓ 変な文章が学習により自動的に弾けられてウマー・・のはず 例:"「"と"」","『"と"』","["と"]","今日…

無駄な抵抗2

昨日は3つの文を解析して、その中にある単語の相関を以下の表にまとめてみました。 (出現文数) 明日 は いい 天気 でしょう 今日 です 昨日 悪い 明日 1 0 1 1 1 1 0 0 0 0 は 3 0.33 0 0.67 1 0.33 0.33 0.33 0.33 0.33 いい 2 0.5 1 0 1 0.5 0.5 0.5 0 0 …

今日の無駄な抵抗

先日のアルゴリズムがうまく行ってないので、紙に書いてシミュレートした。例えば、以下の文があるとする。/の位置で単語が区切れるとする。 明日/は/いい/天気/でしょう 今日/は/いい/天気/です 昨日/は/悪い/天気 これを各文、各単語ごとに出現頻度を取る…

仮説失敗・・かなぁ?

仮説:各文章毎に、どのような単語が並んでいるか相関を取る。後でマルコフ連鎖により生成された文章に対し、その相関係数を使って計算して高い数値のやつをあげれば、一定のルールに従った文章が出来上がる ・・ということを期待してやってたんですが、どう…

hama実装

今日はログの各文毎に、単語同士の存在確率を数えてみることにしました。 例えば「今日はいい天気ですね」という文章があった場合、 p(今日andは)++,p(今日andいい)++,・・といった集計をしています。 ただしこの方法だと頻出する文ほど多くなるので、例えば…

ha_maの応答

gOSをアニメでX-Japanが準にゃんかー音楽ってそれーなのよ。 えっと、先日単語テーブルを一旦初期化して、なおかつ「準にゃん」なんて単語入れた覚えないんですが、いつの間にか勝手に覚えてました(泣 禁つゐっ!!なのよ。 mtokさんが「禁つぃったー日を設…

根本的な問題

http://twitter.com/ha_maで相変わらずしゃべらせてるのですが、いろいろ気になることもあります 面白いセリフは面白いけど、文の繋がりが悪いセリフの方が、よく目立ちます。一番酷いのが、"「"がないのに"」"があるとか。そもそもマルコフ連鎖の時点でつな…

hama強化?

http://twitter.com/ha_ma 今まではtwitterログの空気を読まずにランダムに生成していたのだけど、今度のは次のように変えた。 twitterのログから名詞を抽出 名詞で統計を取り、多いうちのいくつかから一つの単語を選ぶ その単語が入るように文章を作る。 具…

空気を読む

rsあたりから"最近出てる話題に対応した内容を話してくれよ"ってのがありました。 この辺に対応するには、以下のことをやればいけそうです。 最近のログから単語を抽出する。この辺は既にmecabでやってること。 その単語を含んだマルコフ連鎖を起こす。その…

ドグラマグラbot設置

http://twitter.com/dogramagra 本日青空文庫で公開されたドグラマグラの文章を、マルコフ連鎖でランダム生成させて出力しています。以下ドグラマグラの紹介 http://ja.wikipedia.org/wiki/%E3%83%89%E3%82%B0%E3%83%A9%E3%83%BB%E3%83%9E%E3%82%B0%E3%83%A9…

hama設置二日目

しゃべりすぎって意見があったのでコメント数若干調整。 応答が欲しいということなので簡単な応答文は入れてみた http://twitter.g.hatena.ne.jp/showyou/20071223/1198371481

ha_ma設置一日経過

http://twitter.com/ha_ma 単純なマルコフ連鎖で発言させてるだけですが、結構面白いですね。こういう文章生成の研究って、次の様な層に分かれているのかな、って思います。 下に行けば行くほど、言語生成の本質に向かっていくんでしょう。 ランダムな言葉を…