White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

ぼくのかんがえた さいきょうのじんこうむのうをつくるためのつーる

2010/09/06現在。あまり意味はない。自分が知ってる範囲でしかかけないのでもっといろいろネタはあるとおもう。

コンピュータ

手計算でもできるけど、あんましたくないよね。

プログラミング言語

これも好きなの使えばいい。スピード欲しければC++、書きやすさでLL(PHP, Perl, Python, Ruby)とか。JavaとかLispとかPrologとか

ストレージ

学習データを保存するとこ。ファイルにそのまま保存。mysqlRDBMS。クエリ弱いけど高速なKVS

学習方法

クラス分けとか探索とか(クラス分けに限るわけはない)。条件木からSVMとかナイーブベイズ、ロジスティック回帰、HMM、。。。

分散技術

学習とかするときにマシン1台じゃ足りないんで数台に分けて実行する。Hadoop(Map reduce)はよく聞くけどコレが絶対ってわけでもない。

アルゴリズム

意外と適当な決め打ち応答でもなんとかなる(はまのおはようなのよとか)。suffix arrayとか知っとくと比較が早くなって便利かな?
あと別に人工無脳=テキスト処理ではないので、別の要素を取り入れるのもあり。例えばカメラ画像とか。

センシング

またテキストに戻るけど、今ネットには誰でも使えるデータが多い。この時問題となるのが「そのデータを採用するかしないか。広告などのデータじゃないか」とデータの一括入手手段あたりだったりするのだけど、twitterなんかはAPIで誰でも大量のデータを簡単に入手できる。しかも最初からある程度属性が付いている(replyとか)。



歩くヒューマノイドロボットとか考えるなら、物理側の挙動も考えなきゃいけないのだけど、とりあえずここまで。というかここまででも間違いとか多いだろうし。


あと一番大切なのは作ること。作りたいと思っても作れない/作らない人は多い。ただそれだけだとゴミばっかり産まれるので育てましょう。