White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

devsumi2010

昨日、今日と参加してる。
kumofs、LL大会、GoogleIMEの話を聞いてる。


なんか発表は人で選んだ方がいいかなぁ。ギーク向けの発表が面白い。

GoogleIMEの発表の時、tweetできなかったのでここに書いとく。

GoogleIME
IMEは絶対に落ちてはいけない
カーネルモードで動くのでセキュリティがあってはいけない

発送の転換
落ちてもいいようにしよう

機能の分離
処理ごとにプロセスを分離
STATELESS 入力情報を全て変換エンジンに送り表示内容だけ持つ

変換エンジンが落ちたら?
IMDLLがキーを再送する
(ここで文字入力中に、4秒ごとにIMEをkillするデモ)

変換エンジン自体をサンドボックスにおく

辞書
読みは条件付き確率モデル

Web辞書も言語モデルに適応する

KVSはEXACT MATCHしか出来ない
TRIE LOUS ハフマンコーディングでモデル表現

辞書は変換エンジンのバイナリに乗っている

遅い理由XPだとフォアグラウンドからバックに回される
キャッシュに乗せることで回避。開発版で実装

発表後いくつか聞いてみた。

  • Linux版は->出さない
  • Web辞書の判定基準が謎->出現頻度で判断している。時間で辞書も変えている
  • chromeのアドレスバーに入力してる時に文字が消える->対策中
  • 携帯電話みたく変換確定後に候補ださないのか->tabキーなど確定後にトラップしていいのかどうか問題で、今考えてるところ
  • IMDLLと変換エンジンのプロセス間通信覗かれたら穴にならないか?->実行してるユーザ以外の人には見られないようにしてる。また毎回プロセス通信用のIDを切り替えている