White scenery @showyou, hatena

If you have any comments, you may also send twitter @shsub or @showyou.

PRML

メンバー
syou6162,wilson,_a_u,showyou
場所
P240「5.2.3 勾配情報の利用」〜P252「5.4.1 対角近似」

ログ

tex記法やるとなんかずれるので後で修正予定。

  • 勾配情報を使うことで必要な計算量がO(W^3)からO(W^2)に減らすことができる、らしい
  • 5.42がよく分からない
  • 一回だけの計算の話
  • 逆誤差伝播
  • 「局所的な」計算
  • バックプロパゲーション
  • ニュアンスがよく分からない<局所的
  • 5.54は5.18のところを利用している
  • 5.55のsumがなぞ
  • \delta_j\delta_kで意味が違う
  • a_ka_jに依存
  • Eはa_1, ..., a_k で構成
    • a_1, ..., a_ka_j に(独立して)依存
    • ∂ E / ∂ a_j は ∂ E / ∂ a_1, ..., ∂ E / ∂ a_k の重み付き和?
  • E=E(f), f=f(x,y) のとき\frac{dE}{df}=\frac{dE}{dx}*\frac{dx}{df} + \frac{dE}{dy}*\frac{dy}{df} ???
  • a_k=\sum_j w_{kj} z_j = \sum_j w_{kj} h(a_j)
  • \frac{a_k}{a_j} = h'(a_j) \sum_j w_{kj}
  • \frac{da_k}{da_j} = h'(a_j) w_{kj} (5.56)
  • \frac{d}{dx} \frac{f(x)}{g(x)} = \frac{(f(x)g'(x) - f'(x)g(x))}{g(x)^2} あたりでよかったっけ?>ですね
  • 中心差分法
  • \frac{1}{2}*(\frac{E(w+e)-E(w)}{e}+\frac{E(w)-E(w-e)}{e}) 演習5.14
  • 5.79 定義?->連鎖法則を使った修正
  • (5.80)やばい
  • あとで導出誰かに教えてもらったほうがいいのかなぁ。
  • \frac{d}{d^2a_j}\frac{d}{d^2a_j}E
  • \frac{d}{d^a_j}\frac{d}{d^a_j}E
  • \frac{d}{da_j} = \frac{d}{da_k} \frac{da_k}{da_j}
  • \frac{da_k}{da_j} = w_{kj} h'(a_j)
  • (d/da_k * da_k/da_j )(d/da_k * da_k/da_j ) En
  • \frac{d}{da_k} \frac{d}{da_k} \frac{da_k}{da_j} \frac{da_k}{da_j} *E_n が(5.80)の第一項?
  • \frac{da_k}{da_j} = w_{kj} h'(a_j)
  • (\frac{d}{da_k}\frac{d}{da_k} ) (w_{kj} h'(a_j) ) En 合成関数の微分になってる

感想

変数の添字が何を表してるかってとこからよくわかってないですね(寝ぼけてたってのもあるんだろうけど)
あと各自計算できそうなとこ導出する。私はtanh(x)の微分でもやってくる(それ以外もやれ)来週は正月なのでさすがにお休み。次回は1/8から。

追記

tanh(a) = h(a) = \frac{(e^{a} - e^{-a})}{(e^{a} + e^{-a})}

(e^{a} - e^{-a}) = f(a) (e^a + e^{-a}) = g(a)と置く

tanh(a) = \frac{f(a)}{g(a)}


(tanh(a))' =( \frac{f(a)}{g(a)} )' =  \frac{(f'(a)g(a) - f(a)g'(a))}{g(a)^2} -(A)


f'(a) = g(a),
g'(a) = f(a)より、


(A) = \frac{(g(a)^2 - f(a)^2)}{g(a)^2} = \frac{1-f(a)^2}{g(a)^2},


= 1-h(a)^2