日記

日記です

0817

 700AC達成。

f:id:tokumini:20180817102852p:plain

コンピュータ将棋

 RootStrapは上手く行っていると信じるとしてニューラルネットを書き始める。頭がよわよわなので誤差逆伝播の式を自力で書き下せない。ソフトマックス関数の微分が入ってきた瞬間に全てが終わる。

 一切微分が合っている気がしないけど、とりあえず同じ局面で同じ評価値、手を教師にすればほぼ損失が0になるようになった。

 一つの棋譜を繰り返し入れるのでもなんとか損失が下がっているが、めちゃくちゃ遅い。うーん、式は本当に合っているのかなぁ。

 バッチ式にしても学習がめちゃくちゃ不安定。損失がふらふらする。ナイーブなSGDだと厳しいのかなぁ。せめてMomentumとか、そういうのを実装しなきゃいけないのか。

 むしろバッチじゃなく逐次学習の方が損失下がるなぁ。よくわからない。何もわからないままに雰囲気で全てをやっている。

1年前の日記

 伴田路子さんを呼び捨てにしていてイラっとした。フルネームがわからなかったんでしょうね……。

その他

 研究室でいそいそとWiiを準備して弟切草かまいたちの夜を調べてどっちも800円そこそこか、安いなと思ったところでこれだよ。任天堂カードかなんかを買いに行く前で良かった……。悲しい。