AlphaZero的(というか経験リプレイを入れただけ)な実装にしたら、多少は学習が安定するようになったかな~という感じ、また明日見てみないとわからないけど。
提案手法はやはり弱そう。分析的な感じでなんか書けるかなぁ。
そういえば将棋ソフトの方を久しぶりに触って、置換表のハッシュ関数に開番地法を実装してみたけど全く変わらない。そんなに衝突していない? ここが探索の肝かとも思ったんだけどなぁ。なんでこんなに探索がへぼいんだろう。
ウォーズは1勝2敗。弱い人にしか勝てない。二段の実力は絶対にない。つらい。
夕食には寿司を食べたが周りの人はアルコールを摂取し大変な有様となった。うーむ。
虚無から目をそらすために気になることを手あたり次第やらねばならないという気持ち。そういうやり方しかわからない。それもあまり良い方法だとは思わないけど。もっと純度を高めていきたい。
活力がないことを自由意志のなさという哲学的な問題へ改変しようとしている邪悪。お前のやる気がないだけだろう。
文章が書けない。読めもしない。