大学
10時に研究室着。明後日謎の発表があるので午前中はそれの資料を作る。ふわっとしたテーマで話せということなのでふわっとした語りをするぞ。
午後はtensorflowと向き合う。計算グラフに投げる特徴量を作るときに筋を逆の順番にしていたバグがあったのを直してなんとかちゃんと動くようになったと思う。
しかしvalueだけを使うαβ法では全然強くない。そりゃ当たり前か。しかし評価値も結構粗い気がする。これでは勝率予測として適切なのか……?
18時ごろ帰る。明日は大掃除らしいのであんまり作業はできないかなー。早く並列化モンテカルロ木探索を実装したいところだけど。
将棋ソフト開発
無。
競技プログラミング
ABC037のDを解いた。12分27秒でAC。1回MODを取り忘れてWA出したのは反省点。まぁ2年前コンテスト出たときは解けてなかったようなので、長い目で見れば成長はしているんだろうなぁ。亀のような遅さだけど。