日記

日記です

0906

競技プログラミング

 今日の一問。3時間以上かかる地獄問題でした。競技プログラミング、こういうことがあるからつらい……。まぁしかし以前類問にぶち当たったとき後回しにしたから今回大変になったっていう面もあるんですよね。サボった分はどこかでツケが回ってくる。

 他人がインターンとか行っている時間で僕は競技プログラミングばかりやっており、なんというか先鋭化しているのではという感じ。まぁそれは性格的な話だから仕方ないとして、問題はそのわりに競技プログラミングも強くないってことなんですよね。もうちょっとは強くならないと。もうちょっと……。

コンピュータ将棋

 BonanzaMethodは上手くいくんだけどなぁと、ソースコードを眺めていたら学習で評価値を得るときに手番を考慮していなくて常に先手からみた評価値を使っていた。なんで何度も見たはずなのに気が付かなかったんだ……。とりあえず修正して回してみる。千日手が増える現象も勾配が増える現象も見られなくなって、ほのかに強くなっている雰囲気がある。勾配が増える現象があったから学習率を小さく設定していたんだけど、もう少し大きくていいかもしれない。成功してくれていると良いなぁ。

 AlphaZeroとの差分は今のところ

 の3点かな。気合を入れれば全部模倣することはできるはず。後は気合の問題。バッチサイズを大きくするのはメモリ量がちょっと不安だけど……。たしか最新50万局分は持っておくんじゃなかったっけ。読み直そう。

 1層目の活性化関数かける前までの差分計算も書いた。が、むしろ遅くなった。え、まじか。評価するのはリーフノードだけだから途中の計算がむしろ遅くてダメなんだろうか。えー。ショック。しかも差分計算間違っていたことがわかった。ショック。つまりテストすらちゃんと書けていなかったということでさらにショック。ちゃんと差分計算するの結構大変そう。僕に差分計算は無理だ~。

 ところでAlpha(Go)Zero式のMCTS、シミュレーションを省くのって結構大きな改変だと思うんだけど、なんで特に新しい名前を付けなかったんだろう。モンテカルロ要素ないのにモンテカルロ名乗るのは許されなくない?

1年前の日記

 去年から比べると多少は実装力がついて、自分なりの工夫を入れる段階には来ているかなぁという感じ。まぁおそらくこれでKPPTより強くなるってことはないんですが、それはそれ。

 広島東洋カープ、今年は結構苦労している印象があるんだけど、それでも去年のこの時期とほとんどマジック数が変わらないのか。勝つのは大変。

ダークソウル

 とくに進歩なし。病み村を覗いてみたけど落下死しまくる。飛竜でレベリングするのもいまいち効率が悪そう。

その他

 七尾百合子さんに似合うラノベ話、『悪魔のミカタ』が挙げられていましたね。まぁ僕は4,5巻あたりで挫折したままなんですが……。たぶん読めば普通に面白い気はするけどうえお久光の中ではどうなんでしょう。僕は単巻ものの方が好きなのもあって、どうしても短いシリーズの評価を高くしてしまう。『悪魔のミカタ』、ネーミングセンスは好きなんですけどね。