コンピュータ将棋
MCTSがなんか変な挙動を示していたけど、駒割の初期化ミスだった。昨日Positionクラスの持つ評価関数パラメータへのshared_ptr
を単なる参照に変更したときに、初期化周りをいろいろいじってその結果こういうことが起きたのだった。前はshared_ptr
のコピーが結構たくさん発生していた気がして、その分少し良くなったんじゃないかという気はする。理念的にも不必要にポインタを持ちまくるのは好ましくなく、できるだけ参照で済ましておきたいところ。
千日手判定も32手分くらいまでで打ち切ることにした。初期局面まですべて遡る方法では終盤になると明らかに遅くなる。
相変わらず千日手は多く、これはどうしようもないことなのかな。ランダム初期化したパラメータではまともな対局にならないが、AlphaZeroとかよくまともに学習できたなぁ。というかどんな感じのソースコードだったんだろう。見てみたい……。
GitのRevertについて勉強する。コミットをもとに戻すけど削除するわけではなくて、むしろ元に戻したというコミットが追加されるらしい。YU-NOじゃん! いや別にそんな珍しいアイデアだとも思わないけど。
コミット、時系列に並べられるから最新の方から全部Revertしなきゃいけないのかと思ってしまうけど、各ファイルが編集された一番新しいところだけ考えればいいわけだよな。しかしそれを判別するのってコミットのコメントしか情報がない……? コメントめちゃくちゃ大事そうだなぁ。いつも適当に書いてしまうけど、もうちょっとちゃんと書きましょう。
ようやくNN版でもRootStrapで学習できたようだ。嬉しい。と思ったら錯覚だったっぽい。悲しい。
あと数か月あればなんとか研究としても形にはできそうかなぁ。コンピュータ将棋は高速化とか細かい改善が結構本質的だと思っていて、テーマをがっつり掲げなくてはいけない研究とはあまり相性が良くなさそうだなーとは思う。Alpha Goとかが異常すぎなんですよね。NNUEもかなりすごい。ああいうことはそんなポンポン発生しないでしょーという気持ち。気持ちです。
デレステ
10連1回だけやるかーっていう結果。
デレステやる気が出てきました(ちょろい)。衣装がかっこよくて好き。暗めなドレスの北条加蓮さんと対応が取れていて面白い。双翼とか並べると愉快な気持ちになる。
他人を駆り立てる要素が発生してしまいそうなのでSNSにガシャ結果のスクショとかは投稿したくないんですよね。そういう邪悪成分にはできるだけ加担したくない。
担当申請が来るたび北条加蓮さんに「友達って、大事にしたほうがいいよ」って言われる。なるほどですね。人生の学びがある。
イベントコミュを見る。なんだこのメンツ。
その他
状態が「疲労」になっている感じがある。何もできない。
「~という気持ち」という文章を入力したら自然と「気持ちです」を付け加えてしまう病にかかっている。これはなに?
何かものを作ったらちゃんと宣伝したほうが幸福度は増えるんじゃないかな。人によるかもしれないけど。
カープは勝ちました。すごい勝ち方するなぁ。強いんだなぁ。