コンピュータ将棋
勾配の符号を適当にやっても学習できてしまうっぽい。ちゃんと考えなきゃ……。
Aperyの評価パラメータ読み込みにようやく完全に成功した。なんかできてた雰囲気出してたけど全然だった。ハマりポイントはKKPの後手玉位置は反転したものを使うと思い込んでいたところで、それでずっとKKPの値が正常に取れていなかったようだ。あとは細かいけど駒割りが違うのでそれを修正したりとか、それに伴ってセンチポーンで出すときに10/9倍しなきゃいけないのとか、そういうところで微妙にずれてなんでだー!ってなってた。
Aperyの評価パラメータが4つずつの謎はよく考えたら当たり前か。左右対称と、KKPなら180度回転、KPPならインデックスの順番逆のものがあるから、同じ値は4か所に入るんだ。
探索部をちょっと改善してNPSが高まった。今までが雑魚すぎるんだろう。計測してみると初期局面で2MNPSって対して高速化していないわりに出すぎな気がする……。ノードの数え方がおかしいのかな。そして探索深さはAperyの半分以下なので、はい。
詰みの手数、符号などについて検討モードで待ったを使ったときに変なことが起きるのを確認。直し方がわからない。
競技プログラミング
今日の一問。覚えていたのであっさり終わってしまった。
1年前の日記
名前空間の解決法がコンパイラによって違うってマジか? なんで適当な知識しか持ってないはずなのに自信持っているのか謎。何かそういう資料を見つけたのかなぁ。出典を残しておいてくれ。
夏の目標高めだなぁ。目標を達成できたか振り返りをしていないのがひどい。
その他
今はTwitterを家のデスクトップからしかできないようにしているんだけど、昨日寝る前からそのマシンでも学習を回し始めたので完全にTwitterにアクセスできなくなってしまっていた。Twitter中毒者なので期せずして訪れたツイ禁が12時間を超えたあたりで手が震えだした。嘘です。
機械学習できる人間はたくさんいるし、どちらかというと二人零和有限確定完全情報ゲームの探索アルゴリズムが書けます! っていう方が売りになりそう。なるのか?