20231206 - 日記

　有給休暇を取得して、GUIベースで将棋所を動かすプログラミングをぼちぼち書いていた。

GUI起動してスクリーンショット取りつつマウス動かして将棋所操作というのがxlib使えばコード的にはできるとがわかってきたけど、一手指すのをどうやって学習させたものかな。ランダム指しができるようになればそこからは勝敗ベースで学習ができるはずだが、そこまでの到達がhttps://t.co/dXNBGiAuXS
— t (@tokumini_ss) 2023年12月6日

　まぁやっぱり人工知能くんには人間ができるコンピュータ操作をできるだけ自由にできるようにして、そこから上手く学習してほしいものね。

　でもここまで原始的なレベルから（将棋というゲームの事前知識がない状態から）学習させるのも話が違うのではないかという気はする。あまりにもランダムなクリックとマウス操作を繰り返されてもな。だからLLMとかVision系に繋がるLLMくらいの事前知識は入れてなんか上手いこと最初の学習を方向づけできないかなとは思っている。ある程度の棋力にまでいければそこからは将棋としての強化学習でなんとかなるはずなので。

　本当は自分がクリアできない難しいシューティングゲームとかを強化学習で頑張ってほしいのだけど、開発用マシンにはWindowsが入っていないので動かせない可能性が高い。monoチャレンジとかしてみるべきなのかな。

　方向性は、なんとなくこっちなんじゃないかという予感はある。茫洋とした問題に対して上手く向かってみたい。