有給休暇を取得して強化学習のプログラミングを進めていたが、いろんなところでバグらせたり理解が不足していたりして進みが悪かった。納得するためにやっていることなので、わからないところが出てくるのは悪いことではないのだけど、数が多すぎると辟易とする。まぁ、ようやくTemporal Difference的な価値関数の学習も気持ちがわかってきたし、ちょっとずつだが進歩はしている。
結局、継続的に学習できるエージェントにならないと宇宙探索とかできないでしょ。あまり宇宙に興味が強いわけではないが、それができない知能を作っても仕方がないという気持ちもある。若干立場が人工生命側に近いところもあるのかもしれない。
英語が苦手なことによる選択肢の狭まりが鬱陶しく感じられてきた。予想より機械翻訳がどうにもなっていないし、観念するしかないのかなぁ。