日記

日記です

0308

大学

 10時から輪講。自分の発表はまぁ前回よりはマシだったんじゃないでしょうか。しかし自分がわかっていることをダラダラと説明するの、途中で飽きるのであまり得意ではないなぁ。

 他人の発表の方はスパース自己符号化器についてわからなかったところが解決したので良かった。やっぱりB4の人たち、専門のところについてはかなり強いっぽい。

 13時から先輩たちがなんか発表練習するというので見に行った。喋り上手いっすなぁ~と思いながら聞いたり。質問する人が強そうでほーって感じだったり。

 そのあとは『これからの強化学習』をちょっと読んで理解を深めた。方策を直接モデル化するっていう考え方がようやくわかってきた。コンピュータ将棋ではあまり主流ではないやり方ですよね。状態とか行動が連続値を取るとき利点が大きいとか書いてあったから、まぁそうなのかもしれない。でもAlphaGo系はあれDQNではなくてポリシーネットワークありますよね。まぁDeepだと話は違うのかなぁ。普通に(状態の)評価関数として使うと重すぎてダメ? まだその辺がよくわかってない。まぁとりあえず山岡さんの本が楽しみだー。

 そのあとはpythonの練習として3目並べを書いた。これで強化学習の練習とかもしてみたいけど、pyhtonやはり微妙になれないところが……。型をはっきり書きたい、変数をしっかり宣言したいなどの気持ちが。しかし今は新しいことにも挑戦していこうという気持ちなのと、まぁさすがにpythonくらいは書けた方がいいだろうなぁ。C++で書くのの2倍くらい時間かかった気がするけど、まぁここでC++に逃げていてはな。

 pythonの上手いコーディング~デバッグ~実行の環境が作れない。atomでコーディングして、scriptで標準入力なしの実行はできて、エクスプローラから開いて実行すればそれはそれで? あとはanacondaについてきた何かでデバッグみたいな? よくわからない。もっと効率的にやれる気はするんだけど。

 18時半ごろに研究室を出た。ちょっと残業ですね。まぁまぁ許容範囲。

将棋ソフト開発

 帰宅してご飯食べて競技プログラミングで苦しんだらあとは疲れて何もできなかった。厳しい。

競技プログラミング

 ABC020のDをなんとか通した。ほぼこれの写経になってしまって、ちゃんと理解できたかというと……。同じ問題をもう一度出されても解ける気がしない。どういう脳みそしてたらこれが解けるんだろうか。

漫画

月に吠えらんねえ(4) (アフタヌーンKC)

月に吠えらんねえ(4) (アフタヌーンKC)

 キャラクターがようやく掴めてきた感じがする。なるほどねぇ。現実離れした苦悩が、裕福な人の特権だというのは少しわかる気がする。結局僕も働いたこと(自分でお金を稼いだこと)がないのだ。そうでありながら一丁前に悩んでみせたりする。それはやっぱり楽しいことなんですよね。なによりも自意識の揺れ動きというものがこの世で一番面白いんじゃないかとすら思う。