20240108 - 日記

　今日はだいたい論文を読んでばかりの日だった。Transformerベースの世界モデル論文の間違い探しとか。

　しかし夜に見つけたBigger, Better, Faster: Human-level Atari with human-level efficiencyが普通に言っていることすごくて、Atari 100kベンチマークが解決された扱いになっているかもしれない。目をつけたときには終わっていた。

　ここ数年で強化学習ってなにが進歩しているんだろうというのがわかっていなかったけど、こうしてみるとかなりいろいろ発展しているな。自分の理解が浅かっただけだ。研究から離れていると進んでいるかどうかすらわからなくなってしまう。

　大学じゃなくても研究はできるはず、というのが最近の気持ちなので、なんとかやってみよう。

　頑張ってなにかゲームはやろうと、諦めてMHWに手を付けたが、キャラクターの言動と所作について気が合わなくて厳しい。これ2周目やるのは無理だな。挫折。