大学 9時過ぎに研究室へ。午前中は回しておいた実験結果をまとめて、あとはボーっとしていた。 午後はミーティングのあと、強化学習について調べていた。Actor-Criticの気持ちがちょっとわかった気がする。これはDeepの評価関数を触っていたおかげかなぁとい…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。