AlphaZero的(というか経験リプレイを入れただけ)な実装にしたら、多少は学習が安定するようになったかな~という感じ、また明日見てみないとわからないけど。 提案手法はやはり弱そう。分析的な感じでなんか書けるかなぁ。 そういえば将棋ソフトの方を久しぶ…
引用をストックしました
引用するにはまずログインしてください
引用をストックできませんでした。再度お試しください
限定公開記事のため引用できません。