日記

日記です

2018-02-01から1ヶ月間の記事一覧

0228

大学 課題に対するやる気が本当に出ない。厳しい。 将棋ソフト開発 Bitboardで利きを持てば楽じゃーんと思う→飛び利きの重複を上手く処理できないことに実装してから気づいて爆死 正確な合法性判定を遅延させるの頭いい!→僕の実装ではむしろ遅くなる 強化学…

0227

これならわかる深層学習入門 10章をちょっとだけ読み進めた。終わりが見えない。 大学 課題を少しだけ進めた。今日は何か集中力がさっぱり降ってこなかった。 将棋ソフト開発 elmo絞りできている気がするけどできていない気もする。具体的には、0ベクトルか…

0226

大学 今日は輪講発表の資料作りと課題をやるのに時間をかけたので教科書は読めず。 将棋ソフト開発 厳しい。上手くいったと思っていたものが上手くいっていなかったようだ。 競技プログラミング ABC015のDを解いた。最初はこの前覚えたtupleでmapを奇麗に書…

0225

これならわかる深層学習入門 10章の続き。コントラスティブダイバージェンスの最小化、さっぱり式変形を追えず。難しいなぁ。それにしても10章長い……。 将棋ソフト開発 探索深さを関数に渡すときPLY倍してなくてひどいことになっていた。ひどい。僕の遅いプ…

0224

これならわかる深層学習入門 10章の続き。制限付きボルツマンマシン、かなり便利なんだな。コントラスティブダイバージェンス法がすごすぎたけどちゃんとした近似なっている理由の数式変形は追い切れなかったのでもう一度戻ってくる必要がありそう。 将棋ソ…

0223

これならわかる深層学習入門 10章の続き。ボルツマンマシンのところ理論が難しい。いやまぁボルツマンマシン自体というより近似手法の問題かもしれないけど。 将棋ソフト開発 バグが取れた気がする。後手番の時評価値反転させてなかった……。 競技プログラミ…

0222

これならわかる深層学習入門 今日は下宿先に戻ったりするので忙しかったのであまり読めなかった。 将棋ソフト開発 自己対局からの学習、評価関数を2つ使えるようになった(多分)。まだバグがある可能性の方が高いとは思う。 しかし時々なんか固まるなぁ。回し…

0221

これならわかる深層学習入門 10章の続きを読んでいく。ギブス・サンプリング頭良さそう。話の抽象度がわりと高いので何か上手いこと例を考えてやっていきたいなぁと思っているところ。 将棋ソフト開発 学習部のバグを取る取る。ちょっと回してみた感じだと上…

0220

これならわかる深層学習入門 10章のボルツマンマシンのところを読み進める。厳しい。式変形がさっぱりわからないぞ。 将棋ソフト開発 自己対局から学習できるようにできた。まだ学習式が間違っているかもしれないけど……。とりあえず一晩回してから検証してみ…

0219

これならわかる深層学習入門 10章を読んでいく。物理よりの解説でちょっとよくわからない部分も多い。うぇー厳しい。 将棋ソフト開発 自己対戦できるようになったので後は学習を書こう。これいちいち局面書きだす必要はあまりない気がするんだけどどうなんだ…

0218

これならわかる深層学習入門 10章の序盤を読んだ。グラフィカルモデル、あまりそうやる意味が感じられない。条件付き確率というだけではなくて? うーん。 将棋ソフト開発 教科書読むのに手間取ってしまったが無理やり進捗を生み出した。本当にちょっとでも…

0217

これならわかる深層学習入門 9章の後半を読んだ。LSTMとかGRUとか。ゲートが入ると複雑になって逆伝播とかちゃんと理解できてない。Seq2Seqは入力の表現をそんなに圧縮して良いものかとちょっと驚く。それでうまくいくものなのかー。 将棋ソフト開発 自己対…

0216

これならわかる深層学習入門 9章の前半を読んだ。RNNの基本辺り。しかし基本とは言っても普通に学習アルゴリズム難しいので完全に写経するだけになってしまった。通時的誤差逆伝播(BPTT)の方は多少わかる気がしなくもないけど、実時間リカレント学習法(RTRL)…

0215

これならわかる深層学習入門 8章の後半を読んだ。CNNの誤差逆伝播の理解がきわどい。実装しろと言われたら絶対にできない。空間計算量がめっちゃ必要そう? Adversarial Exampleに近い話が載っていて面白いなーと思ったけど、Adversatial Exampleの解説によ…

0214

将棋 千田-三浦戦は角換わり。後手の棒銀に対してもああいう受け方で大丈夫なのか。参考になる。やっぱり腰掛銀がさいきょーですね。とか思ってたら千日手になってて面白かった。千田六段の角換わりが2局も観れるなんてお得だぜ。まだ途中だから結果はわから…

0213

これならわかる深層学習入門 7章の後半と8章の冒頭を読む。 7章の後半は積層自己符号化器、デノイジング自己符号化器、収縮自己符号化器あたりの話。収縮自己符号化器の話がよくわからない。多様体のイメージがつかめてこない。縮小正則化が重み正則化とかス…

0212

将棋 棋王戦第1局を観た。永瀬七段の粘りがすごかったなぁ。96手目△4三角はすごい根性だし、148手目△3三香、164手目△3六歩とかこんな手をひねり出されたらたまりませんね。そういった追い上げを渡辺棋王が踏ん張り切って勝ったのは強さを感じます。 これ…

0211

大学 6章の後半から7章の頭、主成分分析のところまで読んだ。行列が入ってくると式変形が追いかけられなくなる。線形代数の記号的操作にもっと慣れなきゃいけない気がする。 競技プログラミング ARC056のBを解いた。うーん難しいなぁ。解説読まないとわから…

0210

大学 ひとまず重たい章を抜けたので今日明日はちょっと楽かもしれない。と思ったら式変形が意味不明でかなり苦しんだ。ひ~。 将棋ソフト開発 進捗なしです。 競技プログラミング ARC055のBを解いた。地獄のように難しい。こんなDPをサラッと書けるようにな…

0209

大学 やばい、とうとう目指していたペースから脱落し始めている。厳しい。 将棋ソフト開発 勉強すらちゃんとできてないのでこっちに手が回る余裕があまりない。 しかしdlshogiの山岡さんが本を出すらしいということで盛り上がってまいりました。発売日は3月1…

0208

大学 教科書を読んでいく。ギリギリのペースだなぁ。正則化の事情とか深層学習に向けて書かれているわけだけど、こういうのはコンピュータ将棋(の深層学習ではない機械学習)にどれだけ応用できるものなんだろうか。というか、なんかやっぱりコンピュータ将棋…

0207

大学 わりと大変なところに差し掛かってきてスピードが上がらない。ギリギリっぽいなぁ。 将棋ウォーズ しばらくはお休みかなぁ。 将棋ソフト開発 探索を改良してちょっと強くなった気はするけどこんなのでは全然ダメだなぁ。もっと大きくいじっていかないと…

0206

大学 勾配降下法あたりのところまで読んだ。微妙に知らないことがポツポツあるのでしっかり読んでいこう。 将棋ウォーズ 1局目は先手番。相手は相居飛車だけど一直線に穴熊を目指してきたので早繰銀から延々と攻めて勝ち。しかし詰みを見逃しすぎですね。や…

0205

将棋ウォーズ 1局目は後手番。相手は3手目7五歩、だけど角道止めてきたので普通の(?)三間飛車っぽい感じに。どうせなら早石田の乱戦やりたいのに。どう指せばいいのかよくわからないので適当に銀を2枚繰り出していって抑え込みにいく。上手いこと駒得になっ…

0204

大学 読む。今月中に読み切れるかギリギリのペースだ。 将棋ウォーズ 1局目は先手番。相手は雁木っぽい駒組だったので早繰り銀で攻めていく。上手く攻めていけたけど終盤ひどくてかなり焦った。本当に終盤力がなさすぎる。 2局目は後手番。相手は中飛車でき…

0203

大学 そこそこいいペースで読めてる気はする。 将棋ウォーズ 1局目は先手番。角換わりになって、相手は早繰り銀できたので腰掛け銀+6五歩の形で対応。棒銀に切り替えてきたので角打って牽制しつつの立ち回り。飛車を6筋に転換して成りこめたところは良くな…

0202

大学 毎日ちょっとずつ読んでいく。僕の確率論に対する理解が浅すぎて大変だ。 将棋ウォーズ 1局目は先手番。これで8連続先手番。うぉー。 角換わりっぽい出だしから横歩を取ってしまい、桂損くらいの局面に。しかし怪しく放った角を同角としてくれたので一…

0201

将棋ウォーズ 1局目は先手番。相手は中飛車だったので相振りへ。中飛車に対する相振りは結構有力な気がしているんですよね。飛車浮きで飛車先交換を防いできたので、中央を盛り上がっていく感じで指していこうと思っていた。しかし飛車先交換から飛車を引く…