20230429 - 日記

　家から一歩も出ない休日。

　あまりプログラミングは進まなかった。調子が出ない。もっとやれると心では思っているのにやれていない。

　そもそも大規模C++プログラムのコーディングをするのが久しぶりという話もある。ここ最近ROS2 launchのxmlやらPythonやらの謎のものしか触っていなかったし。

　なんか娯楽時間を無理やり作った方が良いのか。

　競プロでレート落ちてもどうでも良いと思っている時期なので、それ自体が良くないという話もありつつ、まぁ精神的なダメージは薄い。

Football players can tackle, get up, kick and chase a ball in one seamless motion. How could robots master these motor skills? ⚽

We trained AI agents to demonstrate these agile behaviours using end-to-end reinforcement learning.

Find out more: https://t.co/LkYtaMeUEd pic.twitter.com/23LE1z0hAX
— DeepMind (@DeepMind) 2023年4月28日

　DeepMindの強化学習でもまだこのレベルなんだなぁと思うと先は長い。報酬関数の変な作り込みは結局汎用性がないのでダメだろうし。

　メタ認知（という言葉が適切なのかはわからないが）に期待しているところは報酬（サブゴール設計）ではある。階層的強化学習全然流行らんが……。

　メタ認知に自然言語は必須ではないが、メタ認知が上手くいっているかどうかを確認するのに自然言語で喋らせるのが人間にはわかりやすいのでそういう戦略が取られることはあると思う。

　まぁなんにせよムズいです。