andante

1023

生まれて34年ほど経っているから月曜日を1700回以上経験しているはずなのだがいつも眠い新しい眠さがある何の話

仕事はGHA盆栽にようやく終わりが見えてくるというか盆栽なのでやりたければいつまででもできるのだがキリのいいところで次に移らないといけないそういう時期が迫っているというだけ

DQNの学習をTensorboardに表示するのは案外簡単にできたVSCodeがTensorboardをサポートしているので快適に表示できて嬉しいまあ表示して何がどうなるというものでもないのだが自己満足自己満足
明日こそはリファクタというか主要な部分をnotebookから脱出させたい


寝るよ明日は新居で使う予定のダイニングテーブルが届くどこに置けばいいんだ

1022

Deep Q Networkがどうにか動きCartPole-v1で安定したスコアが取れるようになったいろいろ修正したけど結局は凡ミスで誤差項を二乗誤差にすべきところをクロスエントロピーにしていたのが原因だったやれやれ
これをいろいろ拡張していく必要があるわけだけどとりあえず一旦リファクタしようかなと思ういつまでもJupyter notebookだけで作業するのはしんどい


寝るぞ

1021

昼から照明器具のショールームに行ったり打ち合わせをしたりした照明器具周りも考え始めるときりがない別に金に糸目をつける必要はないと僕は思っているが妻は思っていないので対立が生じ妥協する必要があるそんなにお金に困っているわけではないつもりなのだが……


寝ます明日は強化学習のやつやりたい

1020

今日はマンガ読んでただけだアドルフに告ぐを再読したこんなご時世だからということでTwitterに貼られていたので
火の鳥とかもそうだけどこういうのを読むと手塚治虫は決して伝説の偉人とかではなくて普通に同時代の巨人なんだなという気分になるまあそれだけの普遍性を持っているというだけの話ではあるのだろうが


寝るよ明日は照明器具のショールームに行く

1019

やめようやめようと思いながら夜更かしをする日々

強化学習というかDQNようやく簡単なものは動きつつあるあるが今のところ異常にガチャ性が高い学習が進む前にちょっとでも良い学習を得られないとすぐ諦めて何も分からなくなってしまうらしいもうちょっといろいろ試しながら理解を深めていきたいこういうものなのかもしれないそれでは困るのだが


寝るぞ

1018

あいかわらず眠いHHKBの新モデルにトラックポイントがつくという噂を聞いた10年前に出してほしかったという気持ちはある

仕事はGHA workflowの盆栽をやっているまだテストは微妙に通らないのだがとりあえず第一段階は目処が立った気がするあとはDocker Imageをどうするかだよねまあ明日もがんばる

夜はPythonを書いた本を見ながらCartPole-v1を書いてみたものの今のところ何も学習していないように見えるTensorboardに繋ぐ方法を調べて様子を見たい道は遠い


寝ます

1017

ねむねむい夜更かしが多い
価値関数やQの関数近似の理論的評価にはあまり興味がないどうせそんなの無視してディーープラーーニング先輩に丸投げするしかないのだ発散してから考えよう
パラメトライズド行動空間での強化学習というのがあるらしいDQNだと離散的な行動しか選べないし方策ベースなら連続パラメータで行動を選ぶこともできるのだがその組み合わせをいい感じにするとかこれは目的にマッチしていそうだ実装できるかはわからないが……
そろそろサンプルコードの写経にも入りたい写経っていうけど本はTensorFlowで書いてるところを僕はPyTorchで書くので移植だが


寝ます

1016

ねむい強化学習の本を読んでいるワンピース読むよりこっちの方が性に合ってるんだよなやっぱりいやワンピースも面白いけども
Q学習ってよくできてんな〜と思ったそろそろ手を動かしていきたいところ


寝ますよ

1015

リフォームの打ち合わせに行ったりカラオケに行ったりした壁紙の色はいくら考えてもしっくりこないがたぶんどうやっても一度は後悔するのだろうと思うとあまりこだわっても仕方がないのかもしれない本当か

あと電源系統の話もした帰ってからよくよく考えるといろいろ不都合あるなと思いあわててメールをしたりした手間を掛けさせて申し訳ないがこういう部分はいま決めておかないと禍根を残すので悩むのを許してほしい

強化学習の本を読んでいる理論の本とPythonで実装する本を交互に見ていると理論にもなんとなくイメージを持ちつつ読み進められるのでよいのかなと思ったそうでもないかも
しかしそろそろデータセットを作ることを考え始めないといけないのではないかと思うふうむ


寝ます

1014

PyTorchのチュートリアルを少し動かしたり強化学習の本を買ったのが届いたので読んだりしたFashion MNISTを全結合だけで解いても90%くらいは行くもんなんだと少し驚いたあと最適化はいまだにAdam現役なんだ

本のほうはゆっくり読んでいきます4冊も買う必要なかったかもしれないなまあいいや


寝ます明日はまたリフォームの打ち合わせ