andante :: 2023-11

1031

モデルの構造をちょこちょこ調整したり、スナップショットを保存できるようにしたりした。MP-DQNは実装例を見つけたので読み始めた。

なんか調子が悪い。風邪の3歩くらい手前にいる感じ。明日は引いてるかもな。はあ。

1101

GitHub Actions盆栽の第一弾は完了したので一仕事終わった感。時間を掛けすぎたなと後悔している部分もあるけど、まあ見通しはかなりよくなったのではないかと思う。僕の理解度が高まったからそう見えているだけの可能性はなくはないけれども。

勝手にお金を稼ぐ猫は、ネットワークが重たくなったので学習が遅い。2021年は何もしなくても勝手に値上がりしていたのでバックテストとしては不向きということがわかった。2022年はけっこう下げたので今はそっちで試している。これはちゃんと確かめたわけではないのだけど、2021年より2022年のほうが若干成績がよい気がしている。2021年は全体的に高値で推移しているために学習データから外れてしまっているのかもしれない。正規化が必要だなと思った。
アーキテクチャについてもまだいろいろ試行錯誤したい。ChatGPTと議論していて、Transformer試してみる？という話になっている。あと、直近の値動きだけじゃなくもっと長時間スケールの値動きも取り込みたいが、異なる時間スケールに属するデータをいい感じに取り込む方法は難しい。アテンション機構に入力できたらいいんだろうか？位置エンコーディングをいじるのもアリか。

寝よう。これ今月のAWS料金は結構面食らうことになるかもな。

1102

眠い。Transformerの実装をしようと思ったけど眠くてできず。あと、観測データの正規化をしようと思ったんだけど雑にやったら利益が計算できなくなってしまった。ちょっと考え直さないとだめだ。

寝ます。明日はなんか焼肉に行く。

1103

朝（昼）に起きたら目まいがしてどうにも動けないので3連休の予定は全部キャンセルで寝ることにした。去年の夏にもこんなことになっていたように思う。明日の朝一で耳鼻科に行く。

1104

朝起きて耳鼻科に行った。1年半前と同じような検査をされて、まあ同じようなことではないかと示唆されるのだけど、ちょっとだけイレギュラーな点があるので念のためMRI撮らせてくださいと言われた。まあ片頭痛関連でもそろそろ撮っておいたら？と言われていたし、じゃあ撮りますということで撮りに行った。指輪をしたままで撮ると指輪が少し振動することに気づいた。発熱とかはしていなかったと思う。

薬を飲んだり寝たりしたら少しだけ気分がよくなってきた。48時間ぶりに固形物を食べた（うどんだけど）。

寝ます。明日はもうちょっと元気になりたい。

1105

具合はずいぶんよくなったように思う。まだ少しふらつくことがあるし、気分が悪くなる時もあるし、元気もあまりないが、食事はそこそことれるようになってきた。明日はかなり元気になれるのではないか。
それはそれとして、この数日異常に暑いせいか体温調節がバグっている気配がある。こういうのが堪える歳なので、やめてほしい。

Transformerの学習を始めた。薄々知ってはいたがこれはかなり金の掛かるモデルだ。レイヤーが少ないとLSTMほどの成績も出ていない気配がある。まあ、まだわからないが。GPU計算の効率はよいらしく、80%台の使用率で動かせている。別にそれが高かったらどうだということもないのだが、せっかく高いインスタンスを借りてるんだから活用できないと勿体ない。

はあ、この三連休ぜんぜんいいことがなかった。高級焼肉も食べそびれたし。まあ、MRIを撮れたのはいいことにカウントしてもいいかもしれないけれど。しかも来週は普通に五連勤だしな。やれやれ。

1106

Transformerの学習がゆっくり進んでいるが、今のところそれほど成績が良くはない。εの減衰をもうすこし遅くしたほうがいいかもしれない？バックテストでは一応プラスの成績を残すのだが、もう少し稼いでほしい（欲！）。
MP-DQNの実装を読み始めたが、他にも色々なテクが使われているようなので難儀している。あとPolicy-Gradientが普通にわかってないなという気もする。ふうむ。まあゆっくりやります。

寝ます。

1107

MP-DQNの実装はすこし分かってきた。細かい部分は謎があるけど峠は越えた感触がある。ただ、著者実装なのに変数名が論文と食い違っている気がする。それはQを返してるんだからActorじゃなくない？動けばなんでもいいんだけどさ。
週末くらいには実装できたら嬉しいな。無理かな？

寝ます。

1108

ひどく眠い。それは当たり前で夜更かししてるからである。やれやれ。

コードレビューが長期間続くと疲れる。

MP-DQNの実装、かなり読めてきた。気のせいかも。明日は実装始められるか？
それより、バックテストの実装が間違っていて、下落場面での成績が思ったよりだいぶ悪いことがわかった。うーむ。
あと分布強化学習も実装したいのよな。リスクの大きさを判断に取り入れたい。これもまた調べないと。

寝ます。なんかおなか痛いな。ガパオライスが辛かったせいかな。

1109

なんだっけ。なんか昨夜はちょっと早めに寝た。今朝は早起きできたというわけではない。

軽い気持ちでlinterを換えようとしたんだけど、思いのほか考えることが多く、断念しそう。こんなことしてる場合じゃないしね。

道徳規範には普遍性が必須だというのは広く信じられているし、実際そうであってほしい、そうあるべきだ、と思うけれど、最近はそこにやはり多少の「遠近法」を入れてもいいのではないかと思うようになった。遠く（地理的・時間的・心理的）の出来事を、近くの出来事と同じように価値判断する必要はないし、結局無理だろうと思う。その時に、その整合性にこだわったり、整合性がない相手を非難するのは、正しいことだとは思うが、やっぱり善いこととは思わない。いや、おかしいじゃんと面と向かって言うくらいは別にいいけど、だから相手の道徳規範全体に破綻があると見做すのは、慎重になった方がいいと思う。
インターネットの時代にあって、遠くの出来事も瞬時に目に入り、それを話題に議論することも増えてきたけれど、結局自分たちは「遠くの人々」なのだ、という風に考えて、そういう遠近法の存在を認めた方が良いのではないか。そうすることで、近くの問題に対してよりよい（一貫した・共存しやすい）価値判断をできるようになることもあるのではないか。そして、それが道徳規範というものに本当に求められていることだったのではないだろうか。

寝ます。ちょっとだけワンピース読もうかな。