0220
なんか今週は眠い。夜更かししがちなせいではある。
仕事は会議してたら終わってしまった。別に会議するのが仕事なんだったらもうそれでいいかなとも思うんだけど、残念ながらそうではなく手も動かさなければならない。どっちかがいい。
勝手にお金を稼ぐ猫3はあまり進まず。結局どの指標をどう使うかなんか僕にはなんの知見もないんだよなという感じ。全部機械学習でなんとかならんのか?まあそういうのはあとで考えるけど……。
寝ます。
なんか今週は眠い。夜更かししがちなせいではある。
仕事は会議してたら終わってしまった。別に会議するのが仕事なんだったらもうそれでいいかなとも思うんだけど、残念ながらそうではなく手も動かさなければならない。どっちかがいい。
勝手にお金を稼ぐ猫3はあまり進まず。結局どの指標をどう使うかなんか僕にはなんの知見もないんだよなという感じ。全部機械学習でなんとかならんのか?まあそういうのはあとで考えるけど……。
寝ます。
なんかr2dbcの不可解な挙動を踏んでいる気がするのだが、土地勘もないしそれらしいissueもないしで詰んでいる。とにかく再現コードを書くしかないのか。しかし困ったな……。
夜は友人たちと寿司を食べたりBTTF Part3を観たりした。1885年のドクが発明を続けていることに、なんというか頭が下がる気持ちがする。
寝ます。そこまで飲んだ認識じゃないのに頭痛い-。
5回目の結婚記念日(で合っているのか?つまり、結婚した当日は1回目の結婚記念日にあたらないのだろうか?)でした。たいしたことをするわけではないが、夜にはジェノベーゼパスタを作る習わしになっている。これは5年以上前になんとか料理をできるようになろうとして覚えたごちそうのメニュー、ということでそうなっているのだが、今となっては別に他にもいろいろおいしいレシピは知っているので、そういう意味での特別感はない。まあでも、そういうのもいいでしょう。
思えば5〜6年前まではそもそも料理というものをほぼできなかったのだった。それが今では(別に好きではないが)やろうと思えばそれなりのものを作れる。妻がいなければ間違いなくこうはならなかっただろう。人生における他者の役割。
勝手にお金を稼ぐ猫3は、とりあえず戦略の選択とアクションの決定までを実装した。具体的なロジックはChatGPTが決めたので僕は何も理解していない。そのうち全体をE2Eで強化学習させたいと思っているが、まずはルールベースで動かしてから考えたい。明日には再始動できるといいなと思う。
「リバー、流れないでよ」を観た。まあなんか綺麗にまとまってたけど、特に深い感動とかはなかった。序盤はなんかマルチプレイのOuter Wildsみたいだなと思ったが、それはループもの一般に共通する気はする。でも複数人でやるのは比較的珍しいか?いや普通に「エンドレスエイト」がそうか(方向性は似てないけど)。夏休み、終わらないでよ。
寝ます。3連休なんだ、嬉しいな。
夜更かしからの寝不足をリカバーできずに眠かった。勝手にお金を稼ぐ猫3は一応再始動したが、相変わらずじわじわ損をしている。まあこれは手数料の問題なので改善の余地はある。
今はルールベースでやっているが、これをMLに置き換えていく方法も考えなくてはなるまい。でもそれは先にデータを取ってからかな。
寝ます。
眠かった。勝手にお金を稼ぐ猫3の実装は少しだけやった。一部のデータをDecimal型で持つようにしたり。あと状態遷移を整理したらいい感じにまとまりつつある。それの実装はまだしてない。
状況をモニタリングできるようなTUIもつけようかなと思っているが、後回しになっている。本当はWebサーバーを立ち上げるのが一番いいだろうとは思うけども。でもそれは認証とか考えることが多いよな。もっと先。
「12人の優しい日本人」を観た。元ネタと逆にしてたり、展開は面白いな〜と思ったけど、そこは別に論証しなくても推定無罪でいいんじゃないのと思える場面も多かった気がする。そもそも陪審制ってものがよくわからんよな。この議論は法廷ではやらなかったの?とか。
あと室内でみんなガンガンタバコ吸ってたのが時代を感じる。1991年だから僕が生まれたのよりは後だけど、まだそんな感じだったんだな。
寝ます。
なんか睡眠大失敗して眠かった。なんだろね。
仕事は何をしていたかな。なんか会議多かった。そうだ、Claude Codeを触る会があったので見ていた。ターミナルで動くのは自由度高まって嬉しいし、Devinのようなエージェントからの使用も視野に入れているのだろう。でも僕は人間なのでターミナルで長々diffを見せられてもよくわかんないので困る。
そう、Claude 3.7が出た。コーディング性能は伸びているらしいけど、いくつか個人的によく使うベンチマークを試した感じだと、一般的な質問に対する応答の性能はそれほど高くない。ただClaudeは3.5の時から謎にコーディングが上手いという評判だったから、その方面で真価を発揮するのだろう。
Clineもさっそく対応したから勝手にお金を稼ぐ猫3の修正をやらせてみた。みたが、長すぎるファイルを作ろうとして繰り返し失敗するなどお茶目な面もあった。何だろう。設定が悪いとかか?ちゃんとファイル分けてねと言ったらそのようにしてくれたが、まだ内容は見てない。指示を理解する能力は高そう。
Claude Codeは自分ではまだ触っていない。Clineと違って自分ではヘッドレスブラウザを起動したりはできないが、Androidエミュレータを自分で起動してスクショ撮るくらいはできるようだ。やっぱりそこのフィードバックループを自分で回せるようになると強いからね。今日はうまく動かなかったが期待。あとMCPのエコシステムもそろそろ何か触ってみないとな。
寝ます。
Claude 3.7にポケモンをプレイさせている様子が配信されているのでボンヤリ流し見している。どういうアーキテクチャになっているのかはよくわからない(画面は画像認識をしていて、それに加えてRAMを直接見ているみたい?)がとりあえずノロノロ動いている。開始から丸一日で現在はおつきみやまをうろついている。僕も初見の時はずいぶん迷ったものだが、こいつは何時間で抜けるか。
ダンジョン探索や戦闘は下手だなと思う。これはClaudeの限界というよりはシステムで改善できそうな気もするが。たとえば、トキワのもりでは出口まであと一歩のところで同じ場所を何時間かぐるぐる回っていたし、プリンに眠らされて手も足も出なくなって全滅するのを2回は繰り返していた。過去の経験の反省と、行動の結果の予測ができないのが問題のように見える。それはプロンプトと長期記憶でなんとかならないだろうか。コンテキスト長的に厳しいか。
コメント欄はけっこう盛り上がっていて、ちょっと賢い選択をするとすぐ「AGI!」という掛け声がかかる。最近だと戦闘中にきずぐすりを使って回復したらAGIだった。きずぐすりもいいけど、眠らされるのわかってるんだからちゃんとねむけざましを買っていくべきなのだ。
仕事は引き続きr2dbc(正確にはそのpostgresqlアダプタ?)の怪しい動きと格闘している。これはどうもissueを書かねばならなさそうなんだけど、最小コードをどう作ればいいのか難しい。別に難しく考えなくていいのか。SpringBootとかそういうのは全部無視して。それでいいなら明日やるか。
寝ます。明日は通院で朝早いんだった。やれやれ。
寝不足だった。
r2dbcの怪しい挙動を再現しようとして最小コードを作ったが、案の定再現はしなかった。まあこんなシンプルに壊れてるものがリリースされてることはないだろうと思うから、これはまだ準備段階でしかない。それにしてもKotlinというかGradleは体験が良くないなと思った。いや、なんかあんまり知らないのにレバガチャしてるほうが悪いのかもしれないが、起動してDB叩いて終了するだけのコードくらいレバガチャで動いてほしいという気持ちもある。
仕方ないので次はKomapperも含めて実験をする。それでダメだったら……?それはまだわからん。でもそれなら少なくともこちら側の問題ではあるから、直すのもそう難しくはないかもしれない。
勝手にお金を稼ぐ猫3、Claude 3.7に改修を任せたんだけどなんか思ったようにはうまく動かない。こいつも引き継ぎ苦手なタイプなのか?仕方ないので自分で書くことにしたが、まあややこしいので大変だ。コーディングAIに慣れるとよくないね。
実際自分でコードを書くのはどんどん億劫になっていて、それは多少自分のアイデンティティに揺さぶりをかけてはきている。元々そこまでコードを書くのが好きというわけではなかったが、苦だとも思っていなかったから、書かなくて済むなら書きたくない自分に気づくのはすこし驚きがあった。老後の趣味にするつもりだったのだけど、その前に飽きるのかもしれない。
それはそれとして、この速度が出せなければプログラミング一本で食っていくのは難しくなるのかもしれない。まあ、一説によればちょうどプログラマーとして定年になる歳でもあるから、かえって好都合なのかもしれない。
寝ます。