0609
コードレビューばっかしてた。Claude Codeをしばらく使い倒した結論、これまでとは格段に良くなっているが、やはりコードベースの規模が大きいと無理が出てくるなと思った。設計の工夫によって一度に見る必要がある範囲を狭めてあげるとかが有効なのか?(それは当然ヒトにも有益なのだが、どうしてそうなっていないのか?)
なんとなく秦谷美鈴さんのプロデュースに取り組んでいる。見た目はかなりかわいらしいなと思うが、歌は月村さんのほうが好きだな。ともあれいずれSSRを手に入れたい。
Appleが、LLMの推論モデルって言うけど全然思考なんかできてないよ、みたいな論文を出して界隈が盛り上がっている。やっていることはパターンマッチに過ぎないみたいな話を受けて、「人間もそうだよね〜」みたいな2周遅れくらいのことを嘯いている人が多いが、全然そういう話ではなく普通にパフォーマンスが低いという風に理解している。ハノイの塔のアルゴリズムをプロンプトで与えられてなおある段数以上は解けない(しかも与えられなかった場合と同じ程度!)というのは、確かにこいつ何もわかっちゃいねえなと思うのには十分だ。アルゴリズムはどのようなものを与えたのだろう(ちゃんと読んでない)。再帰的なのかそうでないのかは気になる。
ヒトも結局論理的思考なんてことはしておらず、たとえ話でしか理解してないだろうとは思われるが、それでも手順を与えられればどんなサイズのハノイの塔でも解けるだろう。じゃあ何が足りないのか。結局は汎化をできていないというだけなのか。ヒトはなぜできるのか。やっぱりヒトもできてないのか。
寝ます。