andante

5651

1002

しばらく落ち着いていたSQLチューニングだが機能改修に伴ってさらなる改善が必要になってしまったなんとも悩ましい……


LLMの驚くべきところは世界や言語についてのモデルを手で組み込むということほぼなしに後続トークン予測のみの訓練によってそれらのモデルを獲得したかのようにしか見えない出力が出てくるところであろうたとえば天気予報は同じことをするのに大気の力学に関するモデルを手で組み込んでいると思われるがLLMはそうではないマルコフ連鎖人工無脳botのものすごい先にChatGPTができることを20年前は誰も予想していなかったのではないかと思う

世界に関するモデルがLLMの内部にどうエンコードされているのかそのようなモデルがどうやって自発的に構築されるのかそういった部分は今まさに探究が進められていることと思うそしてそれが理解できてしまえばそういう仕組みがあるからそういう振る舞いをしますという風に納得されるものなのだろうそしてそのような理解が得られたならヒトの脳に対してもその理解を適用することはある程度できるのではないかと想像する


寝ます