1106 Transformerの学習がゆっくり進んでいるが、今のところそれほど成績が良くはない。εの減衰をもうすこし遅くしたほうがいいかもしれない?バックテストでは一応プラスの成績を残すのだが、もう少し稼いでほしい(欲!)。MP-DQNの実装を読み始めたが、他にも色々なテクが使われているようなので難儀している。あとPolicy-Gradientが普通にわかってないなという気もする。ふうむ。まあゆっくりやります。 寝ます。