andante

4938

1022

Deep Q Networkがどうにか動きCartPole-v1で安定したスコアが取れるようになったいろいろ修正したけど結局は凡ミスで誤差項を二乗誤差にすべきところをクロスエントロピーにしていたのが原因だったやれやれ
これをいろいろ拡張していく必要があるわけだけどとりあえず一旦リファクタしようかなと思ういつまでもJupyter notebookだけで作業するのはしんどい


寝るぞ