0330
お昼から仕事。日本語OCRの調査など。商用のソフトだとこんぐらいできる、というベースラインはわかったのだけど、まずどうやってそこまで到達したものか悩ましい。泥臭いチューニングとかは嫌ちゅらよ。(でも、Region Proposal Networkみたいなものにサジェストしてもらうのは案外悪くないかもとか、Attention Modelのこととか)
明日は実験用に日本語文字列画像を大量生成します。とりあえず日本語Wikipediaのデータをダウンロードした。
ちょっと疲れている。睡眠時間が若干短いせいかもしれないし、水曜日ってのはそもそもこんなものだったような気もする。うーむ。