andante

2016-03-29

0328

昨晩はword2vecの説明を読んでから寝ました可能な単語すべてとのsoftmaxを取ると死ぬのでかわりにノイズとして選ばれた単語集合に含まれないことを要求すると高速になるみたいな話ノイズはランダムに選べば良いのかなへえ


お昼から仕事日本語OCRの現状を調査フリーで使えるソフトは基本的にぜんぜんダメなんだけどこれは前処理が不十分だからなのか学習が不十分なのかあるいは前処理と学習をちゃんとすればどのくらい改善するのかみたいなことがまだわかりませんそしてこれは実際やってみないとわからないんだろうなあうーむこれはたぶん泥臭いチューニング作業になる気がするうーむ


明日は病院定例なんかまた風邪っぽさが出てきている気がする嫌だな


もしかしたら会えるかもと思って公園に行ったらもしかしたら会えるかもと思って待っていた君がいてなんだそれ循環参照かよって言いながら一緒に帰るあそこの点線ってさどれキリトリセンのところで折ったみたいだよねああアスファルトのひびがってこと道路に書いてる縦ながーい文字でさキーーリーートーーリーーセーーンーーって書くのはさみの絵も書こうえーなにそれ書いてないキリトリセンのところにはさみの……なにしてんのチョキチョキグーあっじゃあグリコねそのペースで帰るの日が暮れるんじゃないかなあっ西に向かって進めば日が暮れるのちょっとだけ遅くなるよあっちって西なの西だよ

0329

昨晩もword2vecの説明を読みました一応全体構造はわかったけどなんで特にskip-gramこんなのでああいう性質の良い埋め込みが得られるのかはぜんぜんピンとこないなあと思いましたというか具体的な回帰の計算もよくわかってない気がするまあこの先はコードを


仕事の前に病院今日はとても空いてて誰もいなかったのですぐ終わりました調子はすこし良くなっているのかもしれないけれどまあそんなの何回目だよって感じだし

仕事は日本語OCRの調査領域検出も既存手法ではどうやらぜんぜんだめでこれは学習すればどうにかなるのかどうかぜんぜんわかりませんあとはCNNを使った手法の論文を読んだりしたけどこれはオーバーキルなんじゃないだろうかと心配になる既存研究の地図がぜんぜん描けてないのですごく的外れなことをやってないだろうかうーむ


普通に使ったつもりの言葉に難しい言葉知ってるんですねとか言われちゃうとちょっと疎外感を感じるそうだ僕は難しい言葉を使ってしまう人間なんだこうやって普通におしゃべりをしているけれど違う種類の人間だったんだ
まあ単に僕がナチュラルボーン頭が高い人間なせいでもあると思いますけれども会話はいつもマインスイーパ


今夜はアニメを消化しつつtensorflowを触るそのつつは不可能では