andante

2016-04

0411

中国の役人にガスコンロの掃除が面倒だから料理をしないという男がいたそうだよことわざコンロを無視してIHを置くの語源


朝起きて病院五分の診察のために二時間半待つのはさすがにちょっと溜息という感じですがまあ仕方ないなあと理解はしています予約じゃないしね

待合室で本を読んでいたら思ったほど体調も悪化しなかったので結局会社には行きました次なにしようかいろいろ考えられるくらいには元気だったし今日は読書がはかどった

仕事は先週うまく動かなかったモデルのパラメータを変えたりBatch Normalizationを挟んだりして調整あと良かれと思ってConvolution層を減らしてたんだけどむしろその方がFC層との接続の重み行列が巨大になってメモリを圧迫することに気づいたのでそれを戻したりやれやれこれだから素人さんは困るんですよゆっくりゆっくり進み始めていろんなsparsityが動いたり動かなかったりしているのだけどまあバッチサイズが16とかなので一晩かかるでしょう今日はあとはtensorflowのopの実装方法を勉強したりしましたC++なー


もう画像生成といえばDCGANと言っとけばいいだろ的な気持ちで言ってるのですがGoogle Mapsから適当な地図写真じゃないほうがいいかもをたくさん取得して架空の地図を生成したら楽しいかもしれないと思いました宇宙人が地球人を捕獲して観察するためにこしらえた架空の擬似街あっこれいないときに来る列車


この話は本当にただの連想ゲームでしゃべっているのであまり深く考えないで欲しいのですがなんて予防線はいらねェだって全部そうだろ
ライムンドゥスルルスのアルスマグナと易経は似ているかもしれないし畳み込みNNの最初のほうの層にシンプルなパターンが現れるのは深層心理における元型に似ているのかもしれない


無理なご乗車は不可能です

0412

具合はあまりよくないたぶん先日の体調不良はだいたい回復したのだけど新しく出た抗生剤がよくないような気がするふーむ


仕事はあまり順調ではない昨日走らせて帰ったモデルはあまり学習が進んでおらずどうも画像の前処理に失敗していた気配があるのでそのあたりを修正してもう一度やれやれ横着せずにちゃんと出力を確認してからやるべきだったのだ
あとVGG16の学習済みモデルをばらばらにして使いたいとこだけ使う実験とかもしましたこれはうまくいったので安心問題はちゃんと移植できるかどうかなんだけども
ところでFCLNというlocalizationモデルが提案されていたことを今更知りましたこれ論文はキャプション生成の話だけどこっちのほうがFaster RCNNより性能いいのかなRoI Poolingを微分可能にしましたみたいな話のようだけどいまいちピンとこない時間があったら明日もうちょっとちゃんと読む


そろそろ自分のプロジェクトにリソース割かないといけないんだけどにゃあ今夜はちょっと進められたらよい

0413

昨晩は……記憶が無いけど……まあいいや……


仕事はあまり順調でない文字認識を学習させてるニューラルネットワークを試してみたら文字数は合うけど文字はぜんぜん合わない私は数を数える機械を作っているのではないのだよ
まあまだlossは減り続けている遅くないのでもうちょっと待ちましょうや

とはいえ文字認識についてはこれは市販のライブラリとか使っちゃうのが実用上は一番正気っぽい気はする


今夜は新幹線の予約を試みようかなゴールデンウィークに帰省するかもという話で帰って何をするかというと特に予定はなくせいぜい散歩かなと思うのですがまあなんというか十日間も無計画に家にいると時間はあるのになにもしないみたいな最悪の過ごし方をしてものすごい自己嫌悪に陥りそうなのでせめて非日常に身を置けばマシかという期待あってのことです意味あるかは知らんあとは実家の母にそろそろ新しいパソコンを買わせねばなるまいとか


今夜こそはtensorflow触るぜ

0414

大きな災害があると疑心暗鬼と道徳自慢の悪魔合体がメディア気取りで跳梁跋扈してちょっとしんどい気持ちになる


昨晩は久々にちょっとやる気が出たのでTweetを分かち書きして語彙に番号をつけて数字の列にするコードを途中まで書きましたこれを何らかのword embeddingに食わせてそこからDCGANに投げることになるはずですたぶんword embeddingは$N-1$次元になって残りの1次元は空白の表現に使う$N$次元表現を幅1pxの$N$チャンネル画像と見立てて畳み込みをするでしょう縦は1postあたりの最大語彙数たぶん100くらいに制限しますそれより短いものは中央に寄せて上下を空白にします$N$がどれくらいになるかは未定

今日はあまり具合が良くないどう良くないというのも難しいのだけどただ疲労している肩凝りがひどいのかもうーん


セイヨウサシミタンポポ学名: Taraxacum sasimiumキク科タンポポ属の多年生植物
元々ヨーロッパを中心に刺身のつまなどに用いられていた[1]が
日本でも戦後に持ち込まれて以降急速に普及し
現在では刺身のタンポポといえばこちらを思い浮かべる人が多い[要出典]
日本在来種に比べるとやや小型なのが特徴で色合いもわずかだが黄色が強い

0415

昨晩も分かち書きと語彙表作成をしていましたPython慣れない


仕事は挫折結局文字認識は無理そうまだ試してはいるけど帰り際に走らせた計算がさっき見た感じ発散しているので明日ちょっと行って直そうかなと思う勾配のクリップを入れるだけだしすぐでしょうしかしなんで急に発散しているのか不明なのが気がかりだはー憂鬱


明日はまた散歩に行けたらいいなと思う今夜はword embeddingまで進めたらと思ってたけど帰ってくるの遅かったし明日会社も行くんだったらあんまり遅くまで作業してたくないよなとかふうむ

0416

昨晩はTweetコーパスを分かち書きしてSwivelアルゴリズムに投げるところまでやりましたPython3を最近ようやくたどたどしく書き始めたところなのにPython2のコードを3に修正するとかなかなか厳しいでもtensorflowをPy3環境にインストールしてしまったからPy2には戻れないふーむ


お昼過ぎに起きてちょっとだけ会社で作業しました勾配のクリッピングを入れて再計算でもやっぱりまだうまく動いていない気配がありますこんどは勾配が小さすぎたりあとどうもweight decayは省いた方が良かったような気もするうーん難しい

その後三時間ばかり散歩しました14キロ歩いたらさすがに疲れた


今夜はDCGANの実装まで進められたらいいけど期待はしない

0417

昨晩はtfでモデルを書き始めたけどやっぱり微妙に不慣れなので進みません特にgeneratorとdiscriminatorを別々に作って独立にパラメータ更新するところとかこれまで適当に任せてたところをちゃんとやらないといけない感じで難しい


今日は特になにもしていませんヤマノススメ一期がAmazonプライムで観られたのでぼんやり観ましたそういえば二年半くらい前に高尾山登ったっけなぜんぜん記憶が無いけど


調子があんまりよくない元気がないうーむ

0418

昨晩はDCGANのモデルを書いていました一応たたみ込んだりするところはできたのだけどdiscriminator二回走らせたらグラフが二つになって変数は共有してるにしてもあまり格好良くないので一度で済ませられるように工夫するつもりです


具合はあまりよくない明日は社外の打ち合わせに同行するらしい二年ぶりくらいだから緊張する

0419

昨晩はdiscriminatorの周辺をちょっと修正してとりあえずグラフ的には正気っぽいコードになったところまでで寝ました今夜は実際のデータを流すところまでやりたいんだけどできるかなあ


お昼から仕事社外打ち合わせなんで僕を連れてくんですかって訊いたら雰囲気を出すためみたいなことを言われたので僕はもしかしたら人間よりも間接照明に近い存在だったのかもしれないと思いました思っていません雰囲気は出しました名刺交換くらいでキョドるのはさすがになんとかしたいよね

あとFaster R-CNNのtf実装を検討していますできればC++書きたくないんだけど少なくともNMSは必要だしRoI PoolingとかあとSmooth L1 Lossも必要でしょうそういえばFCLNのRoI Poolingって何がどう微分可能なんだっけ勉強が足らない


具合は昨日よりちょっと良くなっている気がするけど単に朝風邪薬飲んだからかもしれない

0420

昨晩はtext-dcganを書いていました一応動かせるところまで来たのだけどなかなかgeneratorが学習してくれませんcross entropyが50とかになってるのなんか壊れてるんじゃないのかなふーむ


仕事は難航FRCNNの実装なんだけどいざ書こうとしてみると理解があやふやなところとかいろいろ出てきたのでまたソースを復習したりとりあえずproposal部分はNMS以外はpythonで書けそうなんだけどNMSは無理でしょうまあ元実装のコードを参考にしつつ明日がんばるつもり
ところでOCRのほうは完全に諦めムードまあしょうがないよね


今夜はtext-dcganを応援しつつ本でも読もうかなちょっと疲れているから早めに寝るよ