andante

2016-03

0321

また操作ミスって日記が消えた悲しいやっぱり下書き自動保存くらいつけておくべきなんだ


昨晩は文章生成LSTMをGANに無理矢理ねじ込んだのだけどまあ案の定動きませんでした動いてはいるけど芯芯芯芯芯芯芯芯芯芯芯しか言わなくなってしまってお前はそんな文字列が僕のpostと見分けがつかんと抜かすのか阿呆めと思いましたまあ僕がLSTMをよくわからない自己流で使うのがいけないんだと思う
機械学習は試行錯誤が時間掛かってしょうがないですねまあchainerが遅いという話でもあるのだと思うけれど


今日は自然言語処理に畳み込みNNを使う論文を眺めたりしました語彙の表現にはword2vecなどを使うと次元が抑えられて良さそうCNNならGANが安定する条件についてDCGANの論文が調べていたはずだからこれならDCGANに載ってくれたりするかもしれないとちょっと思うそんなうまい話があるかいなとも思うふうむ

なんにせよchainerは遅いらしいので今夜はtensorflowをインストールしていますまあchainerの手軽さは偉大だけども


さて三連休も終わり微妙に具合が良くないので早めに寝る常套句

0322

昨晩はtensorflowのチュートリアルを読んだりしました


お昼から仕事PythonとCaffeで書かれたモデルのコードを追いながら構成を理解してゆく作業論文は一応読んだから理屈はもうわかっていても実装はまた別のわかりが必要とされる感じがあって骨が折れますCaffeのモデル定義はレイヤとBLOBに同じ名前をつける慣習があるらしくしばらく悩んだ

あとはRasPiのセンサ入力をHTTPで送るコードを書きましたせっかくSwift入れたしSwiftで書きたかったけど生のsocketとか触ったことないしlibdispatchも使えなくてNSThreadだけでどうこうするのはつらそう今日のところはrubyで済ませておきましたrubyはいつになってもうろ覚えのまま書いているせいで初歩的なところではまったりしました


就活競争倍率が高いというだけで謎の価値観に最適化しないといけないみたいな雰囲気が出ているのが本当に不健全だと思うし雇う側までそんな価値観に最適化させないといけないみたいな雰囲気があるのではと思う本当に不健全だと思う悲しい風習だ
そう考えると大学入試が基本的にはペーパーテストなのは良いことなんだろうと思うそうでなかったら高校生もなんだかよくわからない祈りの動きを競い合ったりするのだろうか


コミュニケイションにおいて気持ちを考えるというのはまったく無意味な行為であるように思える気持ちがわかるという現象は確かにあるしかしそれは気持ちを考えることが可能であることを意味しない気持ち計算というものが機械的に行えない以上すでにわかっているものの組み合わせしか想像することはできない
きっと必要なのは表明し問いかけることなのだもちろん言いたくないこと聞きたくないことというものは存在しそれを察し察されることは存在するそれはなにかの能力というよりはちょうどよかったというような偶然と必然との中間に浮かぶようなものに近いのではないかと思うだからそれがあったときは安堵の溜息とともに感謝しなければならないだろう

0323

昨晩はたいしたことをしなかったようなtensorflowの雰囲気はわかってきた気がするけどコードを一行も書かずにそんな風に思うことの愚かさよ


お昼から仕事Faster R-CNNの理解がだいぶ論文とコードとで一致してきましたあとは具体的な学習プロセスを理解して再現を試みればこの方向はとりあえず打ち止めでよいでしょうまあ実際に教師データを蒐集するという難題があるのだけど

今夜はtensorflowでLSTMを書くにはどうすればいいのか調べようかな


痛いの痛いの飛んで行けというまじないがあるが僕の痛みは常に僕の痛みなのであって他人の痛みではありえないのだから仮に痛いのが飛んでいったとしても飛んでいった先が痛むというだけなのではないだろうか


気持ちを考える気持ちを慮るなどの文章に表れる気持ちというのはたとえば不利益を被ったら怒っても良いというようなルールに従う概念ゲームの駒のようなものでこのの中の色彩めいたものとはまったく関係がないのだろうと思う野球の点数にも似ているそしてこのような指摘はナンセンスである野球の試合中になぜ点数の高い方が勝ちなのだろうかと問うような無意味さ

0324

昨晩はOCRの現状をいろいろ調べてたら遅くなってしまったのでなにもできていませんOCRの現状はよくわかりませんでした活字スキャンでラテン文字ならほぼ問題ない品質になっているらしく最近の流行りは街中を撮った写真などから看板の文字を読むことのようですが日本語や縦書きへの対応はどうなっているのだろうよくわかりませんまあarxivで読める範囲でしか見てないけども


仕事はとうとうAWSで環境構築Amazon Linuxが予想外に縛りプレイだった入ってたCUDAが古くて結局ドライバからインストールし直したので一日掛かってCaffeが入るところまでしか到達できませんでしたマジかよ
Caffeが入ったので一応ほとんど完了なんですけどこの先もなにかインストールが発生するたびにこんな感じだと非常に厳しいのでプレーンなUbuntuに替えてもらうことになりそうです一日を完全に無駄にしてしまった……論文はちょっと読み進められたここまでのところは最短手数で理解を進められている気がするけどここからはもうちょっとじっくりと見聞を広めてゆかないといけない気がするなあとOCR


今夜こそtensorflowと思ったけどもうこんな時間じゃん小一時間くらい

0325

人工知能がヒトラー礼賛語呂が良すぎるしこれこそが人工知能の成果なのではないだろうか

人類がもしほんとうに囲碁の評価も覚束ないような有様なのだとしたら人工知能の道徳と対決しなければならない日も遠くないのではないだろうかそうか


昨晩はTensorFlowのチュートリアルをちょっと読みましたChainerと違って徹底的に計算グラフを先に構築して後からデータをバインドするという形になっているので慣れるまでちょっと混乱する


仕事はUbuntu環境整備UbuntuはUbuntuで多少変則的だったようですがそれでもapt-getで諸々入るのでずいぶん楽でしたmacのvagrantで動かしたら50秒掛かった処理が0.5秒で終わったのでGPUすげーと思いました
ただCaffe+Pythonは並列処理ができないらしいのでせっかく4枚も積んでるのに1枚しか動かせていませんこれはよくないとりあえず安い方のインスタンスに乗り換えることになりそうですがちゃんと並列計算する方法を検討する必要がありそうですPythonで書かれてるレイヤーをCaffeに移植するとかかなあそれはできればやりたくないのだけど……

あとRasPiでトイレの個室の占有状態を検知するプロジェクトを進めましたついに物理層へ進出です無線LANが不安定とかいろいろ問題はあるのですがとりあえずそれっぽく動かすことはできたので今日から我が家もIoTだなという感じでしたフムン


さて週末実は明日も明後日も出掛ける用事があってなんか忙しい明日は母が上京してきて墓参りに行くのについて行きます会うぜ母親参るぜ墓

0326

昨晩はニューラルネットワークのフレームワークをいろいろ調べてたら遅くなってしまいました今の時点でそんなに気にする必要はないんだけど遅すぎたり使いづらすぎたりするとさすがにつらいのでそこは回避したいという思いですluaを覚える時間的余裕があればTorchとか良さそうなんだけどそれは一旦妥協してtfかなあと思いますC++はできれば書きたくない
パフォーマンスというとMicrosoftにはCNTKという子がいて彼は並行処理のオーヴァヘッドが異常に小さいらしいのですがそれは1bit SGDという手法で実現されているようですこいつのことはちゃんと読んでないのだけど伝達する勾配を1bitまで量子化してしまっても差分を次のターンで送るなどすれば長期的にはほとんど影響がないという話なんだと思う信号処理でも同じような手法が使われているらしいけどよくわからないディザリングアルゴリズムでそういう感じのがあったと思うけど同じなんだろうか


お昼に起きて上京してきた母と先祖の墓参りにゆきました僕は中学一年で祖父が亡くなったとき以来だと思っていたのだけど大学の入学式の後にも来ているらしい記憶にない将来はあなたがこの墓を継ぐのよと最近よく言われるのだけどできればそんなのやりたくないでも墓にお金を掛ける気持ちは最近ちょっとだけわからないでもない気はしてきた卒塔婆を追加購入して墓に設置していたのが課金アイテムみたいでおもしろいなと思いました死んでなお墓の豪華さで競争しなければならないんでしょうか

せっかく休日に外に出たので電器屋でデジタルペーパーの書き味でも試すかと思ったのだけど発見できず横着しないで秋葉原まで行けばよかったかな


明日はßとその友人と花見に行きます花がどうなってるのかは不明まあ別にそんなのは些細な問題なんだけども


http://www.cast-japan.com/gigamic-quarto/
おもしろそうなボードゲームWebでちょっと遊べておもしろかった遊ぶ相手いないけど

0327

昨日はTensorBoardを動かしてみていましたこれ画像データの可視化とか損失関数の変化が出たりするのはとてもよいんだけどネットワークグラフが出るのは使いかたがいまいちよくわからない


早起きしてaとßとその友人と花見をしました花はたいして見なかったけどあまり咲いてなかったので複素多様体のモジュライ空間について教えてもらいましたモジュライって言葉の響きが好きなのでモジュラーイ気になっていたのですが定義は知らなかったのでよかった
aは数学をやっているので数学に関する話題のいろいろを知っていてとても楽しい僕はそんな風に何かに特化することができなかったなあとちょっとだけ心が疼く最近はそれほどでもない
独りで散歩するのもいろいろな発見があって楽しいけれどみんなで散歩するのもまた違った相互作用の機会があって楽しいなあと思いましたでもちょっと歩きすぎた昨日もけっこう歩いたし疲れた

ところでLoftに行ったら
https://www.youtube.com/watch?v=5f3ILHYcZDg
こういうのが売っていたので欲しいなあと思いました12kだったので買えちゃうなそんな理由でものをどんどん買っていてはいけないような気がするけどこれ無限に見てられるんだからつまり時間あたりの費用はゼロってことでしょ違うよ


今夜も早く寝るべきですがいいかげん自前のモデルをtensorflowに書きたいなとも思いますというかアニメ観なくていいんだっけ

0328

昨晩はword2vecの説明を読んでから寝ました可能な単語すべてとのsoftmaxを取ると死ぬのでかわりにノイズとして選ばれた単語集合に含まれないことを要求すると高速になるみたいな話ノイズはランダムに選べば良いのかなへえ


お昼から仕事日本語OCRの現状を調査フリーで使えるソフトは基本的にぜんぜんダメなんだけどこれは前処理が不十分だからなのか学習が不十分なのかあるいは前処理と学習をちゃんとすればどのくらい改善するのかみたいなことがまだわかりませんそしてこれは実際やってみないとわからないんだろうなあうーむこれはたぶん泥臭いチューニング作業になる気がするうーむ


明日は病院定例なんかまた風邪っぽさが出てきている気がする嫌だな


もしかしたら会えるかもと思って公園に行ったらもしかしたら会えるかもと思って待っていた君がいてなんだそれ循環参照かよって言いながら一緒に帰るあそこの点線ってさどれキリトリセンのところで折ったみたいだよねああアスファルトのひびがってこと道路に書いてる縦ながーい文字でさキーーリーートーーリーーセーーンーーって書くのはさみの絵も書こうえーなにそれ書いてないキリトリセンのところにはさみの……なにしてんのチョキチョキグーあっじゃあグリコねそのペースで帰るの日が暮れるんじゃないかなあっ西に向かって進めば日が暮れるのちょっとだけ遅くなるよあっちって西なの西だよ

0329

昨晩もword2vecの説明を読みました一応全体構造はわかったけどなんで特にskip-gramこんなのでああいう性質の良い埋め込みが得られるのかはぜんぜんピンとこないなあと思いましたというか具体的な回帰の計算もよくわかってない気がするまあこの先はコードを


仕事の前に病院今日はとても空いてて誰もいなかったのですぐ終わりました調子はすこし良くなっているのかもしれないけれどまあそんなの何回目だよって感じだし

仕事は日本語OCRの調査領域検出も既存手法ではどうやらぜんぜんだめでこれは学習すればどうにかなるのかどうかぜんぜんわかりませんあとはCNNを使った手法の論文を読んだりしたけどこれはオーバーキルなんじゃないだろうかと心配になる既存研究の地図がぜんぜん描けてないのですごく的外れなことをやってないだろうかうーむ


普通に使ったつもりの言葉に難しい言葉知ってるんですねとか言われちゃうとちょっと疎外感を感じるそうだ僕は難しい言葉を使ってしまう人間なんだこうやって普通におしゃべりをしているけれど違う種類の人間だったんだ
まあ単に僕がナチュラルボーン頭が高い人間なせいでもあると思いますけれども会話はいつもマインスイーパ


今夜はアニメを消化しつつtensorflowを触るそのつつは不可能では

0330

お昼から仕事日本語OCRの調査など商用のソフトだとこんぐらいできるというベースラインはわかったのだけどまずどうやってそこまで到達したものか悩ましい泥臭いチューニングとかは嫌ちゅらよでもRegion Proposal Networkみたいなものにサジェストしてもらうのは案外悪くないかもとかAttention Modelのこととか

明日は実験用に日本語文字列画像を大量生成しますとりあえず日本語Wikipediaのデータをダウンロードした


ちょっと疲れている睡眠時間が若干短いせいかもしれないし水曜日ってのはそもそもこんなものだったような気もするうーむ