andante

1224

メリクリそれは明日かもう今日だけど


土曜日なのでのんびりしていたガトーショコラを作ったたまにしか作らないから毎回段取りが微妙にわるい今日は薄力粉をふるうのにものすごい時間がかかったもっと早く始めればよかったのだ

昨夜学習を走らせて寝たかな漢字変換ソフトウェアは8時間ほどかかって学習完了していた軽く試してみたけどまあお世辞にも精度が良いとはいえないそれでもだいたいはそれっぽい変換をしてくるからアルゴリズムの簡素さを考えれば上々だろう改良はまた気が向いた時にする
これをSwiftで書かれたIMEから呼び出す部分を実装したバインディングを自動で生成してくれるクレートがあったのでそれを使ったらわりと簡単にできたがデータの受け渡しは多少面倒だなと思った
InputMethodKitを使ってIMEのように振る舞う部分も一応実装したがそういえばかな漢字変換の前にローマ字かな変換も必要だったことを忘れていたので一旦繋ぎ込みは保留しているひさびさにXcodeでコードを書いたキーバインディングが飛んでいるのかえらく使いづらかった
明日はRust側のリファクタから始めたいもし調子がよければローマ字かな変換部分も実装したいこれは別に学習とかではないので書けば動くはずだがIMEとの連携を考えてインターフェイスを考えなければなるまい


謎に夜更かししてしまった謎過ぎる寝るぞ

1223

とにかくバタバタしていたgodotenvはテストの時に.envを読んでくれないこれはgoがテストの時にそれ用に一時ディレクトリを掘るせいために不都合が出てきたのでdirenvでシェル側で実現することにしたほぼ成功したけどまだ修正がいる

夜は日本語変換の実装を進めたノード間の重みの学習を始めたほぼうまく動いているがたまに変なエラーが出る調査が必要そうだけどまあ一旦無視高速化のためにRayon入れてみたけどこれはやらないよりはマシ程度
一晩でWikipediaを1周しそうなので明日はSwiftから呼べるようにしたい


寝ます明日はガトーショコラ作るか買いものの予定もあるがはんだ付けもしたいんだけども忙しすぎるな

1222

なんか金曜日感のある木曜日今週は特に会議が多かったから息切れしてるのかもしれないそんな疲れてる感じでもないのだが

Wikipediaから引っ張ってきた巨大コーパスからAho-Corasick法のオートマトンを作成し簡単に辞書引きするところまで実装したこれで一応ビタビ法と組み合わせて変換機能が動くまだノードとエッジのスコアを学習していないので正しい変換とはほど遠いけど
計算機で情報処理をすると八億行あるテキストファイルを手許で処理するなんてことが行えるこれは楽しいこういうスケールのブースト感が計算機の醍醐味だなと思うアルゴリズムさえ記述すればあとは計算器の能力と資源の許す限りどこまでも行けるそこには手作業では絶対に届かないような景色が広がっている


鹿目詢子さんまどかのお母さんです正し過ぎるその子の分まで誰かが間違えてあげればいいと述べているこれは本当にそうだなと思う正しいことの素朴な合成が誰もが納得できる結論を導くとは限らないし正しいかどうかなんて長い目で見ればどうだっていいことでもあるわけでそういう場面で間違いを選ぶこれは難しいことだけれどもしかしこれは世界のある性質に関する重要な指摘だなと感じる
こういうのは欺瞞的なのかもしれない結果さえよければ手段が誤っていてもいいそういう態度は決して称賛できるものではないが……しかしどこまでいっても人生にはそういう場面もあるそれが気に入らない人も多くいるだろうそれでも

1221

会議が合計5時間くらいあってほとんど何も進まなかった日Terraformをすこし書いたがあちこちぶつけてうまく動かなかったあれは素人が雰囲気で触れるようにはなっていないのだその点CDKは明らかにおかしいものは型チェックで弾かれるので楽ではあった

夜は引き続きコーパス作成をしているデータの持ち方をいろいろ迷っていてあまり進まなかったがとりあえず辞書を作る手前まではきた重みの学習はまた別の苦労が予想されるのだけどもこれRayonで並列化したいけど素朴にやると絶対にうまく行かないと思うのでなんか考えなくては


寝ます

1220

昨日はいささか飲みすぎたのか今日はまあまあしんどかった仕事は普通にできる程度だったので仕事は普通にしたバッチコマンドを追加するためにTerraformを見よう見まねで書いているTerraformはもうすこしテキストエディタの支援が受けられるとうれしいがIDEによっては強力だったりするのだろうか

夜は日本語変換の学習に使うコーパスの準備をしていたKyteaのPythonバインディングがM1 macだとpipで入らないらしくPoerty環境でいい感じにするのにとても難儀したというか結局いい感じにはなっていないがあまりそこに拘る意味もないので妥協しておく
Wikipediaから全記事データをダウンロードしてテキスト部分を抽出したら12億文字のデータが得られたこれを文単位に分割してKyteaで読みを推定させてコーパスを作るそれを元に重みを学習させたいがたぶんマルチスレッド対応しないと厳しいだろうなどうしたらいいか


寝ます明日はなんか会議が5個くらいあるなんかおかしくない

1219

月曜日はいつも会議がちで作業時間があまり取れないでも小さな問題を一つ解決した正確には解決できないので迂回する方法を実装しただけだけどこれコントリビューションチャンスのような気がするが単に僕が勘違いをしている可能性もある

夜は飲み会をしたみんな大変やねその場に唯一のソフトウェアエンジニアとしては頼り甲斐はともかく頼りやすい人間であろうという思いを新たにした頼り甲斐はわからん


通常の意味においていい学歴がある人間だがあってよかったと思ったことが一度もないむしろ損をしている印象のほうが強い特に自意識との折り合いが悪いしかしこれは典型的な誤謬で実際には学歴によってさまざまな得をしていることは想像に難くない主観は主観でしかないそのギャップがまた学歴に対するネガティヴな印象を強化するがしかしどうしようもない


寝る

1218

昼まで寝をしてそれからラーメンを食べに出かけた本当はべつにラーメンを食べに出かけるつもりではなかったのだが近所のうどん屋が満席だったので仕方なくバスに乗ってちょっと遠出をした判断ミスだったような気がしないでもないラーメンはうまかった

日本語入力エンジンを作り始めたとりあえずビタビのアルゴリズムを実装してノードとエッジのスコアを考慮しながら最適な経路を見つけることはできるようになったがじゃあそのスコアはどこから拾ってくんのという話であるコーパスを準備せねばなるまいこれはなんかスクリプト書けばいいかあとパフォーマンスはチューニングが必要だろうトライ木を実装するとかそういう

夜はM-1グランプリを途中から観た面白かった


寝ます明日はなんか会社の人と飲み会

1217

何もしてない来年のプロジェクトとして日本語変換エンジンを作ってみようかなと思ったのですこし調べごとをしたでもこれ素人がちょっと頑張ったって結局ATOKやらGoogle日本語入力やらを越えることはないのだろうなと思うと多少虚しくなるのでやらないかもしれないまあすこし試してみようかな
いやでもOS作るとかファミコンエミュレイタ作るとかのほうが楽しいのではないか特にエミュレイタにはちゃんと正解があるので無駄なことに精神力を使わなくてもいいという利点があるうーむ

1216

午前休をとって歯医者に行きラーメンを食べて帰った前住んでいたところにはおいしいラーメン屋がいくつもあるのにいま住んでいるところには何もないのでこうして時々歯医者に行くのが楽しみでもある

仕事は午後に会議が3つあったのでほとんど何も進まずいやまあ今週やり終えたかったことは結構できたかな

夜はトップガンを観たうーんなんかねラストの空戦はかなりよかったけど映画全体がそこまでの長すぎる助走という感じでねえと思った


寝るかぁduolingoのフィンランド語コースは1週間続いたすごく基本的な表現は覚えたけどペースが遅いまあスマホで一日10分ばかりぽちぽちするだけで語学をやろうというのがそもそも無理のある話なのだろうとは思うしかしまあちまちま続けていきたい

1215

朝起きたらひどく頭が重く風邪か何かだろうかと思ったとはいえ仕事を休むほどのことではないと判断して出勤した実際休むほどのことではなかった

最近は日記が単調になりがちだどうしてだろう冬だから気分が塞いでるのかもしれない


明日は午前休とって歯医者に行きます午後は会議が一杯だ仕事にならなさそうだな