0411
昨晩はbotのために文章の下ごしらえ。学習に使う文のリストがどうにか整理できたので、あとはとにかく食わせるだけです。
めも。text.split(/(?<=。)/)とすると文章を句点で分割できます。ふつうにsplitすると分割できるけど句点が抜けてしまうのですが、正規表現の後読みを使うことで、「句点に続くゼロ幅文字列」で分割させるようになっています。たぶんruby1.9以降で動くはず。
今回は/(?<=[。!?])(?![」)』])|(?<=[。!?][」)』])/なる正規表現を使うことで鉤括弧周辺の分割処理を実現しています。
午後からバイト。プッシュ通知とか。
夜はゼミ準。明日発表担当一人でやれとかいきなり言われてしまったので(無理してやらなくてもよいかなと思っていたのに)焦って準備をしています。
昨日もらった新しい薬を飲み始めたのですが、てきめんに頭がぼんやりしますね。気分がいいけど勉強になりません。こまりましたね。
Self-Reference ENGINEの英訳版が届いたのですこし眺めていました。やっぱり小説を英語で読むのは無理があるなあと思いました。"A set of all possible character strings. All possible books would be contained in that." お笑い計算とか「Japanese」とか、そうなるんだ、という感じ。
明日は夕方にゼミ。それまで準備をしましょう。今夜はもう面倒なので一旦ねむって、明日の朝に準備の続きをしましょう。