0911
AVXによる高速化、すこしだけできていますがいまのところ三割増しくらいです(境界条件の都合で磁場しかやっていないのですが)。doubleを四本同時に演算していることを考えるとぜんぜんですね。コンパイラの自動最適化技術に感動するべきところなのかは悩みます。もっと速度を!
現状、ボトルネックの一つは、どうしても32バイトにアラインしないところがあるせいだと思われるので、ここをうまく回避できれば(できるのかね)もうすこしよくなるのかな、とも。
まあ、まだPMLの理論も理解していませんが。ううむ。
夕方からバイト。プロジェクト終盤っぽいチケット。
今回のプロジェクトを通して、非常にたくさんのことを考えたり学びました(それはしばしば大きな苦痛をともなったけれども)。次に生かさなければなりません。
さて、今夜はこれから研究室に石鹸を取りに(昨日行く途中で買ったのを置き忘れてきたのです)行って、それからすこしnekousagiの高速化を試みてねむります。明日はほこらんさんとお酒を飲みます。部屋を片付けなくては、さすがにこれはひどい。