I'm looking into why.<div><br></div><div>For me -O0 is about 4x faster w/ Clang, but -O2 is 2x slower. I'll update after a pleliminary analysis. Note that this is comparing against gcc 4.6.2.</div>