<div dir="ltr">Hi,<div><br></div><div>The binary gotten via clang's `-O1` runs much slower (3x) than that gotten via GCC's `-O1`.</div><div><br></div><div>Reproducible with:</div><div><br></div><div><a href="https://github.com/m-chaturvedi/test_valgrind_slowdown">https://github.com/m-chaturvedi/test_valgrind_slowdown</a></div><div><br></div><div>We are seeing this difference between gcc and clang at other places as well.</div><div><br></div><div>The `-O0` and `-O2` times are comparable, however.   Are there some compile time flags one could add to make the `-O1` times comparable?  </div><div><br></div><div>Apologies if this has been discussed somewhere already.</div><div><br></div><div>Thank you,</div><div>Mmanu</div></div>