<div dir="ltr">With recent bug fixes and performance tunings, AutoFDO@llvm has reached a usable state. To evaluate performance, we used O3/-fprofile-use/-fprofile-sample-use respectively to optimize clang itself, and measure its speed.<div><br></div><div>clang built with -fprofile-use is ~20% faster than clang built with O3</div><div>clang built with -fprofile-sample-use is ~10% faster than clang built with O3</div><div><br></div><div>AutoFDO can deliver 50% of the FDO speedup to clang. The gap is mainly due to inaccurate/lost debug info, which is used to represent the profile. I am still tuning the performance to fill in the gap.</div><div><br></div><div>During the meantime, we encourage you to try it out. Bug reports/fixes are always welcome. For more information about how to generate AutoFDO profile, please refer to <a href="https://github.com/google/autofdo">https://github.com/google/autofdo</a></div><div><br></div><div>Cheers,</div><div>Dehao</div></div>