<div dir="ltr"><div class="gmail_extra"><br><div class="gmail_quote">On Tue, May 13, 2014 at 11:42 AM, Louis Gerbarg <span dir="ltr"><<a href="mailto:lgg@apple.com" target="_blank">lgg@apple.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word">So our internal perf bots are back up and reporting consistent results at this point. While we have resolved the regression on Haswell I am still seeing some significant regressions on Sandybridge and Penryn even after r208289 and r208289:<div>
<br></div><div><div>Sandybridge:</div><div>17% Slowdown on Bubblesort</div><div>7% Slowdown on neural</div><div>25% Slowdown on dynprog</div><div><br></div><div>Penryn:</div><div>55% Slowdown on Bubblesort</div><div>26% Slowdown on dynprog</div>
</div><div><br></div><div>I can not with 100% certainty correlate the regressions to this patch since there is a several day gap in my data and I don’t have ready access to Penryn or SB to regress this myself, but I am pretty certain the limits are still not right for those cores and this is exposing it.</div>
</div></blockquote></div><br></div><div class="gmail_extra">So, I ran a few benchmarks myself with forced higher thresholds, and in any larger benchmark I saw no significant gains and started to see reasonably significant runtime and binary size regressions. I'm a bit hesitant to ramp this threshold up unless you can confirm with the flag that these differences are attributable to the lack of unrolling alone, and that changing it doesn't regress other things....</div>
</div>