<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div>Will knowing the exact number help us in making a better decision ? I don’t think so. On modern processors when running vectorizable loops, the code size of the vector instructions is almost never the bottleneck. </div>
</div></blockquote><div><br></div><div>I'd make a slightly different point: being able to estimate the number of UOPs will make a big difference if it allows you to fit your loop in the loop stream detector.</div><div>
<br></div><div>So I'd agree that estimating x86 encoded code size doesn't matter that much for performance (though I$ pressure is a big issue for may codebases, but I assume you're talking about tight vectorizable kernels), but estimating UOPs does matter a great deal.</div>
</div></div></div>