<div dir="ltr"><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Feb 27, 2017 at 9:47 AM, Adam Nemet <span dir="ltr"><<a href="mailto:anemet@apple.com" target="_blank">anemet@apple.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><br><div><span class=""><blockquote type="cite"><div>On Feb 27, 2017, at 9:39 AM, Daniel Berlin <<a href="mailto:dberlin@dberlin.org" target="_blank">dberlin@dberlin.org</a>> wrote:</div><br class="m_-5050072138822652090Apple-interchange-newline"><div><div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Feb 27, 2017 at 9:29 AM, Adam Nemet <span dir="ltr"><<a href="mailto:anemet@apple.com" target="_blank">anemet@apple.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div style="word-wrap:break-word"><br><div><span class="m_-5050072138822652090gmail-"><blockquote type="cite"><div>On Feb 27, 2017, at 7:27 AM, Hal Finkel <<a href="mailto:hfinkel@anl.gov" target="_blank">hfinkel@anl.gov</a>> wrote:</div><br class="m_-5050072138822652090gmail-m_8239107560126363242Apple-interchange-newline"><div><div class="m_-5050072138822652090gmail-m_8239107560126363242moz-cite-prefix" style="font-family:helvetica;font-size:10px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;background-color:rgb(255,255,255)"><br class="m_-5050072138822652090gmail-m_8239107560126363242Apple-interchange-newline">On 02/27/2017 06:29 AM, Nema, Ashutosh wrote:<br></div><blockquote type="cite" style="font-family:helvetica;font-size:10px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;background-color:rgb(255,255,255)"><div class="m_-5050072138822652090gmail-m_8239107560126363242WordSection1"><div style="margin:0in 0in 0.0001pt;font-size:12pt;font-family:"times new roman",serif">Thanks for looking into this.<u></u><u></u></div><div style="margin:0in 0in 0.0001pt;font-size:12pt;font-family:"times new roman",serif"><u></u> <u></u></div><div style="margin:0in 0in 0.0001pt;font-size:12pt;font-family:"times new roman",serif">1) Issues with re running vectorizer:<u></u><u></u></div><div style="margin:0in 0in 0.0001pt;font-size:12pt;font-family:"times new roman",serif">Vectorizer might generate redundant alias checks while vectorizing epilog loop.<u></u><u></u></div><div style="margin:0in 0in 0.0001pt;font-size:12pt;font-family:"times new roman",serif">Redundant alias checks are expensive, we like to reuse the results of already computed alias checks.<u></u><u></u></div><div style="margin:0in 0in 0.0001pt;font-size:12pt;font-family:"times new roman",serif">With metadata we can limit the width of epilog loop, but not sure about reusing alias check result.<u></u><u></u></div><div style="margin:0in 0in 0.0001pt;font-size:12pt;font-family:"times new roman",serif">Any thoughts on rerunning vectorizer with reusing the alias check result ?</div></div></blockquote><br style="font-family:helvetica;font-size:10px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;background-color:rgb(255,255,255)"><span style="font-family:helvetica;font-size:10px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;background-color:rgb(255,255,255);float:none;display:inline">One way of looking at this is: Reusing the alias-check result is really just a conditional propagation problem; if we don't already have an optimization that can combine these after the fact, then we should.</span><br style="font-family:helvetica;font-size:10px;font-style:normal;font-variant-caps:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;background-color:rgb(255,255,255)"></div></blockquote><div><br></div></span><div>+Danny</div><div><br></div><div>Isn’t Extended SSA supposed to help with this?</div></div></div></blockquote><div><br></div><div>Yes, it will solve this with no issue already.  GVN probably does already too.</div><div><br></div><div>even if if you have</div><div><br></div><div>if (a == b)</div><div><div>if (a == c)</div></div><div><div> if (a == d)</div></div><div><div> if (a == e)</div></div><div><div> if (a == g)</div></div><div><br></div><div><br></div><div>and  we can prove a ... g equivalent, newgvn will eliminate them all and set all the branches true.</div><div><br></div><div>If you need a simpler clean up pass, we could run it on sub-graphs.</div></div></div></div></div></blockquote><div><br></div></span><div>Yes we probably don’t want to run a full GVN after the “loop-scheduling” passes.</div><div><br></div><div>I guess the pipeline to experiment with for now is opt -loop-vectorize -loop-vectorize -newgvn.</div><span class="HOEnZb"><font color="#888888"><div><br></div><div>Adam</div></font></span></div></div></blockquote><div><br></div><div>Right, and if you guarantee the conditions involve scalars (IE the pointer is not from a load ), it can be made evenfaster by turning off the memory handling (IE not building memoryssa)..</div><div><br></div><div>NewGVN will still give correct answers if you value number any instruction you like as "unknown expression".</div><div>I have a patch to add a debug counter that does just that.</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div></div></div></div>