<div dir="ltr"><div><div><div><div>I still don't get it. Let me state my ignorance and bias: I know nothing about GPUs, and when someone says "in-order", I have a ~10 year flashback to Power6 and Cell development.<br><br></div>So to me, an in-order machine is still superscalar and pipelined. You have to expose ILP or you die a high-frequency death. And so when you have a 10 cycle latency fadd (!), we still want to do this:<br></div><br>fadd f4, f1, f0<br></div>fadd f4, f4, f2<br></div>fadd f4, f4, f3<br><div><br>-><br><br></div><div>fadd f4, f1, f0<br></div><div>fadd f5, f2, f3<br></div><div>fadd f4, f4, f5<br></div><div><br></div><div>because the first sequence is 30 cycles and the second is 20-21 cycles. <br><br>It makes sense to me that a non-pipelined, non-superscalar machine would see no benefit from the transform, but in-order alone is not the differentiator I'm thinking of if we're going to limit this transform by target in the DAG.<br></div><div><br><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Apr 29, 2015 at 9:42 PM, Owen Anderson <span dir="ltr"><<a href="mailto:resistor@mac.com" target="_blank">resistor@mac.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><span class=""><br><div><blockquote type="cite"><div>On Apr 29, 2015, at 8:32 PM, Sanjay Patel <<a href="mailto:spatel@rotateright.com" target="_blank">spatel@rotateright.com</a>> wrote:</div><br><div><span style="font-family:Helvetica;font-size:12px;font-style:normal;font-variant:normal;font-weight:normal;letter-spacing:normal;line-height:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;float:none;display:inline!important">I'm not seeing how in-order vs. OOO is a factor?</span></div></blockquote></div><br></span><div>The transformation increases register pressure in order to expose ILP.  On an in-order machine, that is a purely negative tradeoff, since there’s no advantage to exposing ILP.</div><span class="HOEnZb"><font color="#888888"><div><br></div><div>—Owen</div></font></span></div></blockquote></div><br></div></div></div>