<div dir="ltr">Looks good to me!  Thanks!</div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Jan 13, 2015 at 5:14 PM, Olivier H Sallenave <span dir="ltr"><<a href="mailto:ohsallen@us.ibm.com" target="_blank">ohsallen@us.ibm.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div>
<p><font face="sans-serif">Hi,</font><br>
<br>
<font face="sans-serif">I propose to override the TLI callback enableAggressiveFMAFusion for the NVPTX backend and return true instead of false. The reason is the same as for PPC: fmul, fmadd and fadd nodes cost the same number of cycles (see </font><a href="http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#arithmetic-instructions" target="_blank"><font face="sans-serif">http://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#arithmetic-instructions</font></a><font face="sans-serif">)</font><font face="sans-serif">, so we can enable more combining heuristics to produce more FMAs. For instance, this pattern would be considered:</font><br>
<br>
<font face="sans-serif">// fold (fadd (fma x, y, (fmul u, v)), z) -> (fma x, y (fma u, v, z))</font><br>
<br>
<font face="sans-serif">cf. commits:</font><br>
<a href="http://llvm.org/viewvc/llvm-project?view=revision&revision=218120" target="_blank"><font face="sans-serif">http://llvm.org/viewvc/llvm-project?view=revision&revision=218120</font></a><br>
<a href="http://llvm.org/viewvc/llvm-project?view=revision&revision=225380" target="_blank"><font face="sans-serif">http://llvm.org/viewvc/llvm-project?view=revision&revision=225380</font></a><br>
<br>
<font face="sans-serif">Please tell me what you think.</font><span class="HOEnZb"><font color="#888888"><br>
<br>
<font face="sans-serif">Olivier</font></font></span></p></div><br>_______________________________________________<br>
LLVM Developers mailing list<br>
<a href="mailto:LLVMdev@cs.uiuc.edu">LLVMdev@cs.uiuc.edu</a>         <a href="http://llvm.cs.uiuc.edu" target="_blank">http://llvm.cs.uiuc.edu</a><br>
<a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature"><br><div>Thanks,</div><div><br></div><div>Justin Holewinski</div></div>
</div>