<div style="font-family: arial, helvetica, sans-serif; font-size: 10pt">cat /proc/cpuinfo ?<div><br></div><div>Are you sure it's generating VFMA and not VMLA?</div><div class="gmail_extra"><br><br><div class="gmail_quote">
On Fri, Nov 9, 2012 at 9:35 AM, Sebastien DELDON-GNB <span dir="ltr"><<a href="mailto:sebastien.deldon@st.com" target="_blank">sebastien.deldon@st.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi Renato,<br>
<br>
It's definitively not A15. Can this be the case that NEON units for cortex-A9 support it but isn't documented/recommended ?<br>
And as mentioned before code is working !<br>
<br>
Seb<br>
<div class="im"><br>
<br>
> -----Original Message-----<br>
> From: <a href="mailto:rengolin@gmail.com">rengolin@gmail.com</a> [mailto:<a href="mailto:rengolin@gmail.com">rengolin@gmail.com</a>] On Behalf Of<br>
> Renato Golin<br>
> Sent: Friday, November 09, 2012 6:27 PM<br>
> To: Sebastien DELDON-GNB<br>
</div><div class="im">> Cc: JF Bastien; <a href="mailto:llvmdev@cs.uiuc.edu">llvmdev@cs.uiuc.edu</a><br>
> Subject: Re: [LLVMdev] fmac generation for cortex-a9<br>
><br>
</div><div class="im">> Hi Sebastien,<br>
><br>
> ARMv7-M has VFMA and LLVM's "triple" is far from perfect.<br>
><br>
> Wikipedia tells me NovaThor can also be A15, or STE could have cramped a<br>
> VFPv4 in it? ;) Or possibly, your code never branches into the VFMA.<br>
> Many things could be happening, but usually, VFMA shouldn't be generated<br>
> for A9.<br>
><br>
> A GCC bug, maybe?<br>
><br>
><br>
> On 9 November 2012 16:51, Sebastien DELDON-GNB<br>
> <<a href="mailto:sebastien.deldon@st.com">sebastien.deldon@st.com</a>> wrote:<br>
> > Hi Bastien,<br>
> ><br>
> ><br>
> ><br>
> > Weird gcc is generating fma for my platform STEricsson Novathor with<br>
> > Linaro, code works. It also works when I use LLVM to generate fma<br>
</div>> > (using llc -mtriple=armv7-eabi). Maybe someone from ARM can answer<br>
<div class="HOEnZb"><div class="h5">> the question ?<br>
> ><br>
> ><br>
> ><br>
> > Seb<br>
> ><br>
> ><br>
> ><br>
> > From: JF Bastien [mailto:<a href="mailto:jfb@google.com">jfb@google.com</a>]<br>
> > Sent: Friday, November 09, 2012 5:36 PM<br>
> > To: Sebastien DELDON-GNB<br>
> > Cc: Anitha Boyapati; <a href="mailto:llvmdev@cs.uiuc.edu">llvmdev@cs.uiuc.edu</a><br>
> ><br>
> ><br>
> > Subject: Re: [LLVMdev] fmac generation for cortex-a9<br>
> ><br>
> ><br>
> ><br>
> > AFAIK A9 doesn't have VFPv4 or AdvSIMDv2, so it doesn't have VFMA. I<br>
> > don't know what LLVM does, but it shouldn't emit VFMA when you target<br>
> > A9. VMLA isn't a fused multiply-add, it's a multiply followed by an<br>
> > add and has different latency as well as precision.<br>
> ><br>
> ><br>
> ><br>
> > On Thu, Nov 8, 2012 at 4:57 AM, Sebastien DELDON-GNB<br>
> > <<a href="mailto:sebastien.deldon@st.com">sebastien.deldon@st.com</a>> wrote:<br>
> ><br>
> > Hi Anitha,<br>
> ><br>
> > Thanks for your answer but -mcpu=cortex-a9 -mattr=+vfp4 doesn' t<br>
> > enable fused mac generation for me.<br>
> > I would like just to understand why -mtriple=armv7-eabi enables it<br>
> > while<br>
> > -mcpu=cortex-a9 seems to disable it ?<br>
> ><br>
> > Seb<br>
> ><br>
> ><br>
> >> -----Original Message-----<br>
> >> From: Anitha Boyapati [mailto:<a href="mailto:anitha.boyapati@gmail.com">anitha.boyapati@gmail.com</a>]<br>
> >> Sent: Thursday, November 08, 2012 10:22 AM<br>
> >> To: Sebastien DELDON-GNB<br>
> >> Cc: <a href="mailto:llvmdev@cs.uiuc.edu">llvmdev@cs.uiuc.edu</a><br>
> >> Subject: Re: [LLVMdev] fmac generation for cortex-a9<br>
> >><br>
> >> On 8 November 2012 13:56, Sebastien DELDON-GNB<br>
> >> <<a href="mailto:sebastien.deldon@st.com">sebastien.deldon@st.com</a>> wrote:<br>
> >> > Hi all,<br>
> >> ><br>
> >> ><br>
> >> ><br>
> >> ><br>
> >> ><br>
> >> > I've a .ll code that use double precision fmul/fadd or fmul/fsub.<br>
> >> > When<br>
> ><br>
> >> > I compile it using llc -mcpu=cortex-a9 I couldn't get vmla/vmls<br>
> >> > generated even using -fp-contract=fast, but when I use option<br>
> >> > -mtriple=armv7-eabi instead of -mcpu=cortex-a9 fused mac are<br>
> ><br>
> >> generated. Can someone explain me why  ?<br>
> >> ><br>
> >><br>
> >> Perhaps you need to use some attributes. -mattr=+vfp4 Check<br>
> >> fusedMAC.ll from ARM codegen tests.<br>
> >><br>
> >><br>
> >> --<br>
> >>  Anitha<br>
> ><br>
> > _______________________________________________<br>
> > LLVM Developers mailing list<br>
> > <a href="mailto:LLVMdev@cs.uiuc.edu">LLVMdev@cs.uiuc.edu</a>         <a href="http://llvm.cs.uiuc.edu" target="_blank">http://llvm.cs.uiuc.edu</a><br>
> > <a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev</a><br>
> ><br>
> ><br>
> ><br>
> ><br>
> > _______________________________________________<br>
> > LLVM Developers mailing list<br>
> > <a href="mailto:LLVMdev@cs.uiuc.edu">LLVMdev@cs.uiuc.edu</a>         <a href="http://llvm.cs.uiuc.edu" target="_blank">http://llvm.cs.uiuc.edu</a><br>
> > <a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev</a><br>
> ><br>
><br>
><br>
><br>
> --<br>
> cheers,<br>
> --renato<br>
><br>
> <a href="http://systemcall.org/" target="_blank">http://systemcall.org/</a><br>
</div></div></blockquote></div><br></div></div>