<div dir="ltr">Hi Jim,<div><br></div><div>This patch broke our test-suite buildbot:</div><div><br></div><div><a href="http://llvm.org/bugs/show_bug.cgi?id=17093">http://llvm.org/bugs/show_bug.cgi?id=17093</a><br></div><div>

<br></div><div>cheers,</div><div>--renato</div><div>PS: being redundant for the sake of llvm-commits history</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On 3 September 2013 21:08, Jim Grosbach <span dir="ltr"><<a href="mailto:grosbach@apple.com" target="_blank">grosbach@apple.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Author: grosbach<br>

Date: Tue Sep  3 15:08:17 2013<br>

New Revision: 189841<br>

<br>

URL: <a href="http://llvm.org/viewvc/llvm-project?rev=189841&view=rev" target="_blank">http://llvm.org/viewvc/llvm-project?rev=189841&view=rev</a><br>

Log:<br>

Revert "Revert "ARM: Improve pattern for isel mul of vector by scalar.""<br>

<br>

This reverts commit r189648.<br>

<br>

Fixes for the previously failing clang-side arm_neon_intrinsics test<br>

cases will be checked in separately.<br>

<br>

Modified:<br>

    llvm/trunk/lib/Target/ARM/ARMInstrNEON.td<br>

    llvm/trunk/test/CodeGen/ARM/vmul.ll<br>

<br>

Modified: llvm/trunk/lib/Target/ARM/ARMInstrNEON.td<br>

URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/ARM/ARMInstrNEON.td?rev=189841&r1=189840&r2=189841&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/ARM/ARMInstrNEON.td?rev=189841&r1=189840&r2=189841&view=diff</a><br>


==============================================================================<br>

--- llvm/trunk/lib/Target/ARM/ARMInstrNEON.td (original)<br>

+++ llvm/trunk/lib/Target/ARM/ARMInstrNEON.td Tue Sep  3 15:08:17 2013<br>

@@ -4022,6 +4022,17 @@ def : Pat<(v4f32 (fmul (v4f32 QPR:$src1)<br>

                                    (DSubReg_i32_reg imm:$lane))),<br>

                            (SubReg_i32_lane imm:$lane)))>;<br>

<br>

+<br>

+def : Pat<(v2f32 (fmul DPR:$Rn, (NEONvdup (f32 SPR:$Rm)))),<br>

+          (VMULslfd DPR:$Rn,<br>

+            (INSERT_SUBREG (v2f32 (IMPLICIT_DEF)), SPR:$Rm, ssub_0),<br>

+            (i32 0))>;<br>

+def : Pat<(v4f32 (fmul QPR:$Rn, (NEONvdup (f32 SPR:$Rm)))),<br>

+          (VMULslfq QPR:$Rn,<br>

+            (INSERT_SUBREG (v2f32 (IMPLICIT_DEF)), SPR:$Rm, ssub_0),<br>

+            (i32 0))>;<br>

+<br>

+<br>

 //   VQDMULH  : Vector Saturating Doubling Multiply Returning High Half<br>

 defm VQDMULH  : N3VInt_HS<0, 0, 0b1011, 0, N3RegFrm, IIC_VMULi16D, IIC_VMULi32D,<br>

                           IIC_VMULi16Q, IIC_VMULi32Q,<br>

<br>

Modified: llvm/trunk/test/CodeGen/ARM/vmul.ll<br>

URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/test/CodeGen/ARM/vmul.ll?rev=189841&r1=189840&r2=189841&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/test/CodeGen/ARM/vmul.ll?rev=189841&r1=189840&r2=189841&view=diff</a><br>


==============================================================================<br>

--- llvm/trunk/test/CodeGen/ARM/vmul.ll (original)<br>

+++ llvm/trunk/test/CodeGen/ARM/vmul.ll Tue Sep  3 15:08:17 2013<br>

@@ -623,3 +623,21 @@ entry:<br>

   store <4 x i32> %predphi290.v.i, <4 x i32>* undef, align 4<br>

   ret void<br>

 }<br>

+<br>

+define void @foo(<4 x float> * %a, <4 x float>* nocapture %dst, float* nocapture readonly %src) nounwind {<br>

+;   Look for doing a normal scalar FP load rather than an to-all-lanes load.<br>

+;   e.g., "ldr s0, [r2]" rathern than "vld1.32  {d18[], d19[]}, [r2:32]"<br>

+;   Then check that the vector multiply has folded the splat to all lanes<br>

+;   and used a vector * scalar instruction.<br>

+; CHECK: vldr  {{s[0-9]+}}, [r2]<br>

+; CHECK: vmul.f32  q8, q8, d0[0]<br>

+  %tmp = load float* %src, align 4<br>

+  %tmp5 = load <4 x float>* %a, align 4<br>

+  %tmp6 = insertelement <4 x float> undef, float %tmp, i32 0<br>

+  %tmp7 = insertelement <4 x float> %tmp6, float %tmp, i32 1<br>

+  %tmp8 = insertelement <4 x float> %tmp7, float %tmp, i32 2<br>

+  %tmp9 = insertelement <4 x float> %tmp8, float %tmp, i32 3<br>

+  %tmp10 = fmul <4 x float> %tmp9, %tmp5<br>

+  store <4 x float> %tmp10, <4 x float>* %dst, align 4<br>

+  ret void<br>

+}<br>

<br>

<br>

_______________________________________________<br>

llvm-commits mailing list<br>

<a href="mailto:llvm-commits@cs.uiuc.edu">llvm-commits@cs.uiuc.edu</a><br>

<a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits</a><br>

</blockquote></div><br></div>