[llvm-commits] [llvm] r51489 - in /llvm/trunk: lib/Target/X86/X86ISelLowering.cpp lib/Target/X86/X86InstrInfo.cpp lib/Target/X86/X86InstrSSE.td test/CodeGen/X86/pmul.ll

Fri May 23 10:58:58 PDT 2008

Thanks. Please update README-SSE.txt if this fixes an entry.

Evan

On May 23, 2008, at 10:49 AM, Dan Gohman wrote:

> Author: djg
> Date: Fri May 23 12:49:40 2008
> New Revision: 51489
>
> URL: http://llvm.org/viewvc/llvm-project?rev=51489&view=rev
> Log:
> Use PMULDQ for v2i64 multiplies when SSE4.1 is available. And add
> load-folding table entries for PMULDQ and PMULLD.
>
> Added:
>    llvm/trunk/test/CodeGen/X86/pmul.ll
> Modified:
>    llvm/trunk/lib/Target/X86/X86ISelLowering.cpp
>    llvm/trunk/lib/Target/X86/X86InstrInfo.cpp
>    llvm/trunk/lib/Target/X86/X86InstrSSE.td
>
> Modified: llvm/trunk/lib/Target/X86/X86ISelLowering.cpp
> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/X86/X86ISelLowering.cpp?rev=51489&r1=51488&r2=51489&view=diff
>
> =
> =
> =
> =
> =
> =
> =
> =
> ======================================================================
> --- llvm/trunk/lib/Target/X86/X86ISelLowering.cpp (original)
> +++ llvm/trunk/lib/Target/X86/X86ISelLowering.cpp Fri May 23  
> 12:49:40 2008
> @@ -700,6 +700,7 @@
>   if (Subtarget->hasSSE41()) {
>     // FIXME: Do we need to handle scalar-to-vector here?
>     setOperationAction(ISD::MUL,                MVT::v4i32, Legal);
> +    setOperationAction(ISD::MUL,                MVT::v2i64, Legal);
>
>     // i8 and i16 vectors are custom , because the source register  
> and source
>     // source memory operand types are not the same width.  f32  
> vectors are
>
> Modified: llvm/trunk/lib/Target/X86/X86InstrInfo.cpp
> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/X86/X86InstrInfo.cpp?rev=51489&r1=51488&r2=51489&view=diff
>
> = 
> = 
> = 
> = 
> = 
> = 
> = 
> = 
> ======================================================================
> --- llvm/trunk/lib/Target/X86/X86InstrInfo.cpp (original)
> +++ llvm/trunk/lib/Target/X86/X86InstrInfo.cpp Fri May 23 12:49:40  
> 2008
> @@ -569,8 +569,12 @@
>     { X86::PMAXUBrr,        X86::PMAXUBrm },
>     { X86::PMINSWrr,        X86::PMINSWrm },
>     { X86::PMINUBrr,        X86::PMINUBrm },
> +    { X86::PMULDQrr,        X86::PMULDQrm },
> +    { X86::PMULDQrr_int,    X86::PMULDQrm_int },
>     { X86::PMULHUWrr,       X86::PMULHUWrm },
>     { X86::PMULHWrr,        X86::PMULHWrm },
> +    { X86::PMULLDrr,        X86::PMULLDrm },
> +    { X86::PMULLDrr_int,    X86::PMULLDrm_int },
>     { X86::PMULLWrr,        X86::PMULLWrm },
>     { X86::PMULUDQrr,       X86::PMULUDQrm },
>     { X86::PORrr,           X86::PORrm },
>
> Modified: llvm/trunk/lib/Target/X86/X86InstrSSE.td
> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/X86/X86InstrSSE.td?rev=51489&r1=51488&r2=51489&view=diff
>
> = 
> = 
> = 
> = 
> = 
> = 
> = 
> = 
> ======================================================================
> --- llvm/trunk/lib/Target/X86/X86InstrSSE.td (original)
> +++ llvm/trunk/lib/Target/X86/X86InstrSSE.td Fri May 23 12:49:40 2008
> @@ -3242,19 +3242,18 @@
>                                        int_x86_sse41_pmaxud, 1>;
> defm PMAXUW       : SS41I_binop_rm_int<0x3E, "pmaxuw",
>                                        int_x86_sse41_pmaxuw, 1>;
> -defm PMULDQ       : SS41I_binop_rm_int<0x28, "pmuldq",
> -                                       int_x86_sse41_pmuldq, 1>;
>
>
> /// SS41I_binop_rm_int - Simple SSE 4.1 binary operator
> let Constraints = "$src1 = $dst" in {
> -  multiclass SS41I_binop_patint<bits<8> opc, string OpcodeStr,  
> SDNode OpNode,
> -                                Intrinsic IntId128, bit Commutable  
> = 0> {
> +  multiclass SS41I_binop_patint<bits<8> opc, string OpcodeStr,  
> ValueType OpVT,
> +                                SDNode OpNode, Intrinsic IntId128,
> +                                bit Commutable = 0> {
>     def rr : SS48I<opc, MRMSrcReg, (outs VR128:$dst),
>                    (ins VR128:$src1, VR128:$src2),
>                    !strconcat(OpcodeStr, "\t{$src2, $dst|$dst,  
> $src2}"),
> -                   [(set VR128:$dst, (OpNode (v4i32 VR128:$src1),
> -                                                     
> VR128:$src2))]>, OpSize {
> +                   [(set VR128:$dst, (OpNode (OpVT VR128:$src1),
> +                                                   VR128:$src2))]>,  
> OpSize {
>       let isCommutable = Commutable;
>     }
>     def rr_int : SS48I<opc, MRMSrcReg, (outs VR128:$dst),
> @@ -3277,8 +3276,10 @@
>                        OpSize;
>   }
> }
> -defm PMULLD       : SS41I_binop_patint<0x40, "pmulld", mul,
> +defm PMULLD       : SS41I_binop_patint<0x40, "pmulld", v4i32, mul,
>                                        int_x86_sse41_pmulld, 1>;
> +defm PMULDQ       : SS41I_binop_patint<0x28, "pmuldq", v2i64, mul,
> +                                       int_x86_sse41_pmuldq, 1>;
>
>
> /// SS41I_binop_rmi_int - SSE 4.1 binary operator with 8-bit immediate
>
> Added: llvm/trunk/test/CodeGen/X86/pmul.ll
> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/test/CodeGen/X86/pmul.ll?rev=51489&view=auto
>
> = 
> = 
> = 
> = 
> = 
> = 
> = 
> = 
> ======================================================================
> --- llvm/trunk/test/CodeGen/X86/pmul.ll (added)
> +++ llvm/trunk/test/CodeGen/X86/pmul.ll Fri May 23 12:49:40 2008
> @@ -0,0 +1,32 @@
> +; RUN: llvm-as < %s | llc -march=x86 -mattr=sse41 > %t
> +; RUN: grep pmul %t | count 6
> +; RUN: grep mov %t | count 8
> +
> +define <4 x i32> @a(<4 x i32> %i) nounwind  {
> +        %A = mul <4 x i32> %i, < i32 117, i32 117, i32 117, i32 117 >
> +        ret <4 x i32> %A
> +}
> +define <2 x i64> @b(<2 x i64> %i) nounwind  {
> +        %A = mul <2 x i64> %i, < i64 117, i64 117 >
> +        ret <2 x i64> %A
> +}
> +define <4 x i32> @c(<4 x i32> %i, <4 x i32> %j) nounwind  {
> +        %A = mul <4 x i32> %i, %j
> +        ret <4 x i32> %A
> +}
> +define <2 x i64> @d(<2 x i64> %i, <2 x i64> %j) nounwind  {
> +        %A = mul <2 x i64> %i, %j
> +        ret <2 x i64> %A
> +}
> +; Use a call to force spills.
> +declare void @foo()
> +define <4 x i32> @e(<4 x i32> %i, <4 x i32> %j) nounwind  {
> +        call void @foo()
> +        %A = mul <4 x i32> %i, %j
> +        ret <4 x i32> %A
> +}
> +define <2 x i64> @f(<2 x i64> %i, <2 x i64> %j) nounwind  {
> +        call void @foo()
> +        %A = mul <2 x i64> %i, %j
> +        ret <2 x i64> %A
> +}
>
>
> _______________________________________________
> llvm-commits mailing list
> llvm-commits at cs.uiuc.edu
> http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits