[llvm-commits] [llvm] r42677 - in /llvm/trunk/lib: CodeGen/SelectionDAG/DAGCombiner.cpp Target/X86/X86InstrSSE.td

Sat Oct 6 15:13:50 PDT 2007

On Oct 5, 2007, at 10:11 PM, Chris Lattner <clattner at apple.com> wrote:

> Evan, it looks like you missed a commit.  Would a similar approach be
> suitable to implement this X86/README-SSE.txt entry?:

Looks that way. Some of the x86 specific shuffle optmizations (and  
missing ones like this) probably should move to the combiner.

Evan

>
>
> +
> +These functions should produce the same code:
> +
> +#include <emmintrin.h>
> +
> +typedef long long __m128i __attribute__ ((__vector_size__ (16)));
> +
> +int foo(__m128i* val) {
> +  return __builtin_ia32_vec_ext_v4si(*val, 1);
> +}
> +int bar(__m128i* val) {
> +  union vs {
> +    __m128i *_v;
> +    int* _s;
> +  } v = {val};
> +  return v._s[1];
> +}
> +
> +We currently produce (with -m64):
> +
> +_foo:
> +        pshufd $1, (%rdi), %xmm0
> +        movd %xmm0, %eax
> +        ret
> +_bar:
> +        movl 4(%rdi), %eax
> +        ret
> +
>
> -Chris
>
>
> On Oct 5, 2007, at 7:46 PM, Evan Cheng wrote:
>
>> Author: evancheng
>> Date: Fri Oct  5 21:46:29 2007
>> New Revision: 42677
>>
>> URL: http://llvm.org/viewvc/llvm-project?rev=42677&view=rev
>> Log:
>> Added DAG xforms. e.g.
>> (vextract (v4f32 s2v (f32 load $addr)), 0) -> (f32 load $addr)
>> (vextract (v4i32 bc (v4f32 s2v (f32 load $addr))), 0) -> (i32 load
>> $addr)
>> Remove x86 specific patterns.
>>
>> Modified:
>>    llvm/trunk/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
>>    llvm/trunk/lib/Target/X86/X86InstrSSE.td
>>
>> Modified: llvm/trunk/lib/CodeGen/SelectionDAG/DAGCombiner.cpp
>> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/
>> SelectionDAG/DAGCombiner.cpp?rev=42677&r1=42676&r2=42677&view=diff
>>
>> === 
>> ===================================================================
>> ========
>> --- llvm/trunk/lib/CodeGen/SelectionDAG/DAGCombiner.cpp (original)
>> +++ llvm/trunk/lib/CodeGen/SelectionDAG/DAGCombiner.cpp Fri Oct  5
>> 21:46:29 2007
>> @@ -263,6 +263,7 @@
>>     SDOperand visitLOAD(SDNode *N);
>>     SDOperand visitSTORE(SDNode *N);
>>     SDOperand visitINSERT_VECTOR_ELT(SDNode *N);
>> +    SDOperand visitEXTRACT_VECTOR_ELT(SDNode *N);
>>     SDOperand visitBUILD_VECTOR(SDNode *N);
>>     SDOperand visitCONCAT_VECTORS(SDNode *N);
>>     SDOperand visitVECTOR_SHUFFLE(SDNode *N);
>> @@ -682,6 +683,7 @@
>>   case ISD::LOAD:               return visitLOAD(N);
>>   case ISD::STORE:              return visitSTORE(N);
>>   case ISD::INSERT_VECTOR_ELT:  return visitINSERT_VECTOR_ELT(N);
>> +  case ISD::EXTRACT_VECTOR_ELT: return visitEXTRACT_VECTOR_ELT(N);
>>   case ISD::BUILD_VECTOR:       return visitBUILD_VECTOR(N);
>>   case ISD::CONCAT_VECTORS:     return visitCONCAT_VECTORS(N);
>>   case ISD::VECTOR_SHUFFLE:     return visitVECTOR_SHUFFLE(N);
>> @@ -2907,9 +2909,8 @@
>>     return DAG.getNode(ISD::BIT_CONVERT, VT, N0.getOperand(0));
>>
>>   // fold (conv (load x)) -> (load (conv*)x)
>> -  // If the resultant load doesn't need a  higher alignment than
>> the original!
>> -  if (ISD::isNON_EXTLoad(N0.Val) && N0.hasOneUse() &&
>> -      ISD::isUNINDEXEDLoad(N0.Val) &&
>> +  // If the resultant load doesn't need a higher alignment than
>> the original!
>> +  if (ISD::isNormalLoad(N0.Val) && N0.hasOneUse() &&
>>       TLI.isOperationLegal(ISD::LOAD, VT)) {
>>     LoadSDNode *LN0 = cast<LoadSDNode>(N0);
>>     unsigned Align = TLI.getTargetMachine().getTargetData()->
>> @@ -3901,6 +3902,54 @@
>>   return SDOperand();
>> }
>>
>> +SDOperand DAGCombiner::visitEXTRACT_VECTOR_ELT(SDNode *N) {
>> +  SDOperand InVec = N->getOperand(0);
>> +  SDOperand EltNo = N->getOperand(1);
>> +
>> +  // (vextract (v4f32 s2v (f32 load $addr)), 0) -> (f32 load $addr)
>> +  // (vextract (v4i32 bc (v4f32 s2v (f32 load $addr))), 0) -> (i32
>> load $addr)
>> +  if (isa<ConstantSDNode>(EltNo)) {
>> +    unsigned Elt = cast<ConstantSDNode>(EltNo)->getValue();
>> +    bool NewLoad = false;
>> +    if (Elt == 0) {
>> +      MVT::ValueType VT = InVec.getValueType();
>> +      MVT::ValueType EVT = MVT::getVectorElementType(VT);
>> +      MVT::ValueType LVT = EVT;
>> +      unsigned NumElts = MVT::getVectorNumElements(VT);
>> +      if (InVec.getOpcode() == ISD::BIT_CONVERT) {
>> +        MVT::ValueType BCVT = InVec.getOperand(0).getValueType();
>> +        if (NumElts != MVT::getVectorNumElements(BCVT))
>> +          return SDOperand();
>> +        InVec = InVec.getOperand(0);
>> +        EVT = MVT::getVectorElementType(BCVT);
>> +        NewLoad = true;
>> +      }
>> +      if (InVec.getOpcode() == ISD::SCALAR_TO_VECTOR &&
>> +          InVec.getOperand(0).getValueType() == EVT &&
>> +          ISD::isNormalLoad(InVec.getOperand(0).Val) &&
>> +          InVec.getOperand(0).hasOneUse()) {
>> +        LoadSDNode *LN0 = cast<LoadSDNode>(InVec.getOperand(0));
>> +        unsigned Align = LN0->getAlignment();
>> +        if (NewLoad) {
>> +          // Check the resultant load doesn't need a higher
>> alignment than the
>> +          // original load.
>> +          unsigned NewAlign = TLI.getTargetMachine().getTargetData
>> ()->
>> +            getABITypeAlignment(MVT::getTypeForValueType(LVT));
>> +          if (!TLI.isOperationLegal(ISD::LOAD, LVT) || NewAlign >
>> Align)
>> +            return SDOperand();
>> +          Align = NewAlign;
>> +        }
>> +
>> +        return DAG.getLoad(LVT, LN0->getChain(), LN0->getBasePtr(),
>> +                           LN0->getSrcValue(), LN0-
>>> getSrcValueOffset(),
>> +                           LN0->isVolatile(), Align);
>> +      }
>> +    }
>> +  }
>> +  return SDOperand();
>> +}
>> +
>> +
>> SDOperand DAGCombiner::visitBUILD_VECTOR(SDNode *N) {
>>   unsigned NumInScalars = N->getNumOperands();
>>   MVT::ValueType VT = N->getValueType(0);
>>
>> Modified: llvm/trunk/lib/Target/X86/X86InstrSSE.td
>> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/X86/
>> X86InstrSSE.td?rev=42677&r1=42676&r2=42677&view=diff
>>
>> === 
>> ===================================================================
>> ========
>> --- llvm/trunk/lib/Target/X86/X86InstrSSE.td (original)
>> +++ llvm/trunk/lib/Target/X86/X86InstrSSE.td Fri Oct  5 21:46:29 2007
>> @@ -2942,11 +2942,3 @@
>>           (MOVUPSmr addr:$dst, VR128:$src)>, Requires<[HasSSE2]>;
>> def : Pat<(store (v16i8 VR128:$src), addr:$dst),
>>           (MOVUPSmr addr:$dst, VR128:$src)>, Requires<[HasSSE2]>;
>> -
>> -// (vextract (v4i32 bc (v4f32 s2v (f32 load $addr))), 0) -> (i32
>> load $addr)
>> -def : Pat<(vector_extract
>> -           (bc_v4i32 (v4f32 (scalar_to_vector (loadf32 addr:
>> $src)))), (iPTR 0)),
>> -          (MOV32rm addr:$src)>, Requires<[HasSSE2]>;
>> -def : Pat<(vector_extract
>> -           (bc_v2i64 (v2f64 (scalar_to_vector (loadf64 addr:
>> $src)))), (iPTR 0)),
>> -          (MOV64rm addr:$src)>, Requires<[HasSSE2, In64BitMode]>;
>>
>>
>> _______________________________________________
>> llvm-commits mailing list
>> llvm-commits at cs.uiuc.edu
>> http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits
>
> _______________________________________________
> llvm-commits mailing list
> llvm-commits at cs.uiuc.edu
> http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits