<div dir="ltr">FYI, in case someone is interested, it would be good to just mark all of these as legal for most types when we have SSE4.1 or higher, and add tablegen patterns to match them directly into (v)pmov{s,z}x instructions. Currently we're generating shifts blindly, and there is no reason to jump through all the hoops of the shuffle machinery on SSE4.1 where we have dedicated instructions to do this...</div>
<div class="gmail_extra"><br><br><div class="gmail_quote">On Thu, Jul 10, 2014 at 5:32 AM, Chandler Carruth <span dir="ltr"><<a href="mailto:chandlerc@gmail.com" target="_blank">chandlerc@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Author: chandlerc<br>
Date: Thu Jul 10 07:32:32 2014<br>
New Revision: 212714<br>
<br>
URL: <a href="http://llvm.org/viewvc/llvm-project?rev=212714&view=rev" target="_blank">http://llvm.org/viewvc/llvm-project?rev=212714&view=rev</a><br>
Log:<br>
[x86,SDAG] Introduce any- and sign-extend-vector-inreg nodes analogous<br>
to the zero-extend-vector-inreg node introduced previously for the same<br>
purpose: manage the type legalization of widened extend operations,<br>
especially to support the experimental widening mode for x86.<br>
<br>
I'm adding both because sign-extend is expanded in terms of any-extend<br>
with shifts to propagate the sign bit. This removes the last<br>
fundamental scalarization from vec_cast2.ll (a test case that hit many<br>
really bad edge cases for widening legalization), although the trunc<br>
tests in that file still appear scalarized because the the shuffle<br>
legalization is scalarizing. Funny thing, I've been working on that.<br>
<br>
Some initial experiments with this and SSE2 scenarios is showing<br>
moderately good behavior already for sign extension. Still some work to<br>
do on the shuffle combining on X86 before we're generating optimal<br>
sequences, but avoiding scalarization is a huge step forward.<br>
<br>
Modified:<br>
    llvm/trunk/include/llvm/CodeGen/ISDOpcodes.h<br>
    llvm/trunk/include/llvm/CodeGen/SelectionDAG.h<br>
    llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeTypes.h<br>
    llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorOps.cpp<br>
    llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp<br>
    llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAG.cpp<br>
    llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp<br>
    llvm/trunk/lib/CodeGen/TargetLoweringBase.cpp<br>
    llvm/trunk/test/CodeGen/X86/vec_cast2.ll<br>
<br>
Modified: llvm/trunk/include/llvm/CodeGen/ISDOpcodes.h<br>
URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/include/llvm/CodeGen/ISDOpcodes.h?rev=212714&r1=212713&r2=212714&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/include/llvm/CodeGen/ISDOpcodes.h?rev=212714&r1=212713&r2=212714&view=diff</a><br>

==============================================================================<br>
--- llvm/trunk/include/llvm/CodeGen/ISDOpcodes.h (original)<br>
+++ llvm/trunk/include/llvm/CodeGen/ISDOpcodes.h Thu Jul 10 07:32:32 2014<br>
@@ -379,6 +379,28 @@ namespace ISD {<br>
     /// operand, a ValueType node.<br>
     SIGN_EXTEND_INREG,<br>
<br>
+    /// ANY_EXTEND_VECTOR_INREG(Vector) - This operator represents an<br>
+    /// in-register any-extension of the low lanes of an integer vector. The<br>
+    /// result type must have fewer elements than the operand type, and those<br>
+    /// elements must be larger integer types such that the total size of the<br>
+    /// operand type and the result type match. Each of the low operand<br>
+    /// elements is any-extended into the corresponding, wider result<br>
+    /// elements with the high bits becoming undef.<br>
+    ANY_EXTEND_VECTOR_INREG,<br>
+<br>
+    /// SIGN_EXTEND_VECTOR_INREG(Vector) - This operator represents an<br>
+    /// in-register sign-extension of the low lanes of an integer vector. The<br>
+    /// result type must have fewer elements than the operand type, and those<br>
+    /// elements must be larger integer types such that the total size of the<br>
+    /// operand type and the result type match. Each of the low operand<br>
+    /// elements is sign-extended into the corresponding, wider result<br>
+    /// elements.<br>
+    // FIXME: The SIGN_EXTEND_INREG node isn't specifically limited to<br>
+    // scalars, but it also doesn't handle vectors well. Either it should be<br>
+    // restricted to scalars or this node (and its handling) should be merged<br>
+    // into it.<br>
+    SIGN_EXTEND_VECTOR_INREG,<br>
+<br>
     /// ZERO_EXTEND_VECTOR_INREG(Vector) - This operator represents an<br>
     /// in-register zero-extension of the low lanes of an integer vector. The<br>
     /// result type must have fewer elements than the operand type, and those<br>
<br>
Modified: llvm/trunk/include/llvm/CodeGen/SelectionDAG.h<br>
URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/include/llvm/CodeGen/SelectionDAG.h?rev=212714&r1=212713&r2=212714&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/include/llvm/CodeGen/SelectionDAG.h?rev=212714&r1=212713&r2=212714&view=diff</a><br>

==============================================================================<br>
--- llvm/trunk/include/llvm/CodeGen/SelectionDAG.h (original)<br>
+++ llvm/trunk/include/llvm/CodeGen/SelectionDAG.h Thu Jul 10 07:32:32 2014<br>
@@ -562,6 +562,18 @@ public:<br>
   /// value assuming it was the smaller SrcTy value.<br>
   SDValue getZeroExtendInReg(SDValue Op, SDLoc DL, EVT SrcTy);<br>
<br>
+  /// getAnyExtendVectorInReg - Return an operation which will any-extend the<br>
+  /// low lanes of the operand into the specified vector type. For example,<br>
+  /// this can convert a v16i8 into a v4i32 by any-extending the low four<br>
+  /// lanes of the operand from i8 to i32.<br>
+  SDValue getAnyExtendVectorInReg(SDValue Op, SDLoc DL, EVT VT);<br>
+<br>
+  /// getSignExtendVectorInReg - Return an operation which will sign extend the<br>
+  /// low lanes of the operand into the specified vector type. For example,<br>
+  /// this can convert a v16i8 into a v4i32 by sign extending the low four<br>
+  /// lanes of the operand from i8 to i32.<br>
+  SDValue getSignExtendVectorInReg(SDValue Op, SDLoc DL, EVT VT);<br>
+<br>
   /// getZeroExtendVectorInReg - Return an operation which will zero extend the<br>
   /// low lanes of the operand into the specified vector type. For example,<br>
   /// this can convert a v16i8 into a v4i32 by zero extending the low four<br>
<br>
Modified: llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeTypes.h<br>
URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeTypes.h?rev=212714&r1=212713&r2=212714&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeTypes.h?rev=212714&r1=212713&r2=212714&view=diff</a><br>

==============================================================================<br>
--- llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeTypes.h (original)<br>
+++ llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeTypes.h Thu Jul 10 07:32:32 2014<br>
@@ -645,11 +645,11 @@ private:<br>
   bool WidenVectorOperand(SDNode *N, unsigned OpNo);<br>
   SDValue WidenVecOp_BITCAST(SDNode *N);<br>
   SDValue WidenVecOp_CONCAT_VECTORS(SDNode *N);<br>
+  SDValue WidenVecOp_EXTEND(SDNode *N);<br>
   SDValue WidenVecOp_EXTRACT_VECTOR_ELT(SDNode *N);<br>
   SDValue WidenVecOp_EXTRACT_SUBVECTOR(SDNode *N);<br>
   SDValue WidenVecOp_STORE(SDNode* N);<br>
   SDValue WidenVecOp_SETCC(SDNode* N);<br>
-  SDValue WidenVecOp_ZERO_EXTEND(SDNode *N);<br>
<br>
   SDValue WidenVecOp_Convert(SDNode *N);<br>
<br>
<br>
Modified: llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorOps.cpp<br>
URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorOps.cpp?rev=212714&r1=212713&r2=212714&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorOps.cpp?rev=212714&r1=212713&r2=212714&view=diff</a><br>

==============================================================================<br>
--- llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorOps.cpp (original)<br>
+++ llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorOps.cpp Thu Jul 10 07:32:32 2014<br>
@@ -75,6 +75,20 @@ class VectorLegalizer {<br>
   /// \brief Implement expansion for SIGN_EXTEND_INREG using SRL and SRA.<br>
   SDValue ExpandSEXTINREG(SDValue Op);<br>
<br>
+  /// \brief Implement expansion for ANY_EXTEND_VECTOR_INREG.<br>
+  ///<br>
+  /// Shuffles the low lanes of the operand into place and bitcasts to the proper<br>
+  /// type. The contents of the bits in the extended part of each element are<br>
+  /// undef.<br>
+  SDValue ExpandANY_EXTEND_VECTOR_INREG(SDValue Op);<br>
+<br>
+  /// \brief Implement expansion for SIGN_EXTEND_VECTOR_INREG.<br>
+  ///<br>
+  /// Shuffles the low lanes of the operand into place, bitcasts to the proper<br>
+  /// type, then shifts left and arithmetic shifts right to introduce a sign<br>
+  /// extension.<br>
+  SDValue ExpandSIGN_EXTEND_VECTOR_INREG(SDValue Op);<br>
+<br>
   /// \brief Implement expansion for ZERO_EXTEND_VECTOR_INREG.<br>
   ///<br>
   /// Shuffles the low lanes of the operand into place and blends zeros into<br>
@@ -280,6 +294,8 @@ SDValue VectorLegalizer::LegalizeOp(SDVa<br>
   case ISD::FP_EXTEND:<br>
   case ISD::FMA:<br>
   case ISD::SIGN_EXTEND_INREG:<br>
+  case ISD::ANY_EXTEND_VECTOR_INREG:<br>
+  case ISD::SIGN_EXTEND_VECTOR_INREG:<br>
   case ISD::ZERO_EXTEND_VECTOR_INREG:<br>
     QueryType = Node->getValueType(0);<br>
     break;<br>
@@ -621,6 +637,10 @@ SDValue VectorLegalizer::Expand(SDValue<br>
   switch (Op->getOpcode()) {<br>
   case ISD::SIGN_EXTEND_INREG:<br>
     return ExpandSEXTINREG(Op);<br>
+  case ISD::ANY_EXTEND_VECTOR_INREG:<br>
+    return ExpandANY_EXTEND_VECTOR_INREG(Op);<br>
+  case ISD::SIGN_EXTEND_VECTOR_INREG:<br>
+    return ExpandSIGN_EXTEND_VECTOR_INREG(Op);<br>
   case ISD::ZERO_EXTEND_VECTOR_INREG:<br>
     return ExpandZERO_EXTEND_VECTOR_INREG(Op);<br>
   case ISD::BSWAP:<br>
@@ -717,6 +737,52 @@ SDValue VectorLegalizer::ExpandSEXTINREG<br>
   return DAG.getNode(ISD::SRA, DL, VT, Op, ShiftSz);<br>
 }<br>
<br>
+// Generically expand a vector anyext in register to a shuffle of the relevant<br>
+// lanes into the appropriate locations, with other lanes left undef.<br>
+SDValue VectorLegalizer::ExpandANY_EXTEND_VECTOR_INREG(SDValue Op) {<br>
+  SDLoc DL(Op);<br>
+  EVT VT = Op.getValueType();<br>
+  int NumElements = VT.getVectorNumElements();<br>
+  SDValue Src = Op.getOperand(0);<br>
+  EVT SrcVT = Src.getValueType();<br>
+  int NumSrcElements = SrcVT.getVectorNumElements();<br>
+<br>
+  // Build a base mask of undef shuffles.<br>
+  SmallVector<int, 16> ShuffleMask;<br>
+  ShuffleMask.resize(NumSrcElements, -1);<br>
+<br>
+  // Place the extended lanes into the correct locations.<br>
+  int ExtLaneScale = NumSrcElements / NumElements;<br>
+  int EndianOffset = TLI.isBigEndian() ? ExtLaneScale - 1 : 0;<br>
+  for (int i = 0; i < NumElements; ++i)<br>
+    ShuffleMask[i * ExtLaneScale + EndianOffset] = i;<br>
+<br>
+  return DAG.getNode(<br>
+      ISD::BITCAST, DL, VT,<br>
+      DAG.getVectorShuffle(SrcVT, DL, Src, DAG.getUNDEF(SrcVT), ShuffleMask));<br>
+}<br>
+<br>
+SDValue VectorLegalizer::ExpandSIGN_EXTEND_VECTOR_INREG(SDValue Op) {<br>
+  SDLoc DL(Op);<br>
+  EVT VT = Op.getValueType();<br>
+  SDValue Src = Op.getOperand(0);<br>
+  EVT SrcVT = Src.getValueType();<br>
+<br>
+  // First build an any-extend node which can be legalized above when we<br>
+  // recurse through it.<br>
+  Op = DAG.getAnyExtendVectorInReg(Src, DL, VT);<br>
+<br>
+  // Now we need sign extend. Do this by shifting the elements. Even if these<br>
+  // aren't legal operations, they have a better chance of being legalized<br>
+  // without full scalarization than the sign extension does.<br>
+  unsigned EltWidth = VT.getVectorElementType().getSizeInBits();<br>
+  unsigned SrcEltWidth = SrcVT.getVectorElementType().getSizeInBits();<br>
+  SDValue ShiftAmount = DAG.getConstant(EltWidth - SrcEltWidth, VT);<br>
+  return DAG.getNode(ISD::SRA, DL, VT,<br>
+                     DAG.getNode(ISD::SHL, DL, VT, Op, ShiftAmount),<br>
+                     ShiftAmount);<br>
+}<br>
+<br>
 // Generically expand a vector zext in register to a shuffle of the relevant<br>
 // lanes into the appropriate locations, a blend of zero into the high bits,<br>
 // and a bitcast to the wider element type.<br>
<br>
Modified: llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp<br>
URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp?rev=212714&r1=212713&r2=212714&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp?rev=212714&r1=212713&r2=212714&view=diff</a><br>

==============================================================================<br>
--- llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp (original)<br>
+++ llvm/trunk/lib/CodeGen/SelectionDAG/LegalizeVectorTypes.cpp Thu Jul 10 07:32:32 2014<br>
@@ -2398,7 +2398,12 @@ bool DAGTypeLegalizer::WidenVectorOperan<br>
   case ISD::EXTRACT_VECTOR_ELT: Res = WidenVecOp_EXTRACT_VECTOR_ELT(N); break;<br>
   case ISD::STORE:              Res = WidenVecOp_STORE(N); break;<br>
   case ISD::SETCC:              Res = WidenVecOp_SETCC(N); break;<br>
-  case ISD::ZERO_EXTEND:        Res = WidenVecOp_ZERO_EXTEND(N); break;<br>
+<br>
+  case ISD::ANY_EXTEND:<br>
+  case ISD::SIGN_EXTEND:<br>
+  case ISD::ZERO_EXTEND:<br>
+    Res = WidenVecOp_EXTEND(N);<br>
+    break;<br>
<br>
   case ISD::FP_EXTEND:<br>
   case ISD::FP_TO_SINT:<br>
@@ -2406,8 +2411,6 @@ bool DAGTypeLegalizer::WidenVectorOperan<br>
   case ISD::SINT_TO_FP:<br>
   case ISD::UINT_TO_FP:<br>
   case ISD::TRUNCATE:<br>
-  case ISD::SIGN_EXTEND:<br>
-  case ISD::ANY_EXTEND:<br>
     Res = WidenVecOp_Convert(N);<br>
     break;<br>
   }<br>
@@ -2428,14 +2431,14 @@ bool DAGTypeLegalizer::WidenVectorOperan<br>
   return false;<br>
 }<br>
<br>
-SDValue DAGTypeLegalizer::WidenVecOp_ZERO_EXTEND(SDNode *N) {<br>
+SDValue DAGTypeLegalizer::WidenVecOp_EXTEND(SDNode *N) {<br>
   SDLoc DL(N);<br>
   EVT VT = N->getValueType(0);<br>
<br>
   SDValue InOp = N->getOperand(0);<br>
   // If some legalization strategy other than widening is used on the operand,<br>
-  // we can't safely assume that just zero-extending the low lanes is the<br>
-  // correct transformation.<br>
+  // we can't safely assume that just extending the low lanes is the correct<br>
+  // transformation.<br>
   if (getTypeAction(InOp.getValueType()) != TargetLowering::TypeWidenVector)<br>
     return WidenVecOp_Convert(N);<br>
   InOp = GetWidenedVector(InOp);<br>
@@ -2476,9 +2479,18 @@ SDValue DAGTypeLegalizer::WidenVecOp_ZER<br>
       return WidenVecOp_Convert(N);<br>
   }<br>
<br>
-  // Use a special DAG node to represent the operation of zero extending the<br>
+  // Use special DAG nodes to represent the operation of extending the<br>
   // low lanes.<br>
-  return DAG.getZeroExtendVectorInReg(InOp, DL, VT);<br>
+  switch (N->getOpcode()) {<br>
+  default:<br>
+    llvm_unreachable("Extend legalization on on extend operation!");<br>
+  case ISD::ANY_EXTEND:<br>
+    return DAG.getAnyExtendVectorInReg(InOp, DL, VT);<br>
+  case ISD::SIGN_EXTEND:<br>
+    return DAG.getSignExtendVectorInReg(InOp, DL, VT);<br>
+  case ISD::ZERO_EXTEND:<br>
+    return DAG.getZeroExtendVectorInReg(InOp, DL, VT);<br>
+  }<br>
 }<br>
<br>
 SDValue DAGTypeLegalizer::WidenVecOp_Convert(SDNode *N) {<br>
<br>
Modified: llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAG.cpp<br>
URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAG.cpp?rev=212714&r1=212713&r2=212714&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAG.cpp?rev=212714&r1=212713&r2=212714&view=diff</a><br>

==============================================================================<br>
--- llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAG.cpp (original)<br>
+++ llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAG.cpp Thu Jul 10 07:32:32 2014<br>
@@ -1033,6 +1033,26 @@ SDValue SelectionDAG::getZeroExtendInReg<br>
                  getConstant(Imm, Op.getValueType()));<br>
 }<br>
<br>
+SDValue SelectionDAG::getAnyExtendVectorInReg(SDValue Op, SDLoc DL, EVT VT) {<br>
+  assert(VT.isVector() && "This DAG node is restricted to vector types.");<br>
+  assert(VT.getSizeInBits() == Op.getValueType().getSizeInBits() &&<br>
+         "The sizes of the input and result must match in order to perform the "<br>
+         "extend in-register.");<br>
+  assert(VT.getVectorNumElements() < Op.getValueType().getVectorNumElements() &&<br>
+         "The destination vector type must have fewer lanes than the input.");<br>
+  return getNode(ISD::ANY_EXTEND_VECTOR_INREG, DL, VT, Op);<br>
+}<br>
+<br>
+SDValue SelectionDAG::getSignExtendVectorInReg(SDValue Op, SDLoc DL, EVT VT) {<br>
+  assert(VT.isVector() && "This DAG node is restricted to vector types.");<br>
+  assert(VT.getSizeInBits() == Op.getValueType().getSizeInBits() &&<br>
+         "The sizes of the input and result must match in order to perform the "<br>
+         "extend in-register.");<br>
+  assert(VT.getVectorNumElements() < Op.getValueType().getVectorNumElements() &&<br>
+         "The destination vector type must have fewer lanes than the input.");<br>
+  return getNode(ISD::SIGN_EXTEND_VECTOR_INREG, DL, VT, Op);<br>
+}<br>
+<br>
 SDValue SelectionDAG::getZeroExtendVectorInReg(SDValue Op, SDLoc DL, EVT VT) {<br>
   assert(VT.isVector() && "This DAG node is restricted to vector types.");<br>
   assert(VT.getSizeInBits() == Op.getValueType().getSizeInBits() &&<br>
<br>
Modified: llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp<br>
URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp?rev=212714&r1=212713&r2=212714&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp?rev=212714&r1=212713&r2=212714&view=diff</a><br>

==============================================================================<br>
--- llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp (original)<br>
+++ llvm/trunk/lib/CodeGen/SelectionDAG/SelectionDAGDumper.cpp Thu Jul 10 07:32:32 2014<br>
@@ -221,6 +221,8 @@ std::string SDNode::getOperationName(con<br>
   case ISD::ZERO_EXTEND:                return "zero_extend";<br>
   case ISD::ANY_EXTEND:                 return "any_extend";<br>
   case ISD::SIGN_EXTEND_INREG:          return "sign_extend_inreg";<br>
+  case ISD::ANY_EXTEND_VECTOR_INREG:    return "any_extend_vector_inreg";<br>
+  case ISD::SIGN_EXTEND_VECTOR_INREG:   return "sign_extend_vector_inreg";<br>
   case ISD::ZERO_EXTEND_VECTOR_INREG:   return "zero_extend_vector_inreg";<br>
   case ISD::TRUNCATE:                   return "truncate";<br>
   case ISD::FP_ROUND:                   return "fp_round";<br>
<br>
Modified: llvm/trunk/lib/CodeGen/TargetLoweringBase.cpp<br>
URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/TargetLoweringBase.cpp?rev=212714&r1=212713&r2=212714&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/CodeGen/TargetLoweringBase.cpp?rev=212714&r1=212713&r2=212714&view=diff</a><br>

==============================================================================<br>
--- llvm/trunk/lib/CodeGen/TargetLoweringBase.cpp (original)<br>
+++ llvm/trunk/lib/CodeGen/TargetLoweringBase.cpp Thu Jul 10 07:32:32 2014<br>
@@ -746,6 +746,10 @@ void TargetLoweringBase::initActions() {<br>
     if (VT >= MVT::FIRST_VECTOR_VALUETYPE &&<br>
         VT <= MVT::LAST_VECTOR_VALUETYPE) {<br>
       setOperationAction(ISD::FCOPYSIGN, (MVT::SimpleValueType)VT, Expand);<br>
+      setOperationAction(ISD::ANY_EXTEND_VECTOR_INREG,<br>
+                         (MVT::SimpleValueType)VT, Expand);<br>
+      setOperationAction(ISD::SIGN_EXTEND_VECTOR_INREG,<br>
+                         (MVT::SimpleValueType)VT, Expand);<br>
       setOperationAction(ISD::ZERO_EXTEND_VECTOR_INREG,<br>
                          (MVT::SimpleValueType)VT, Expand);<br>
     }<br>
<br>
Modified: llvm/trunk/test/CodeGen/X86/vec_cast2.ll<br>
URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/test/CodeGen/X86/vec_cast2.ll?rev=212714&r1=212713&r2=212714&view=diff" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/test/CodeGen/X86/vec_cast2.ll?rev=212714&r1=212713&r2=212714&view=diff</a><br>

==============================================================================<br>
--- llvm/trunk/test/CodeGen/X86/vec_cast2.ll (original)<br>
+++ llvm/trunk/test/CodeGen/X86/vec_cast2.ll Thu Jul 10 07:32:32 2014<br>
@@ -4,6 +4,17 @@<br>
 ;CHECK-LABEL: foo1_8:<br>
 ;CHECK: vcvtdq2ps<br>
 ;CHECK: ret<br>
+;<br>
+;CHECK-WIDE-LABEL: foo1_8:<br>
+;CHECK-WIDE:      vpmovzxbd %xmm0, %xmm1<br>
+;CHECK-WIDE-NEXT: vpslld $24, %xmm1, %xmm1<br>
+;CHECK-WIDE-NEXT: vpsrad $24, %xmm1, %xmm1<br>
+;CHECK-WIDE-NEXT: vpshufb {{.*}}, %xmm0, %xmm0<br>
+;CHECK-WIDE-NEXT: vpslld $24, %xmm0, %xmm0<br>
+;CHECK-WIDE-NEXT: vpsrad $24, %xmm0, %xmm0<br>
+;CHECK-WIDE-NEXT: vinsertf128 $1, %xmm0, %ymm1, %ymm0<br>
+;CHECK-WIDE-NEXT: vcvtdq2ps %ymm0, %ymm0<br>
+;CHECK-WIDE-NEXT: ret<br>
 define <8 x float> @foo1_8(<8 x i8> %src) {<br>
   %res = sitofp <8 x i8> %src to <8 x float><br>
   ret <8 x float> %res<br>
@@ -12,6 +23,13 @@ define <8 x float> @foo1_8(<8 x i8> %src<br>
 ;CHECK-LABEL: foo1_4:<br>
 ;CHECK: vcvtdq2ps<br>
 ;CHECK: ret<br>
+;<br>
+;CHECK-WIDE-LABEL: foo1_4:<br>
+;CHECK-WIDE:      vpmovzxbd %xmm0, %xmm0<br>
+;CHECK-WIDE-NEXT: vpslld $24, %xmm0, %xmm0<br>
+;CHECK-WIDE-NEXT: vpsrad $24, %xmm0, %xmm0<br>
+;CHECK-WIDE-NEXT: vcvtdq2ps %xmm0, %xmm0<br>
+;CHECK-WIDE-NEXT: ret<br>
 define <4 x float> @foo1_4(<4 x i8> %src) {<br>
   %res = sitofp <4 x i8> %src to <4 x float><br>
   ret <4 x float> %res<br>
<br>
<br>
_______________________________________________<br>
llvm-commits mailing list<br>
<a href="mailto:llvm-commits@cs.uiuc.edu">llvm-commits@cs.uiuc.edu</a><br>
<a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits</a><br>
</blockquote></div><br></div>