[llvm-commits] [llvm] r128940 - in /llvm/trunk/lib/Target/ARM: ARMExpandPseudoInsts.cpp ARMISelLowering.cpp ARMInstrInfo.td

Mon Apr 11 11:57:22 PDT 2011

Hi Owen,

Sorry for the late response. This needs the same ARMPseudoInst treatment you gave RSB/RSC in r128965. Otherwise, we're defining a pseudo-instruction with real instruction patterns, which isn't good, plus we run into the same instruction composition errors (duplicate operands and such), resulting in an assertion error when building ClamAV.

-Jim

On Apr 5, 2011, at 2:48 PM, Owen Anderson wrote:

> Author: resistor
> Date: Tue Apr  5 16:48:57 2011
> New Revision: 128940
> 
> URL: http://llvm.org/viewvc/llvm-project?rev=128940&view=rev
> Log:
> Fix bugs in the pseuo-ization of ADCS/SBCS pointed out by Jim, as well as doing the expansion earlier (using a custom inserter) to allow for the chance of predicating these instructions.
> 
> Modified:
>    llvm/trunk/lib/Target/ARM/ARMExpandPseudoInsts.cpp
>    llvm/trunk/lib/Target/ARM/ARMISelLowering.cpp
>    llvm/trunk/lib/Target/ARM/ARMInstrInfo.td
> 
> Modified: llvm/trunk/lib/Target/ARM/ARMExpandPseudoInsts.cpp
> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/ARM/ARMExpandPseudoInsts.cpp?rev=128940&r1=128939&r2=128940&view=diff
> ==============================================================================
> --- llvm/trunk/lib/Target/ARM/ARMExpandPseudoInsts.cpp (original)
> +++ llvm/trunk/lib/Target/ARM/ARMExpandPseudoInsts.cpp Tue Apr  5 16:48:57 2011
> @@ -55,7 +55,6 @@
>     void ExpandVLD(MachineBasicBlock::iterator &MBBI);
>     void ExpandVST(MachineBasicBlock::iterator &MBBI);
>     void ExpandLaneOp(MachineBasicBlock::iterator &MBBI);
> -    void ExpandSBitOp(MachineBasicBlock::iterator &MBBI);
>     void ExpandVTBL(MachineBasicBlock::iterator &MBBI,
>                     unsigned Opc, bool IsExt, unsigned NumRegs);
>     void ExpandMOV32BitImm(MachineBasicBlock &MBB,
> @@ -630,43 +629,6 @@
>   MI.eraseFromParent();
> }
> 
> -void ARMExpandPseudo::ExpandSBitOp(MachineBasicBlock::iterator &MBBI) {
> -  MachineInstr &MI = *MBBI;
> -  MachineBasicBlock &MBB = *MI.getParent();
> -  unsigned OldOpc = MI.getOpcode();
> -  unsigned Opc = 0;
> -  switch (OldOpc) {
> -    case ARM::ADCSSrr:
> -      Opc = ARM::ADCrr;
> -      break;
> -    case ARM::ADCSSri:
> -      Opc = ARM::ADCri;
> -      break;
> -    case ARM::ADCSSrs:
> -      Opc = ARM::ADCrs;
> -      break;
> -    case ARM::SBCSSrr:
> -      Opc = ARM::SBCrr;
> -      break;
> -    case ARM::SBCSSri:
> -      Opc = ARM::SBCri;
> -      break;
> -    case ARM::SBCSSrs:
> -      Opc = ARM::SBCrs;
> -      break;
> -    default:
> -      llvm_unreachable("Unknown opcode?");
> -  }
> -
> -  MachineInstrBuilder MIB = BuildMI(MBB, MBBI, MI.getDebugLoc(), TII->get(Opc));
> -  MIB.addOperand(MachineOperand::CreateImm(0)); // Predicate
> -  MIB.addOperand(MachineOperand::CreateImm(0)); // S bit
> -  for (unsigned i = 0; i < MI.getNumOperands(); ++i)
> -    MIB.addOperand(MI.getOperand(i));
> -  TransferImpOps(MI, MIB, MIB);
> -  MI.eraseFromParent();
> -}
> -
> void ARMExpandPseudo::ExpandMOV32BitImm(MachineBasicBlock &MBB,
>                                         MachineBasicBlock::iterator &MBBI) {
>   MachineInstr &MI = *MBBI;
> @@ -979,15 +941,6 @@
>       ExpandMOV32BitImm(MBB, MBBI);
>       return true;
> 
> -    case ARM::ADCSSri:
> -    case ARM::ADCSSrr:
> -    case ARM::ADCSSrs:
> -    case ARM::SBCSSri:
> -    case ARM::SBCSSrr:
> -    case ARM::SBCSSrs:
> -      ExpandSBitOp(MBBI);
> -      return true;
> -
>     case ARM::VMOVQQ: {
>       unsigned DstReg = MI.getOperand(0).getReg();
>       bool DstIsDead = MI.getOperand(0).isDead();
> 
> Modified: llvm/trunk/lib/Target/ARM/ARMISelLowering.cpp
> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/ARM/ARMISelLowering.cpp?rev=128940&r1=128939&r2=128940&view=diff
> ==============================================================================
> --- llvm/trunk/lib/Target/ARM/ARMISelLowering.cpp (original)
> +++ llvm/trunk/lib/Target/ARM/ARMISelLowering.cpp Tue Apr  5 16:48:57 2011
> @@ -2390,7 +2390,7 @@
>       assert(VA.getValVT() != MVT::i64 && "i64 should already be lowered");
> 
>       int index = ArgLocs[i].getValNo();
> -      
> +
>       // Some Ins[] entries become multiple ArgLoc[] entries.
>       // Process them only once.
>       if (index != lastInsIndex)
> @@ -2966,7 +2966,7 @@
>     AllOnes = DAG.getNode(ARMISD::VMOVIMM, dl, MVT::v8i8, AllOnes);
>     SDValue MaskNot = DAG.getNode(ISD::XOR, dl, OpVT, Mask,
>                                   DAG.getNode(ISD::BITCAST, dl, OpVT, AllOnes));
> -                                              
> +
>     SDValue Res = DAG.getNode(ISD::OR, dl, OpVT,
>                               DAG.getNode(ISD::AND, dl, OpVT, Tmp1, Mask),
>                               DAG.getNode(ISD::AND, dl, OpVT, Tmp0, MaskNot));
> @@ -4147,7 +4147,7 @@
>                        DAG.getNode(ISD::BUILD_VECTOR, DL, MVT::v8i8,
>                                    &VTBLMask[0], 8));
> 
> -  return DAG.getNode(ARMISD::VTBL2, DL, MVT::v8i8, V1, V2, 
> +  return DAG.getNode(ARMISD::VTBL2, DL, MVT::v8i8, V1, V2,
>                      DAG.getNode(ISD::BUILD_VECTOR, DL, MVT::v8i8,
>                                  &VTBLMask[0], 8));
> }
> @@ -4520,7 +4520,7 @@
>                                DAG.getNode(ISD::BITCAST, DL, Op1VT, N01), Op1));
> }
> 
> -static SDValue 
> +static SDValue
> LowerSDIV_v4i8(SDValue X, SDValue Y, DebugLoc dl, SelectionDAG &DAG) {
>   // Convert to float
>   // float4 xf = vcvt_f32_s32(vmovl_s16(a.lo));
> @@ -4531,7 +4531,7 @@
>   Y = DAG.getNode(ISD::SINT_TO_FP, dl, MVT::v4f32, Y);
>   // Get reciprocal estimate.
>   // float4 recip = vrecpeq_f32(yf);
> -  Y = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32, 
> +  Y = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32,
>                    DAG.getConstant(Intrinsic::arm_neon_vrecpe, MVT::i32), Y);
>   // Because char has a smaller range than uchar, we can actually get away
>   // without any newton steps.  This requires that we use a weird bias
> @@ -4549,7 +4549,7 @@
>   return X;
> }
> 
> -static SDValue 
> +static SDValue
> LowerSDIV_v4i16(SDValue N0, SDValue N1, DebugLoc dl, SelectionDAG &DAG) {
>   SDValue N2;
>   // Convert to float.
> @@ -4559,13 +4559,13 @@
>   N1 = DAG.getNode(ISD::SIGN_EXTEND, dl, MVT::v4i32, N1);
>   N0 = DAG.getNode(ISD::SINT_TO_FP, dl, MVT::v4f32, N0);
>   N1 = DAG.getNode(ISD::SINT_TO_FP, dl, MVT::v4f32, N1);
> -  
> +
>   // Use reciprocal estimate and one refinement step.
>   // float4 recip = vrecpeq_f32(yf);
>   // recip *= vrecpsq_f32(yf, recip);
> -  N2 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32, 
> +  N2 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32,
>                    DAG.getConstant(Intrinsic::arm_neon_vrecpe, MVT::i32), N1);
> -  N1 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32, 
> +  N1 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32,
>                    DAG.getConstant(Intrinsic::arm_neon_vrecps, MVT::i32),
>                    N1, N2);
>   N2 = DAG.getNode(ISD::FMUL, dl, MVT::v4f32, N1, N2);
> @@ -4595,15 +4595,15 @@
>   SDValue N0 = Op.getOperand(0);
>   SDValue N1 = Op.getOperand(1);
>   SDValue N2, N3;
> -  
> +
>   if (VT == MVT::v8i8) {
>     N0 = DAG.getNode(ISD::SIGN_EXTEND, dl, MVT::v8i16, N0);
>     N1 = DAG.getNode(ISD::SIGN_EXTEND, dl, MVT::v8i16, N1);
> -    
> +
>     N2 = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v4i16, N0,
>                      DAG.getIntPtrConstant(4));
>     N3 = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v4i16, N1,
> -                     DAG.getIntPtrConstant(4)); 
> +                     DAG.getIntPtrConstant(4));
>     N0 = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v4i16, N0,
>                      DAG.getIntPtrConstant(0));
>     N1 = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v4i16, N1,
> @@ -4614,7 +4614,7 @@
> 
>     N0 = DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v8i16, N0, N2);
>     N0 = LowerCONCAT_VECTORS(N0, DAG);
> -    
> +
>     N0 = DAG.getNode(ISD::TRUNCATE, dl, MVT::v8i8, N0);
>     return N0;
>   }
> @@ -4630,32 +4630,32 @@
>   SDValue N0 = Op.getOperand(0);
>   SDValue N1 = Op.getOperand(1);
>   SDValue N2, N3;
> -  
> +
>   if (VT == MVT::v8i8) {
>     N0 = DAG.getNode(ISD::ZERO_EXTEND, dl, MVT::v8i16, N0);
>     N1 = DAG.getNode(ISD::ZERO_EXTEND, dl, MVT::v8i16, N1);
> -    
> +
>     N2 = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v4i16, N0,
>                      DAG.getIntPtrConstant(4));
>     N3 = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v4i16, N1,
> -                     DAG.getIntPtrConstant(4)); 
> +                     DAG.getIntPtrConstant(4));
>     N0 = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v4i16, N0,
>                      DAG.getIntPtrConstant(0));
>     N1 = DAG.getNode(ISD::EXTRACT_SUBVECTOR, dl, MVT::v4i16, N1,
>                      DAG.getIntPtrConstant(0));
> -    
> +
>     N0 = LowerSDIV_v4i16(N0, N1, dl, DAG); // v4i16
>     N2 = LowerSDIV_v4i16(N2, N3, dl, DAG); // v4i16
> -    
> +
>     N0 = DAG.getNode(ISD::CONCAT_VECTORS, dl, MVT::v8i16, N0, N2);
>     N0 = LowerCONCAT_VECTORS(N0, DAG);
> -    
> -    N0 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v8i8, 
> +
> +    N0 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v8i8,
>                      DAG.getConstant(Intrinsic::arm_neon_vqmovnsu, MVT::i32),
>                      N0);
>     return N0;
>   }
> -  
> +
>   // v4i16 sdiv ... Convert to float.
>   // float4 yf = vcvt_f32_s32(vmovl_u16(y));
>   // float4 xf = vcvt_f32_s32(vmovl_u16(x));
> @@ -4668,13 +4668,13 @@
>   // float4 recip = vrecpeq_f32(yf);
>   // recip *= vrecpsq_f32(yf, recip);
>   // recip *= vrecpsq_f32(yf, recip);
> -  N2 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32, 
> +  N2 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32,
>                    DAG.getConstant(Intrinsic::arm_neon_vrecpe, MVT::i32), N1);
> -  N1 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32, 
> +  N1 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32,
>                    DAG.getConstant(Intrinsic::arm_neon_vrecps, MVT::i32),
>                    N1, N2);
>   N2 = DAG.getNode(ISD::FMUL, dl, MVT::v4f32, N1, N2);
> -  N1 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32, 
> +  N1 = DAG.getNode(ISD::INTRINSIC_WO_CHAIN, dl, MVT::v4f32,
>                    DAG.getConstant(Intrinsic::arm_neon_vrecps, MVT::i32),
>                    N1, N2);
>   N2 = DAG.getNode(ISD::FMUL, dl, MVT::v4f32, N1, N2);
> @@ -5024,6 +5024,48 @@
>   case ARM::ATOMIC_CMP_SWAP_I16: return EmitAtomicCmpSwap(MI, BB, 2);
>   case ARM::ATOMIC_CMP_SWAP_I32: return EmitAtomicCmpSwap(MI, BB, 4);
> 
> +  case ARM::ADCSSri:
> +  case ARM::ADCSSrr:
> +  case ARM::ADCSSrs:
> +  case ARM::SBCSSri:
> +  case ARM::SBCSSrr:
> +  case ARM::SBCSSrs: {
> +    unsigned OldOpc = MI->getOpcode();
> +    unsigned Opc = 0;
> +    switch (OldOpc) {
> +      case ARM::ADCSSrr:
> +        Opc = ARM::ADCrr;
> +        break;
> +      case ARM::ADCSSri:
> +        Opc = ARM::ADCri;
> +        break;
> +      case ARM::ADCSSrs:
> +        Opc = ARM::ADCrs;
> +        break;
> +      case ARM::SBCSSrr:
> +        Opc = ARM::SBCrr;
> +        break;
> +      case ARM::SBCSSri:
> +        Opc = ARM::SBCri;
> +        break;
> +      case ARM::SBCSSrs:
> +        Opc = ARM::SBCrs;
> +        break;
> +      default:
> +        llvm_unreachable("Unknown opcode?");
> +    }
> +
> +    MachineInstrBuilder MIB =
> +      BuildMI(*BB, MI, MI->getDebugLoc(), TII->get(Opc));
> +    for (unsigned i = 0; i < MI->getNumOperands(); ++i)
> +      MIB.addOperand(MI->getOperand(i));
> +    AddDefaultPred(MIB);
> +    MIB.addReg(ARM::CPSR, RegState::Define); // S bit
> +    MI->eraseFromParent();
> +    return BB;
> +  }
> +
> +
>   case ARM::tMOVCCr_pseudo: {
>     // To "insert" a SELECT_CC instruction, we actually have to insert the
>     // diamond control-flow pattern.  The incoming instruction knows the
> @@ -5326,7 +5368,7 @@
> 
> static SDValue PerformANDCombine(SDNode *N,
>                                 TargetLowering::DAGCombinerInfo &DCI) {
> -  
> +
>   // Attempt to use immediate-form VBIC
>   BuildVectorSDNode *BVN = dyn_cast<BuildVectorSDNode>(N->getOperand(1));
>   DebugLoc dl = N->getDebugLoc();
> @@ -5851,7 +5893,7 @@
>     EVT VecTy;
>     if (isLoad)
>       VecTy = N->getValueType(0);
> -    else 
> +    else
>       VecTy = N->getOperand(AddrOpIdx+1).getValueType();
>     unsigned NumBytes = NumVecs * VecTy.getSizeInBits() / 8;
>     if (isLaneOp)
> @@ -5901,7 +5943,7 @@
>     DCI.CombineTo(User, SDValue(UpdN.getNode(), NumResultVecs));
> 
>     break;
> -  } 
> +  }
>   return SDValue();
> }
> 
> 
> Modified: llvm/trunk/lib/Target/ARM/ARMInstrInfo.td
> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/ARM/ARMInstrInfo.td?rev=128940&r1=128939&r2=128940&view=diff
> ==============================================================================
> --- llvm/trunk/lib/Target/ARM/ARMInstrInfo.td (original)
> +++ llvm/trunk/lib/Target/ARM/ARMInstrInfo.td Tue Apr  5 16:48:57 2011
> @@ -936,8 +936,7 @@
> }
> // Carry setting variants
> let isCodeGenOnly = 1, Defs = [CPSR] in {
> -multiclass AI1_adde_sube_s_irs<bits<4> opcod, string opc, PatFrag opnode,
> -                             bit Commutable = 0> {
> +multiclass AI1_adde_sube_s_irs<PatFrag opnode, bit Commutable = 0> {
>   def Sri : ARMPseudoInst<(outs GPR:$Rd), (ins GPR:$Rn, so_imm:$imm),
>                 Size4Bytes, IIC_iALUi,
>                [(set GPR:$Rd, (opnode GPR:$Rn, so_imm:$imm))]>,
> @@ -2197,10 +2196,12 @@
>                           BinOpFrag<(sube_dead_carry node:$LHS, node:$RHS)>>;
> 
> // ADC and SUBC with 's' bit set.
> -defm ADCS : AI1_adde_sube_s_irs<0b0101, "adcs",
> -                          BinOpFrag<(adde_live_carry node:$LHS, node:$RHS)>, 1>;
> -defm SBCS : AI1_adde_sube_s_irs<0b0110, "sbcs",
> -                          BinOpFrag<(sube_live_carry node:$LHS, node:$RHS) >>;
> +let usesCustomInserter = 1 in {
> +defm ADCS : AI1_adde_sube_s_irs<
> +              BinOpFrag<(adde_live_carry node:$LHS, node:$RHS)>, 1>;
> +defm SBCS : AI1_adde_sube_s_irs<
> +              BinOpFrag<(sube_live_carry node:$LHS, node:$RHS) >>;
> +}
> 
> def RSBri : AsI1<0b0011, (outs GPR:$Rd), (ins GPR:$Rn, so_imm:$imm), DPFrm,
>                  IIC_iALUi, "rsb", "\t$Rd, $Rn, $imm",
> 
> 
> _______________________________________________
> llvm-commits mailing list
> llvm-commits at cs.uiuc.edu
> http://lists.cs.uiuc.edu/mailman/listinfo/llvm-commits