[llvm] dd5c520 - [CPG][ARM] Optimize towards branch on zero in codegenprepare

Sun May 16 09:54:19 PDT 2021

Author: David Green
Date: 2021-05-16T17:54:06+01:00
New Revision: dd5c52029d27125bffaca1d1d442eedeae6481b9

URL: https://github.com/llvm/llvm-project/commit/dd5c52029d27125bffaca1d1d442eedeae6481b9
DIFF: https://github.com/llvm/llvm-project/commit/dd5c52029d27125bffaca1d1d442eedeae6481b9.diff

LOG: [CPG][ARM] Optimize towards branch on zero in codegenprepare

This adds a simple fold into codegenprepare that converts comparison of
branches towards comparison with zero if possible. For example:
  %c = icmp ult %x, 8
  br %c, bla, blb
  %tc = lshr %x, 3
becomes
  %tc = lshr %x, 3
  %c = icmp eq %tc, 0
  br %c, bla, blb

As a first order approximation, this can reduce the number of
instructions needed to perform the branch as the shift is (often) needed
anyway. At the moment this does not effect very much, as llvm tends to
prefer the opposite form. But it can protect against regressions from
commits like rG9423f78240a2.

Simple cases of Add and Sub are added along with Shift, equally as the
comparison to zero can often be folded with cpsr flags.

Differential Revision: https://reviews.llvm.org/D101778

Added: 
    

Modified: 
    llvm/include/llvm/CodeGen/TargetLowering.h
    llvm/lib/CodeGen/CodeGenPrepare.cpp
    llvm/lib/Target/ARM/ARMISelLowering.h
    llvm/test/CodeGen/ARM/branch-on-zero.ll
    llvm/test/CodeGen/Thumb2/2010-02-11-phi-cycle.ll
    llvm/test/Transforms/CodeGenPrepare/ARM/branch-on-zero.ll

Removed: 
    


################################################################################
diff  --git a/llvm/include/llvm/CodeGen/TargetLowering.h b/llvm/include/llvm/CodeGen/TargetLowering.h
index ea88dac91cd59..b3f7843a03501 100644

--- a/llvm/include/llvm/CodeGen/TargetLowering.h
+++ b/llvm/include/llvm/CodeGen/TargetLowering.h
@@ -613,6 +613,10 @@ class TargetLoweringBase {
   /// with instruction generated for signed comparison.
   virtual bool isEqualityCmpFoldedWithSignedCmp() const { return true; }
 
+  /// Return true if the heuristic to prefer icmp eq zero should be used in code
+  /// gen prepare.
+  virtual bool preferZeroCompareBranch() const { return false; }
+
   /// Return true if it is safe to transform an integer-domain bitwise operation
   /// into the equivalent floating-point operation. This should be set to true
   /// if the target has IEEE-754-compliant fabs/fneg operations for the input

diff  --git a/llvm/lib/CodeGen/CodeGenPrepare.cpp b/llvm/lib/CodeGen/CodeGenPrepare.cpp
index 11e393ca1f35c..0bdaaa6b14cfb 100644
--- a/llvm/lib/CodeGen/CodeGenPrepare.cpp
+++ b/llvm/lib/CodeGen/CodeGenPrepare.cpp
@@ -7688,6 +7688,67 @@ static bool tryUnmergingGEPsAcrossIndirectBr(GetElementPtrInst *GEPI,
   return true;
 }
 
+static bool optimizeBranch(BranchInst *Branch, const TargetLowering &TLI) {
+  // Try and convert
+  //  %c = icmp ult %x, 8
+  //  br %c, bla, blb
+  //  %tc = lshr %x, 3
+  // to
+  //  %tc = lshr %x, 3
+  //  %c = icmp eq %tc, 0
+  //  br %c, bla, blb
+  // Creating the cmp to zero can be better for the backend, especially if the
+  // lshr produces flags that can be used automatically.
+  if (!TLI.preferZeroCompareBranch() || !Branch->isConditional())
+    return false;
+
+  ICmpInst *Cmp = dyn_cast<ICmpInst>(Branch->getCondition());
+  if (!Cmp || !isa<ConstantInt>(Cmp->getOperand(1)) || !Cmp->hasOneUse())
+    return false;
+
+  Value *X = Cmp->getOperand(0);
+  APInt CmpC = cast<ConstantInt>(Cmp->getOperand(1))->getValue();
+
+  for (auto *U : X->users()) {
+    Instruction *UI = dyn_cast<Instruction>(U);
+    // A quick dominance check
+    if (!UI ||
+        (UI->getParent() != Branch->getParent() &&
+         UI->getParent() != Branch->getSuccessor(0) &&
+         UI->getParent() != Branch->getSuccessor(1)) ||
+        (UI->getParent() != Branch->getParent() &&
+         !UI->getParent()->getSinglePredecessor()))
+      continue;
+
+    if (CmpC.isPowerOf2() && Cmp->getPredicate() == ICmpInst::ICMP_ULT &&
+        match(UI, m_Shr(m_Specific(X), m_SpecificInt(CmpC.logBase2())))) {
+      IRBuilder<> Builder(Branch);
+      if (UI->getParent() != Branch->getParent())
+        UI->moveBefore(Branch);
+      Value *NewCmp = Builder.CreateCmp(ICmpInst::ICMP_EQ, UI,
+                                        ConstantInt::get(UI->getType(), 0));
+      LLVM_DEBUG(dbgs() << "Converting " << *Cmp << "\n");
+      LLVM_DEBUG(dbgs() << " to compare on zero: " << *NewCmp << "\n");
+      Cmp->replaceAllUsesWith(NewCmp);
+      return true;
+    }
+    if (Cmp->isEquality() &&
+        (match(UI, m_Add(m_Specific(X), m_SpecificInt(-CmpC))) ||
+         match(UI, m_Sub(m_Specific(X), m_SpecificInt(CmpC))))) {
+      IRBuilder<> Builder(Branch);
+      if (UI->getParent() != Branch->getParent())
+        UI->moveBefore(Branch);
+      Value *NewCmp = Builder.CreateCmp(Cmp->getPredicate(), UI,
+                                        ConstantInt::get(UI->getType(), 0));
+      LLVM_DEBUG(dbgs() << "Converting " << *Cmp << "\n");
+      LLVM_DEBUG(dbgs() << " to compare on zero: " << *NewCmp << "\n");
+      Cmp->replaceAllUsesWith(NewCmp);
+      return true;
+    }
+  }
+  return false;
+}
+
 bool CodeGenPrepare::optimizeInst(Instruction *I, bool &ModifiedDT) {
   // Bail out if we inserted the instruction to prevent optimizations from
   // stepping on each other's toes.
@@ -7849,6 +7910,8 @@ bool CodeGenPrepare::optimizeInst(Instruction *I, bool &ModifiedDT) {
     return optimizeSwitchInst(cast<SwitchInst>(I));
   case Instruction::ExtractElement:
     return optimizeExtractElementInst(cast<ExtractElementInst>(I));
+  case Instruction::Br:
+    return optimizeBranch(cast<BranchInst>(I), *TLI);
   }
 
   return false;

diff  --git a/llvm/lib/Target/ARM/ARMISelLowering.h b/llvm/lib/Target/ARM/ARMISelLowering.h
index 8c5704427a3d9..25a6182f4e7ad 100644
--- a/llvm/lib/Target/ARM/ARMISelLowering.h
+++ b/llvm/lib/Target/ARM/ARMISelLowering.h
@@ -573,6 +573,8 @@ class VectorType;
 
     Sched::Preference getSchedulingPreference(SDNode *N) const override;
 
+    bool preferZeroCompareBranch() const override { return true; }
+
     bool
     isShuffleMaskLegal(ArrayRef<int> M, EVT VT) const override;
     bool isOffsetFoldingLegal(const GlobalAddressSDNode *GA) const override;

diff  --git a/llvm/test/CodeGen/ARM/branch-on-zero.ll b/llvm/test/CodeGen/ARM/branch-on-zero.ll
index 803aa80b44175..95bd71cdc7151 100644
--- a/llvm/test/CodeGen/ARM/branch-on-zero.ll
+++ b/llvm/test/CodeGen/ARM/branch-on-zero.ll
@@ -96,29 +96,26 @@ while.end:                                        ; preds = %while.body, %entry
 define i32 @test_lshr2(i32* nocapture %x, i32* nocapture readonly %y, i32 %n) {
 ; CHECK-V6M-LABEL: test_lshr2:
 ; CHECK-V6M:       @ %bb.0: @ %entry
-; CHECK-V6M-NEXT:    cmp r2, #4
-; CHECK-V6M-NEXT:    blo .LBB1_3
-; CHECK-V6M-NEXT:  @ %bb.1: @ %while.body.preheader
 ; CHECK-V6M-NEXT:    lsrs r2, r2, #2
-; CHECK-V6M-NEXT:  .LBB1_2: @ %while.body
+; CHECK-V6M-NEXT:    beq .LBB1_2
+; CHECK-V6M-NEXT:  .LBB1_1: @ %while.body
 ; CHECK-V6M-NEXT:    @ =>This Inner Loop Header: Depth=1
 ; CHECK-V6M-NEXT:    ldm r1!, {r3}
 ; CHECK-V6M-NEXT:    lsls r3, r3, #1
 ; CHECK-V6M-NEXT:    stm r0!, {r3}
 ; CHECK-V6M-NEXT:    subs r2, r2, #1
-; CHECK-V6M-NEXT:    bne .LBB1_2
-; CHECK-V6M-NEXT:  .LBB1_3: @ %while.end
+; CHECK-V6M-NEXT:    bne .LBB1_1
+; CHECK-V6M-NEXT:  .LBB1_2: @ %while.end
 ; CHECK-V6M-NEXT:    movs r0, #0
 ; CHECK-V6M-NEXT:    bx lr
 ;
 ; CHECK-V7M-LABEL: test_lshr2:
 ; CHECK-V7M:       @ %bb.0: @ %entry
-; CHECK-V7M-NEXT:    cmp r2, #4
-; CHECK-V7M-NEXT:    blo .LBB1_3
+; CHECK-V7M-NEXT:    lsrs r2, r2, #2
+; CHECK-V7M-NEXT:    beq .LBB1_3
 ; CHECK-V7M-NEXT:  @ %bb.1: @ %while.body.preheader
 ; CHECK-V7M-NEXT:    subs r1, #4
 ; CHECK-V7M-NEXT:    subs r0, #4
-; CHECK-V7M-NEXT:    lsrs r2, r2, #2
 ; CHECK-V7M-NEXT:  .LBB1_2: @ %while.body
 ; CHECK-V7M-NEXT:    @ =>This Inner Loop Header: Depth=1
 ; CHECK-V7M-NEXT:    ldr r3, [r1, #4]!
@@ -134,24 +131,23 @@ define i32 @test_lshr2(i32* nocapture %x, i32* nocapture readonly %y, i32 %n) {
 ; CHECK-V81M:       @ %bb.0: @ %entry
 ; CHECK-V81M-NEXT:    .save {r7, lr}
 ; CHECK-V81M-NEXT:    push {r7, lr}
-; CHECK-V81M-NEXT:    cmp r2, #4
-; CHECK-V81M-NEXT:    blo .LBB1_3
-; CHECK-V81M-NEXT:  @ %bb.1: @ %while.body.preheader
-; CHECK-V81M-NEXT:    lsr.w lr, r2, #2
-; CHECK-V81M-NEXT:  .LBB1_2: @ %while.body
+; CHECK-V81M-NEXT:    lsrs r2, r2, #2
+; CHECK-V81M-NEXT:    wls lr, r2, .LBB1_2
+; CHECK-V81M-NEXT:  .LBB1_1: @ %while.body
 ; CHECK-V81M-NEXT:    @ =>This Inner Loop Header: Depth=1
 ; CHECK-V81M-NEXT:    ldr r2, [r1], #4
 ; CHECK-V81M-NEXT:    lsls r2, r2, #1
 ; CHECK-V81M-NEXT:    str r2, [r0], #4
-; CHECK-V81M-NEXT:    le lr, .LBB1_2
-; CHECK-V81M-NEXT:  .LBB1_3: @ %while.end
+; CHECK-V81M-NEXT:    le lr, .LBB1_1
+; CHECK-V81M-NEXT:  .LBB1_2: @ %while.end
 ; CHECK-V81M-NEXT:    movs r0, #0
 ; CHECK-V81M-NEXT:    pop {r7, pc}
 ;
 ; CHECK-V7A-LABEL: test_lshr2:
 ; CHECK-V7A:       @ %bb.0: @ %entry
-; CHECK-V7A-NEXT:    cmp r2, #4
-; CHECK-V7A-NEXT:    blo .LBB1_3
+; CHECK-V7A-NEXT:    mov r3, #0
+; CHECK-V7A-NEXT:    cmp r3, r2, lsr #2
+; CHECK-V7A-NEXT:    beq .LBB1_3
 ; CHECK-V7A-NEXT:  @ %bb.1: @ %while.body.preheader
 ; CHECK-V7A-NEXT:    lsr r2, r2, #2
 ; CHECK-V7A-NEXT:  .LBB1_2: @ %while.body

diff  --git a/llvm/test/CodeGen/Thumb2/2010-02-11-phi-cycle.ll b/llvm/test/CodeGen/Thumb2/2010-02-11-phi-cycle.ll
index f1b41cbbbe3cc..17027e2e4e5b4 100644
--- a/llvm/test/CodeGen/Thumb2/2010-02-11-phi-cycle.ll
+++ b/llvm/test/CodeGen/Thumb2/2010-02-11-phi-cycle.ll
@@ -7,18 +7,16 @@ define i32 @test(i32 %n) nounwind {
 ; CHECK:       @ %bb.0: @ %entry
 ; CHECK-NEXT:    .save {r4, lr}
 ; CHECK-NEXT:    push {r4, lr}
-; CHECK-NEXT:    cmp r0, #1
+; CHECK-NEXT:    subs r4, r0, #1
 ; CHECK-NEXT:    it eq
 ; CHECK-NEXT:    popeq {r4, pc}
-; CHECK-NEXT:  .LBB0_1: @ %bb.nph
-; CHECK-NEXT:    subs r4, r0, #1
-; CHECK-NEXT:  .LBB0_2: @ %bb
+; CHECK-NEXT:  .LBB0_1: @ %bb
 ; CHECK-NEXT:    @ =>This Inner Loop Header: Depth=1
 ; CHECK-NEXT:    bl f
 ; CHECK-NEXT:    bl g
 ; CHECK-NEXT:    subs r4, #1
-; CHECK-NEXT:    bne .LBB0_2
-; CHECK-NEXT:  @ %bb.3: @ %return
+; CHECK-NEXT:    bne .LBB0_1
+; CHECK-NEXT:  @ %bb.2: @ %return
 ; CHECK-NEXT:    pop {r4, pc}
 entry:
   %0 = icmp eq i32 %n, 1                          ; <i1> [#uses=1]
@@ -50,26 +48,22 @@ define i32 @test_dead_cycle(i32 %n) nounwind {
 ; CHECK:       @ %bb.0: @ %entry
 ; CHECK-NEXT:    .save {r4, lr}
 ; CHECK-NEXT:    push {r4, lr}
-; CHECK-NEXT:    cmp r0, #1
+; CHECK-NEXT:    subs r4, r0, #1
 ; CHECK-NEXT:    it eq
 ; CHECK-NEXT:    popeq {r4, pc}
-; CHECK-NEXT:  .LBB1_1: @ %bb.nph
-; CHECK-NEXT:    subs r4, r0, #1
-; CHECK-NEXT:    b .LBB1_3
-; CHECK-NEXT:  .LBB1_2: @ %bb2
-; CHECK-NEXT:    @ in Loop: Header=BB1_3 Depth=1
-; CHECK-NEXT:    subs r4, #1
-; CHECK-NEXT:    beq .LBB1_5
-; CHECK-NEXT:  .LBB1_3: @ %bb
+; CHECK-NEXT:  .LBB1_1: @ %bb
 ; CHECK-NEXT:    @ =>This Inner Loop Header: Depth=1
 ; CHECK-NEXT:    cmp r4, #2
-; CHECK-NEXT:    blt .LBB1_2
-; CHECK-NEXT:  @ %bb.4: @ %bb1
-; CHECK-NEXT:    @ in Loop: Header=BB1_3 Depth=1
+; CHECK-NEXT:    blt .LBB1_3
+; CHECK-NEXT:  @ %bb.2: @ %bb1
+; CHECK-NEXT:    @ in Loop: Header=BB1_1 Depth=1
 ; CHECK-NEXT:    bl f
 ; CHECK-NEXT:    bl g
-; CHECK-NEXT:    b .LBB1_2
-; CHECK-NEXT:  .LBB1_5: @ %return
+; CHECK-NEXT:  .LBB1_3: @ %bb2
+; CHECK-NEXT:    @ in Loop: Header=BB1_1 Depth=1
+; CHECK-NEXT:    subs r4, #1
+; CHECK-NEXT:    bne .LBB1_1
+; CHECK-NEXT:  @ %bb.4: @ %return
 ; CHECK-NEXT:    pop {r4, pc}
 entry:
   %0 = icmp eq i32 %n, 1                          ; <i1> [#uses=1]

diff  --git a/llvm/test/Transforms/CodeGenPrepare/ARM/branch-on-zero.ll b/llvm/test/Transforms/CodeGenPrepare/ARM/branch-on-zero.ll
index e73d7ecf41063..996cab1d1d2c4 100644
--- a/llvm/test/Transforms/CodeGenPrepare/ARM/branch-on-zero.ll
+++ b/llvm/test/Transforms/CodeGenPrepare/ARM/branch-on-zero.ll
@@ -7,12 +7,12 @@ target triple = "thumbv8.1m.main-none-eabi"
 define i32 @lshr3_then(i32 %a) {
 ; CHECK-LABEL: @lshr3_then(
 ; CHECK-NEXT:  entry:
-; CHECK-NEXT:    [[C:%.*]] = icmp ult i32 [[A:%.*]], 8
-; CHECK-NEXT:    br i1 [[C]], label [[THEN:%.*]], label [[ELSE:%.*]]
+; CHECK-NEXT:    [[L:%.*]] = lshr i32 [[A:%.*]], 3
+; CHECK-NEXT:    [[TMP0:%.*]] = icmp eq i32 [[L]], 0
+; CHECK-NEXT:    br i1 [[TMP0]], label [[THEN:%.*]], label [[ELSE:%.*]]
 ; CHECK:       then:
 ; CHECK-NEXT:    ret i32 0
 ; CHECK:       else:
-; CHECK-NEXT:    [[L:%.*]] = lshr i32 [[A]], 3
 ; CHECK-NEXT:    ret i32 [[L]]
 ;
 entry:
@@ -30,10 +30,10 @@ else:
 define i32 @lshr5_else(i32 %a) {
 ; CHECK-LABEL: @lshr5_else(
 ; CHECK-NEXT:  entry:
-; CHECK-NEXT:    [[C:%.*]] = icmp ult i32 [[A:%.*]], 32
-; CHECK-NEXT:    br i1 [[C]], label [[THEN:%.*]], label [[ELSE:%.*]]
+; CHECK-NEXT:    [[L:%.*]] = lshr i32 [[A:%.*]], 5
+; CHECK-NEXT:    [[TMP0:%.*]] = icmp eq i32 [[L]], 0
+; CHECK-NEXT:    br i1 [[TMP0]], label [[THEN:%.*]], label [[ELSE:%.*]]
 ; CHECK:       then:
-; CHECK-NEXT:    [[L:%.*]] = lshr i32 [[A]], 5
 ; CHECK-NEXT:    ret i32 [[L]]
 ; CHECK:       else:
 ; CHECK-NEXT:    ret i32 0
@@ -54,8 +54,8 @@ define i32 @lshr2_entry(i32 %a) {
 ; CHECK-LABEL: @lshr2_entry(
 ; CHECK-NEXT:  entry:
 ; CHECK-NEXT:    [[L:%.*]] = lshr i32 [[A:%.*]], 1
-; CHECK-NEXT:    [[C:%.*]] = icmp ult i32 [[A]], 2
-; CHECK-NEXT:    br i1 [[C]], label [[THEN:%.*]], label [[ELSE:%.*]]
+; CHECK-NEXT:    [[TMP0:%.*]] = icmp eq i32 [[L]], 0
+; CHECK-NEXT:    br i1 [[TMP0]], label [[THEN:%.*]], label [[ELSE:%.*]]
 ; CHECK:       then:
 ; CHECK-NEXT:    ret i32 [[L]]
 ; CHECK:       else:
@@ -99,10 +99,10 @@ else:
 define i32 @ashr5_else(i32 %a) {
 ; CHECK-LABEL: @ashr5_else(
 ; CHECK-NEXT:  entry:
-; CHECK-NEXT:    [[C:%.*]] = icmp ult i32 [[A:%.*]], 32
-; CHECK-NEXT:    br i1 [[C]], label [[THEN:%.*]], label [[ELSE:%.*]]
+; CHECK-NEXT:    [[L:%.*]] = ashr i32 [[A:%.*]], 5
+; CHECK-NEXT:    [[TMP0:%.*]] = icmp eq i32 [[L]], 0
+; CHECK-NEXT:    br i1 [[TMP0]], label [[THEN:%.*]], label [[ELSE:%.*]]
 ; CHECK:       then:
-; CHECK-NEXT:    [[L:%.*]] = ashr i32 [[A]], 5
 ; CHECK-NEXT:    ret i32 [[L]]
 ; CHECK:       else:
 ; CHECK-NEXT:    ret i32 0
@@ -145,10 +145,10 @@ else:
 define i32 @addm10_then(i32 %a) {
 ; CHECK-LABEL: @addm10_then(
 ; CHECK-NEXT:  entry:
-; CHECK-NEXT:    [[C:%.*]] = icmp eq i32 [[A:%.*]], 10
-; CHECK-NEXT:    br i1 [[C]], label [[THEN:%.*]], label [[ELSE:%.*]]
+; CHECK-NEXT:    [[L:%.*]] = add i32 [[A:%.*]], -10
+; CHECK-NEXT:    [[TMP0:%.*]] = icmp eq i32 [[L]], 0
+; CHECK-NEXT:    br i1 [[TMP0]], label [[THEN:%.*]], label [[ELSE:%.*]]
 ; CHECK:       then:
-; CHECK-NEXT:    [[L:%.*]] = add i32 [[A]], -10
 ; CHECK-NEXT:    ret i32 [[L]]
 ; CHECK:       else:
 ; CHECK-NEXT:    ret i32 0
@@ -191,12 +191,12 @@ else:
 define i32 @sub10_else(i32 %a) {
 ; CHECK-LABEL: @sub10_else(
 ; CHECK-NEXT:  entry:
-; CHECK-NEXT:    [[C:%.*]] = icmp eq i32 [[A:%.*]], 10
-; CHECK-NEXT:    br i1 [[C]], label [[THEN:%.*]], label [[ELSE:%.*]]
+; CHECK-NEXT:    [[L:%.*]] = sub i32 [[A:%.*]], 10
+; CHECK-NEXT:    [[TMP0:%.*]] = icmp eq i32 [[L]], 0
+; CHECK-NEXT:    br i1 [[TMP0]], label [[THEN:%.*]], label [[ELSE:%.*]]
 ; CHECK:       then:
 ; CHECK-NEXT:    ret i32 0
 ; CHECK:       else:
-; CHECK-NEXT:    [[L:%.*]] = sub i32 [[A]], 10
 ; CHECK-NEXT:    ret i32 [[L]]
 ;
 entry:
@@ -214,10 +214,10 @@ else:
 define i32 @subm10_then(i32 %a) {
 ; CHECK-LABEL: @subm10_then(
 ; CHECK-NEXT:  entry:
-; CHECK-NEXT:    [[C:%.*]] = icmp eq i32 [[A:%.*]], -10
-; CHECK-NEXT:    br i1 [[C]], label [[THEN:%.*]], label [[ELSE:%.*]]
+; CHECK-NEXT:    [[L:%.*]] = sub i32 [[A:%.*]], -10
+; CHECK-NEXT:    [[TMP0:%.*]] = icmp eq i32 [[L]], 0
+; CHECK-NEXT:    br i1 [[TMP0]], label [[THEN:%.*]], label [[ELSE:%.*]]
 ; CHECK:       then:
-; CHECK-NEXT:    [[L:%.*]] = sub i32 [[A]], -10
 ; CHECK-NEXT:    ret i32 [[L]]
 ; CHECK:       else:
 ; CHECK-NEXT:    ret i32 0
@@ -237,12 +237,12 @@ else:
 define i64 @lshr64(i64 %a) {
 ; CHECK-LABEL: @lshr64(
 ; CHECK-NEXT:  entry:
-; CHECK-NEXT:    [[C:%.*]] = icmp ult i64 [[A:%.*]], 1099511627776
-; CHECK-NEXT:    br i1 [[C]], label [[THEN:%.*]], label [[ELSE:%.*]]
+; CHECK-NEXT:    [[L:%.*]] = lshr i64 [[A:%.*]], 40
+; CHECK-NEXT:    [[TMP0:%.*]] = icmp eq i64 [[L]], 0
+; CHECK-NEXT:    br i1 [[TMP0]], label [[THEN:%.*]], label [[ELSE:%.*]]
 ; CHECK:       then:
 ; CHECK-NEXT:    ret i64 0
 ; CHECK:       else:
-; CHECK-NEXT:    [[L:%.*]] = lshr i64 [[A]], 40
 ; CHECK-NEXT:    ret i64 [[L]]
 ;
 entry:
@@ -260,12 +260,12 @@ else:
 define i128 @lshr128(i128 %a) {
 ; CHECK-LABEL: @lshr128(
 ; CHECK-NEXT:  entry:
-; CHECK-NEXT:    [[C:%.*]] = icmp ult i128 [[A:%.*]], 36893488147419103232
-; CHECK-NEXT:    br i1 [[C]], label [[THEN:%.*]], label [[ELSE:%.*]]
+; CHECK-NEXT:    [[L:%.*]] = lshr i128 [[A:%.*]], 65
+; CHECK-NEXT:    [[TMP0:%.*]] = icmp eq i128 [[L]], 0
+; CHECK-NEXT:    br i1 [[TMP0]], label [[THEN:%.*]], label [[ELSE:%.*]]
 ; CHECK:       then:
 ; CHECK-NEXT:    ret i128 0
 ; CHECK:       else:
-; CHECK-NEXT:    [[L:%.*]] = lshr i128 [[A]], 65
 ; CHECK-NEXT:    ret i128 [[L]]
 ;
 entry: