[llvm] [MachinePipeliner] Fix scheduling-sensitive tests (PR #123169)

Thu Jan 16 01:17:10 PST 2025

https://github.com/kasuga-fj updated https://github.com/llvm/llvm-project/pull/123169

>From 60dcc09dcf5e01420f7f389ab31d0af5e2029606 Mon Sep 17 00:00:00 2001
From: Ryotaro Kasuga <kasuga.ryotaro at fujitsu.com>
Date: Thu, 16 Jan 2025 06:14:16 +0000
Subject: [PATCH] [MachinePipeliner] Fix fragile tests

Currently, some tests are too sensitive to changes in MachinePipeliner.
Some of them are more sensitive to scheduling results than necessary,
others assume the current dependency analysis, which is actually
incorrect. As an example of the former, there is a test that is intended
to verify the correctness of the dependency analysis, but validates the
final scheduling results. These tests can be affected by unrelated
changes in MachinePipeliner. This patch fixes them to make them robust
against such changes.

This patch is a prelude to #121907.
---
 llvm/test/CodeGen/Hexagon/loop_align_count.ll | 116 --------
 .../CodeGen/Hexagon/loop_align_count2.mir     | 267 ++++++++++++++++++
 llvm/test/CodeGen/Hexagon/swp-epilog-phi9.ll  |   8 +-
 llvm/test/CodeGen/Hexagon/swp-resmii-1.ll     |   2 +-
 llvm/test/CodeGen/Hexagon/v6-haar-balign32.ll |   4 +-
 .../CodeGen/PowerPC/sms-store-dependence.ll   |  49 +---
 6 files changed, 282 insertions(+), 164 deletions(-)
 delete mode 100644 llvm/test/CodeGen/Hexagon/loop_align_count.ll
 create mode 100644 llvm/test/CodeGen/Hexagon/loop_align_count2.mir

diff --git a/llvm/test/CodeGen/Hexagon/loop_align_count.ll b/llvm/test/CodeGen/Hexagon/loop_align_count.ll
deleted file mode 100644
index fb70179a8b090c..00000000000000
--- a/llvm/test/CodeGen/Hexagon/loop_align_count.ll
+++ /dev/null
@@ -1,116 +0,0 @@
-; RUN: llc -mtriple=hexagon -mcpu=hexagonv73 -O2 -mattr=+hvxv73,hvx-length64b \
-; RUN: -debug-only=hexagon-loop-align 2>&1 < %s | FileCheck %s
-; Validate that there are 4 bundles in the loop.
-; REQUIRES: asserts
-
-; CHECK: Loop Align Pass:
-; CHECK: Bundle Count : 4
-; CHECK: .p2align{{.*}}5
-
-; Function Attrs: nounwind
-define void @ham(ptr noalias nocapture readonly %arg, i32 %arg1, i32 %arg2, i32 %arg3, ptr noalias nocapture %arg4, i32 %arg5) #0 {
-bb:
-  %ashr = ashr i32 %arg3, 2
-  %ashr6 = ashr i32 %arg3, 1
-  %add = add nsw i32 %ashr6, %ashr
-  %icmp = icmp sgt i32 %arg2, 0
-  br i1 %icmp, label %bb7, label %bb61
-
-bb7:                                              ; preds = %bb
-  %sdiv = sdiv i32 %arg1, 64
-  %icmp8 = icmp sgt i32 %arg1, 63
-  br label %bb9
-
-bb9:                                              ; preds = %bb57, %bb7
-  %phi = phi i32 [ 0, %bb7 ], [ %add58, %bb57 ]
-  %ashr10 = ashr exact i32 %phi, 1
-  %mul = mul nsw i32 %ashr10, %arg3
-  br i1 %icmp8, label %bb11, label %bb57
-
-bb11:                                             ; preds = %bb9
-  %add12 = add nsw i32 %phi, 1
-  %mul13 = mul nsw i32 %add12, %arg5
-  %mul14 = mul nsw i32 %phi, %arg5
-  %add15 = add i32 %add, %mul
-  %add16 = add i32 %mul, %ashr
-  %add17 = add i32 %mul, %ashr6
-  %getelementptr = getelementptr inbounds i8, ptr %arg4, i32 %mul13
-  %getelementptr18 = getelementptr inbounds i8, ptr %arg4, i32 %mul14
-  %getelementptr19 = getelementptr inbounds i16, ptr %arg, i32 %add15
-  %getelementptr20 = getelementptr inbounds i16, ptr %arg, i32 %add16
-  %getelementptr21 = getelementptr inbounds i16, ptr %arg, i32 %add17
-  %getelementptr22 = getelementptr inbounds i16, ptr %arg, i32 %mul
-  %bitcast = bitcast ptr %getelementptr to ptr
-  %bitcast23 = bitcast ptr %getelementptr18 to ptr
-  %bitcast24 = bitcast ptr %getelementptr19 to ptr
-  %bitcast25 = bitcast ptr %getelementptr20 to ptr
-  %bitcast26 = bitcast ptr %getelementptr21 to ptr
-  %bitcast27 = bitcast ptr %getelementptr22 to ptr
-  br label %bb28
-
-bb28:                                             ; preds = %bb28, %bb11
-  %phi29 = phi i32 [ 0, %bb11 ], [ %add54, %bb28 ]
-  %phi30 = phi ptr [ %bitcast27, %bb11 ], [ %getelementptr36, %bb28 ]
-  %phi31 = phi ptr [ %bitcast26, %bb11 ], [ %getelementptr37, %bb28 ]
-  %phi32 = phi ptr [ %bitcast25, %bb11 ], [ %getelementptr39, %bb28 ]
-  %phi33 = phi ptr [ %bitcast24, %bb11 ], [ %getelementptr41, %bb28 ]
-  %phi34 = phi ptr [ %bitcast, %bb11 ], [ %getelementptr53, %bb28 ]
-  %phi35 = phi ptr [ %bitcast23, %bb11 ], [ %getelementptr52, %bb28 ]
-  %getelementptr36 = getelementptr inbounds <16 x i32>, ptr %phi30, i32 1
-  %load = load <16 x i32>, ptr %phi30, align 64
-  %getelementptr37 = getelementptr inbounds <16 x i32>, ptr %phi31, i32 1
-  %load38 = load <16 x i32>, ptr %phi31, align 64
-  %getelementptr39 = getelementptr inbounds <16 x i32>, ptr %phi32, i32 1
-  %load40 = load <16 x i32>, ptr %phi32, align 64
-  %getelementptr41 = getelementptr inbounds <16 x i32>, ptr %phi33, i32 1
-  %load42 = load <16 x i32>, ptr %phi33, align 64
-  %call = tail call <16 x i32> @llvm.hexagon.V6.vaddh(<16 x i32> %load, <16 x i32> %load38)
-  %call43 = tail call <16 x i32> @llvm.hexagon.V6.vsubh(<16 x i32> %load, <16 x i32> %load38)
-  %call44 = tail call <16 x i32> @llvm.hexagon.V6.vaddh(<16 x i32> %load40, <16 x i32> %load42)
-  %call45 = tail call <16 x i32> @llvm.hexagon.V6.vsubh(<16 x i32> %load40, <16 x i32> %load42)
-  %call46 = tail call <16 x i32> @llvm.hexagon.V6.vavgh(<16 x i32> %call, <16 x i32> %call44)
-  %call47 = tail call <16 x i32> @llvm.hexagon.V6.vnavgh(<16 x i32> %call, <16 x i32> %call44)
-  %call48 = tail call <16 x i32> @llvm.hexagon.V6.vavgh(<16 x i32> %call43, <16 x i32> %call45)
-  %call49 = tail call <16 x i32> @llvm.hexagon.V6.vnavgh(<16 x i32> %call43, <16 x i32> %call45)
-  %call50 = tail call <16 x i32> @llvm.hexagon.V6.vsathub(<16 x i32> %call47, <16 x i32> %call46)
-  %call51 = tail call <16 x i32> @llvm.hexagon.V6.vsathub(<16 x i32> %call49, <16 x i32> %call48)
-  %getelementptr52 = getelementptr inbounds <16 x i32>, ptr %phi35, i32 1
-  store <16 x i32> %call50, ptr %phi35, align 64
-  %getelementptr53 = getelementptr inbounds <16 x i32>, ptr %phi34, i32 1
-  store <16 x i32> %call51, ptr %phi34, align 64
-  %add54 = add nsw i32 %phi29, 1
-  %icmp55 = icmp slt i32 %add54, %sdiv
-  br i1 %icmp55, label %bb28, label %bb56
-
-bb56:                                             ; preds = %bb28
-  br label %bb57
-
-bb57:                                             ; preds = %bb56, %bb9
-  %add58 = add nsw i32 %phi, 2
-  %icmp59 = icmp slt i32 %add58, %arg2
-  br i1 %icmp59, label %bb9, label %bb60
-
-bb60:                                             ; preds = %bb57
-  br label %bb61
-
-bb61:                                             ; preds = %bb60, %bb
-  ret void
-}
-
-; Function Attrs: nocallback nofree nosync nounwind willreturn memory(none)
-declare <16 x i32> @llvm.hexagon.V6.vaddh(<16 x i32>, <16 x i32>) #1
-
-; Function Attrs: nocallback nofree nosync nounwind willreturn memory(none)
-declare <16 x i32> @llvm.hexagon.V6.vsubh(<16 x i32>, <16 x i32>) #1
-
-; Function Attrs: nocallback nofree nosync nounwind willreturn memory(none)
-declare <16 x i32> @llvm.hexagon.V6.vavgh(<16 x i32>, <16 x i32>) #1
-
-; Function Attrs: nocallback nofree nosync nounwind willreturn memory(none)
-declare <16 x i32> @llvm.hexagon.V6.vnavgh(<16 x i32>, <16 x i32>) #1
-
-; Function Attrs: nocallback nofree nosync nounwind willreturn memory(none)
-declare <16 x i32> @llvm.hexagon.V6.vsathub(<16 x i32>, <16 x i32>) #1
-
-attributes #0 = { nounwind "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "unsafe-fp-math"="false" "use-soft-float"="false" }
-attributes #1 = { nocallback nofree nosync nounwind willreturn memory(none) }
diff --git a/llvm/test/CodeGen/Hexagon/loop_align_count2.mir b/llvm/test/CodeGen/Hexagon/loop_align_count2.mir
new file mode 100644
index 00000000000000..2381aaf895808f
--- /dev/null
+++ b/llvm/test/CodeGen/Hexagon/loop_align_count2.mir
@@ -0,0 +1,267 @@
+# RUN: llc -mtriple=hexagon -mcpu=hexagonv73 -O2 -mattr=+hvxv73,hvx-length64b \
+# RUN: -start-before=hexagon-loop-align -debug-only=hexagon-loop-align 2>&1 \
+# RUN: %s -o - | FileCheck %s
+# Validate that there are 4 bundles in the loop.
+# REQUIRES: asserts
+
+# CHECK: Loop Align Pass:
+# CHECK: Bundle Count : 4
+# CHECK: .p2align{{.*}}5
+
+--- |
+  target datalayout = "e-m:e-p:32:32:32-a:0-n16:32-i64:64:64-i32:32:32-i16:16:16-i1:8:8-f32:32:32-f64:64:64-v32:32:32-v64:64:64-v512:512:512-v1024:1024:1024-v2048:2048:2048"
+  target triple = "hexagon"
+
+  ; Function Attrs: nounwind
+  define void @ham(ptr noalias nocapture readonly %arg, i32 %arg1, i32 %arg2, i32 %arg3, ptr noalias nocapture %arg4, i32 %arg5) #0 {
+  bb:
+    %ashr = ashr i32 %arg3, 2
+    %ashr6 = ashr i32 %arg3, 1
+    %add = add nsw i32 %ashr6, %ashr
+    %icmp = icmp sgt i32 %arg2, 0
+    br i1 %icmp, label %bb7, label %bb61
+
+  bb7:                                              ; preds = %bb
+    %sdiv = sdiv i32 %arg1, 64
+    br label %bb9
+
+  bb9:                                              ; preds = %bb57, %bb7
+    %phi = phi i32 [ 0, %bb7 ], [ %add58, %bb57 ]
+    %0 = icmp sgt i32 %arg1, 63
+    %ashr10 = ashr exact i32 %phi, 1
+    %mul = mul nsw i32 %ashr10, %arg3
+    br i1 %0, label %bb11, label %bb57
+
+  bb11:                                             ; preds = %bb9
+    %add12 = add nsw i32 %phi, 1
+    %mul13 = mul nsw i32 %add12, %arg5
+    %mul14 = mul nsw i32 %phi, %arg5
+    %add15 = add i32 %add, %mul
+    %add16 = add i32 %mul, %ashr
+    %add17 = add i32 %mul, %ashr6
+    %cgep = getelementptr inbounds i8, ptr %arg4, i32 %mul13
+    %cgep1 = getelementptr inbounds i8, ptr %arg4, i32 %mul14
+    %cgep2 = getelementptr inbounds i16, ptr %arg, i32 %add15
+    %cgep3 = getelementptr inbounds i16, ptr %arg, i32 %add16
+    %cgep4 = getelementptr inbounds i16, ptr %arg, i32 %add17
+    %cgep5 = getelementptr inbounds i16, ptr %arg, i32 %mul
+    br label %bb28
+
+  bb28:                                             ; preds = %bb28, %bb11
+    %phi29 = phi i32 [ 0, %bb11 ], [ %add54, %bb28 ]
+    %phi30 = phi ptr [ %cgep5, %bb11 ], [ %cgep6, %bb28 ]
+    %phi31 = phi ptr [ %cgep4, %bb11 ], [ %cgep7, %bb28 ]
+    %phi32 = phi ptr [ %cgep3, %bb11 ], [ %cgep8, %bb28 ]
+    %phi33 = phi ptr [ %cgep2, %bb11 ], [ %cgep9, %bb28 ]
+    %phi34 = phi ptr [ %cgep, %bb11 ], [ %cgep11, %bb28 ]
+    %phi35 = phi ptr [ %cgep1, %bb11 ], [ %cgep10, %bb28 ]
+    %load = load <16 x i32>, ptr %phi30, align 64
+    %load38 = load <16 x i32>, ptr %phi31, align 64
+    %load40 = load <16 x i32>, ptr %phi32, align 64
+    %load42 = load <16 x i32>, ptr %phi33, align 64
+    %call = tail call <16 x i32> @llvm.hexagon.V6.vaddh(<16 x i32> %load, <16 x i32> %load38)
+    %call43 = tail call <16 x i32> @llvm.hexagon.V6.vsubh(<16 x i32> %load, <16 x i32> %load38)
+    %call44 = tail call <16 x i32> @llvm.hexagon.V6.vaddh(<16 x i32> %load40, <16 x i32> %load42)
+    %call45 = tail call <16 x i32> @llvm.hexagon.V6.vsubh(<16 x i32> %load40, <16 x i32> %load42)
+    %call46 = tail call <16 x i32> @llvm.hexagon.V6.vavgh(<16 x i32> %call, <16 x i32> %call44)
+    %call47 = tail call <16 x i32> @llvm.hexagon.V6.vnavgh(<16 x i32> %call, <16 x i32> %call44)
+    %call48 = tail call <16 x i32> @llvm.hexagon.V6.vavgh(<16 x i32> %call43, <16 x i32> %call45)
+    %call49 = tail call <16 x i32> @llvm.hexagon.V6.vnavgh(<16 x i32> %call43, <16 x i32> %call45)
+    %call50 = tail call <16 x i32> @llvm.hexagon.V6.vsathub(<16 x i32> %call47, <16 x i32> %call46)
+    %call51 = tail call <16 x i32> @llvm.hexagon.V6.vsathub(<16 x i32> %call49, <16 x i32> %call48)
+    store <16 x i32> %call50, ptr %phi35, align 64
+    store <16 x i32> %call51, ptr %phi34, align 64
+    %add54 = add nsw i32 %phi29, 1
+    %icmp55 = icmp slt i32 %add54, %sdiv
+    %cgep6 = getelementptr inbounds <16 x i32>, ptr %phi30, i32 1
+    %cgep7 = getelementptr inbounds <16 x i32>, ptr %phi31, i32 1
+    %cgep8 = getelementptr inbounds <16 x i32>, ptr %phi32, i32 1
+    %cgep9 = getelementptr inbounds <16 x i32>, ptr %phi33, i32 1
+    %cgep10 = getelementptr inbounds <16 x i32>, ptr %phi35, i32 1
+    %cgep11 = getelementptr inbounds <16 x i32>, ptr %phi34, i32 1
+    br i1 %icmp55, label %bb28, label %bb57
+
+  bb57:                                             ; preds = %bb28, %bb9
+    %add58 = add nsw i32 %phi, 2
+    %icmp59 = icmp slt i32 %add58, %arg2
+    br i1 %icmp59, label %bb9, label %bb61
+
+  bb61:                                             ; preds = %bb57, %bb
+    ret void
+  }
+
+  ; Function Attrs: nocallback nofree nosync nounwind willreturn memory(none)
+  declare <16 x i32> @llvm.hexagon.V6.vaddh(<16 x i32>, <16 x i32>) #1
+
+  ; Function Attrs: nocallback nofree nosync nounwind willreturn memory(none)
+  declare <16 x i32> @llvm.hexagon.V6.vsubh(<16 x i32>, <16 x i32>) #1
+
+  ; Function Attrs: nocallback nofree nosync nounwind willreturn memory(none)
+  declare <16 x i32> @llvm.hexagon.V6.vavgh(<16 x i32>, <16 x i32>) #1
+
+  ; Function Attrs: nocallback nofree nosync nounwind willreturn memory(none)
+  declare <16 x i32> @llvm.hexagon.V6.vnavgh(<16 x i32>, <16 x i32>) #1
+
+  ; Function Attrs: nocallback nofree nosync nounwind willreturn memory(none)
+  declare <16 x i32> @llvm.hexagon.V6.vsathub(<16 x i32>, <16 x i32>) #1
+
+  attributes #0 = { nounwind "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "target-cpu"="hexagonv73" "target-features"="+hvxv73,+hvx-length64b" "unsafe-fp-math"="false" "use-soft-float"="false" }
+  attributes #1 = { nocallback nofree nosync nounwind willreturn memory(none) "target-cpu"="hexagonv73" "target-features"="+hvxv73,+hvx-length64b" }
+
+...
+---
+name:            ham
+alignment:       16
+tracksRegLiveness: true
+body:             |
+  bb.0.bb:
+    successors: %bb.1(0x80000000)
+    liveins: $r0, $r1, $r2, $r3, $r4, $r5
+
+    BUNDLE implicit-def dead $p0, implicit-def $pc, implicit $r2, implicit killed $r31 {
+      renamable $p0 = C2_cmpgti renamable $r2, 0
+      PS_jmpretfnew internal killed $p0, killed $r31, implicit-def $pc, implicit-def $pc
+    }
+
+  bb.1.bb7:
+    successors: %bb.2(0x80000000)
+    liveins: $r0, $r1, $r2, $r3, $r4, $r5
+
+    BUNDLE implicit-def $r8, implicit-def $r7, implicit-def $p0, implicit-def $r2, implicit $r1, implicit killed $r2, implicit $r3 {
+      renamable $r8 = S2_asr_i_r renamable $r1, 31
+      renamable $r7 = A2_addi killed renamable $r2, 1
+      renamable $p0 = C2_cmpgti renamable $r1, 63
+      renamable $r2 = S2_asr_i_r renamable $r3, 2
+    }
+    BUNDLE implicit-def $r1, implicit-def $r6, implicit $r1, implicit killed $r8, implicit $r3 {
+      renamable $r1 = S2_lsr_i_r_acc renamable $r1, killed renamable $r8, 26
+      renamable $r6 = S2_asr_i_r renamable $r3, 1
+    }
+    BUNDLE implicit-def $r9, implicit-def $r7, implicit-def $r1, implicit-def $r8, implicit killed $r7, implicit $r1, implicit $r6, implicit $r2 {
+      renamable $r9 = S2_lsr_i_r killed renamable $r7, 1
+      renamable $r7 = A2_tfrsi 0
+      renamable $r1 = S2_asr_i_r renamable $r1, 6
+      renamable $r8 = nsw A2_add renamable $r6, renamable $r2
+    }
+    BUNDLE implicit-def $lc1, implicit-def $sa1, implicit-def $pc, implicit killed $r9 {
+      J2_loop1r %bb.2, killed renamable $r9, implicit-def $lc1, implicit-def $sa1
+      J2_jump %bb.2, implicit-def $pc
+    }
+
+  bb.5 (align 16):
+    successors: %bb.6(0x80000000)
+    liveins: $p0, $r0, $r1, $r2, $r3, $r4, $r5, $r6, $r7, $r8, $r9, $r12, $v0, $v1, $v2, $v3, $v4
+
+    BUNDLE implicit-def $v3, implicit-def $v28, implicit-def $v29, implicit $v3, implicit killed $v4, implicit killed $v1, implicit killed $v2 {
+      renamable $v3 = V6_vsubh renamable $v3, killed renamable $v4
+      $v28 = V6_vavgh renamable $v1, renamable $v2
+      $v29 = V6_vnavgh killed renamable $v1, killed renamable $v2
+    }
+    BUNDLE implicit-def dead $v1, implicit-def dead $r12, implicit-def $v30, implicit-def $v31, implicit killed $v29, implicit killed $v28, implicit killed $r12, implicit killed $v0, implicit killed $v3 {
+      renamable $v1 = V6_vsathub killed $v29, killed $v28
+      dead renamable $r12 = V6_vS32b_new_pi killed renamable $r12, 64, internal killed renamable $v1 :: (store unknown-size into %ir.phi35, align 64)
+      $v30 = V6_vavgh renamable $v0, renamable $v3
+      $v31 = V6_vnavgh killed renamable $v0, killed renamable $v3
+    }
+    BUNDLE implicit-def dead $v0, implicit-def dead $r9, implicit killed $v31, implicit killed $v30, implicit killed $r9 {
+      renamable $v0 = V6_vsathub killed $v31, killed $v30
+      dead renamable $r9 = V6_vS32b_new_pi killed renamable $r9, 64, internal killed renamable $v0 :: (store unknown-size into %ir.phi34, align 64)
+    }
+
+  bb.6.bb57:
+    successors: %bb.2(0x7c000000), %bb.7(0x04000000)
+    liveins: $p0, $r0, $r1, $r2, $r3, $r4, $r5, $r6, $r7, $r8
+
+    BUNDLE implicit-def $r7, implicit-def $pc, implicit-def $lc1, implicit $r7, implicit killed $sa1, implicit killed $lc1 {
+      renamable $r7 = nsw A2_addi renamable $r7, 2
+      ENDLOOP1 %bb.2, implicit-def $pc, implicit-def $lc1, implicit killed $sa1, implicit killed $lc1
+    }
+    J2_jump %bb.7, implicit-def $pc
+
+  bb.2.bb9 (machine-block-address-taken):
+    successors: %bb.3(0x40000000), %bb.6(0x40000000)
+    liveins: $p0, $r0, $r1, $r2, $r3, $r4, $r5, $r6, $r7, $r8
+
+    J2_jumpf $p0, %bb.6, implicit-def $pc
+
+  bb.3.bb11:
+    successors: %bb.4(0x40000000), %bb.5(0x40000000)
+    liveins: $p0, $r0, $r1, $r2, $r3, $r4, $r5, $r6, $r7, $r8
+
+    BUNDLE implicit-def $r13, implicit-def $r9, implicit-def $r14, implicit-def $r12, implicit $r7, implicit $r4 {
+      renamable $r13 = exact S2_asr_i_r renamable $r7, 1
+      $r9 = A2_tfr $r4
+      renamable $r14 = nsw A2_addi renamable $r7, 1
+      $r12 = A2_tfr $r4
+    }
+    BUNDLE implicit-def $r15, implicit-def $r9, implicit-def $p1, implicit killed $r13, implicit $r3, implicit $r9, implicit killed $r14, implicit $r5, implicit $r1 {
+      renamable $r15 = nsw M2_mpyi killed renamable $r13, renamable $r3
+      renamable $r9 = M2_maci renamable $r9, killed renamable $r14, renamable $r5
+      renamable $p1 = C2_cmpgtui renamable $r1, 1
+    }
+    BUNDLE implicit-def $r28, implicit-def $r10, implicit-def $r13, implicit-def $r14, implicit killed $r15, implicit $r2, implicit $r6, implicit $r8, implicit $r0 {
+      renamable $r28 = A2_add renamable $r15, renamable $r2
+      renamable $r10 = A2_add renamable $r15, renamable $r6
+      renamable $r13 = A2_add renamable $r8, renamable $r15
+      renamable $r14 = S2_addasl_rrri renamable $r0, killed renamable $r15, 1
+    }
+    BUNDLE implicit-def $r15, implicit-def $r28, implicit-def $r10, implicit $r0, implicit killed $r28, implicit killed $r10, implicit $r1 {
+      renamable $r15 = S2_addasl_rrri renamable $r0, killed renamable $r28, 1
+      renamable $r28 = S2_addasl_rrri renamable $r0, killed renamable $r10, 1
+      renamable $r10 = A2_addi renamable $r1, -1
+    }
+    BUNDLE implicit-def $r13, implicit-def $v0, implicit-def $r14, implicit-def $r12, implicit $r0, implicit $r13, implicit $r14, implicit $r12, implicit $r7, implicit $r5 {
+      renamable $r13 = S2_addasl_rrri renamable $r0, renamable $r13, 1
+      renamable $v0, renamable $r14 = V6_vL32b_pi renamable $r14, 64 :: (load (s512) from %ir.phi30)
+      renamable $r12 = M2_maci renamable $r12, renamable $r7, renamable $r5
+    }
+    BUNDLE implicit-def $v2, implicit-def $r28, implicit-def $v1, implicit-def $lc0, implicit-def $sa0, implicit-def $usr, implicit-def $usr_ovf, implicit $r28, implicit $v0, implicit killed $r10 {
+      renamable $v2, renamable $r28 = V6_vL32b_cur_pi renamable $r28, 64 :: (load (s512) from %ir.phi31)
+      renamable $v1 = V6_vaddh renamable $v0, internal renamable $v2
+      J2_loop0r %bb.4, killed renamable $r10, implicit-def $lc0, implicit-def $sa0, implicit-def $usr
+    }
+    BUNDLE implicit-def $v3, implicit-def $r15, implicit-def $v0, implicit $r15, implicit $v0, implicit killed $v2 {
+      renamable $v3, renamable $r15 = V6_vL32b_pi renamable $r15, 64 :: (load (s512) from %ir.phi32)
+      renamable $v0 = V6_vsubh renamable $v0, killed renamable $v2
+    }
+    BUNDLE implicit-def $v4, implicit-def $r13, implicit-def $v2, implicit-def $pc, implicit $r13, implicit $v3, implicit killed $p1 {
+      renamable $v4, renamable $r13 = V6_vL32b_cur_pi renamable $r13, 64 :: (load (s512) from %ir.phi33)
+      renamable $v2 = V6_vaddh renamable $v3, internal renamable $v4
+      J2_jumpf killed $p1, %bb.5, implicit-def $pc
+    }
+
+  bb.4.bb28 (align 16):
+    successors: %bb.4(0x7c000000), %bb.5(0x04000000)
+    liveins: $p0, $r0, $r1, $r2, $r3, $r4, $r5, $r6, $r7, $r8, $r9, $r12, $r13, $r14, $r15, $r28, $v0, $v1, $v2, $v3, $v4
+
+    BUNDLE implicit-def $v3, implicit-def $v5, implicit-def $v1, implicit-def $v4, implicit-def $r14, implicit $v3, implicit killed $v4, implicit $v1, implicit killed $v2, implicit $r14 {
+      renamable $v3 = V6_vsubh renamable $v3, killed renamable $v4
+      renamable $v5 = V6_vnavgh renamable $v1, renamable $v2
+      renamable $v1 = V6_vavgh renamable $v1, killed renamable $v2
+      renamable $v4, renamable $r14 = V6_vL32b_pi renamable $r14, 64 :: (load (s512) from %ir.phi30 + 64)
+    }
+    BUNDLE implicit-def dead $v1, implicit-def $r12, implicit-def $v2, implicit-def $r28, implicit-def $v5, implicit killed $v5, implicit $v1, implicit $r12, implicit $r28, implicit $v0, implicit $v3 {
+      renamable $v1 = V6_vsathub killed renamable $v5, renamable $v1
+      renamable $r12 = V6_vS32b_new_pi renamable $r12, 64, internal killed renamable $v1 :: (store (s512) into %ir.phi35)
+      renamable $v2, renamable $r28 = V6_vL32b_pi renamable $r28, 64 :: (load (s512) from %ir.phi31 + 64)
+      renamable $v5 = V6_vnavgh renamable $v0, renamable $v3
+    }
+    BUNDLE implicit-def $v6, implicit-def $v3, implicit-def $r15, implicit-def $v1, implicit-def $v0, implicit killed $v0, implicit killed $v3, implicit $r15, implicit killed $v4, implicit killed $v2 {
+      renamable $v6 = V6_vavgh killed renamable $v0, killed renamable $v3
+      renamable $v3, renamable $r15 = V6_vL32b_pi renamable $r15, 64 :: (load (s512) from %ir.phi32 + 64)
+      renamable $v1 = V6_vaddh renamable $v4, renamable $v2
+      renamable $v0 = V6_vsubh killed renamable $v4, killed renamable $v2
+    }
+    BUNDLE implicit-def $v4, implicit-def $r13, implicit-def dead $v5, implicit-def $r9, implicit-def $v2, implicit-def $pc, implicit-def $lc0, implicit $r13, implicit $v5, implicit killed $v6, implicit $r9, implicit $v3, implicit killed $sa0, implicit killed $lc0 {
+      renamable $v4, renamable $r13 = V6_vL32b_cur_pi renamable $r13, 64 :: (load (s512) from %ir.phi33 + 64)
+      renamable $v5 = V6_vsathub renamable $v5, killed renamable $v6
+      renamable $r9 = V6_vS32b_new_pi renamable $r9, 64, internal killed renamable $v5 :: (store (s512) into %ir.phi34)
+      renamable $v2 = V6_vaddh renamable $v3, internal renamable $v4
+      ENDLOOP0 %bb.4, implicit-def $pc, implicit-def $lc0, implicit killed $sa0, implicit killed $lc0
+    }
+    J2_jump %bb.5, implicit-def $pc
+
+  bb.7.bb61:
+    PS_jmpret killed $r31, implicit-def dead $pc
+
+...
diff --git a/llvm/test/CodeGen/Hexagon/swp-epilog-phi9.ll b/llvm/test/CodeGen/Hexagon/swp-epilog-phi9.ll
index af1b848a8cf2df..33421ce4b40e7a 100644
--- a/llvm/test/CodeGen/Hexagon/swp-epilog-phi9.ll
+++ b/llvm/test/CodeGen/Hexagon/swp-epilog-phi9.ll
@@ -12,7 +12,7 @@
 ; CHECK: [[REG0]] = add(r{{[0-9]+}},#8)
 
 ; Function Attrs: nounwind
-define void @f0(ptr nocapture readonly %a0, i32 %a1) #0 {
+define void @f0(ptr noalias nocapture readonly %a0, i32 %a1, ptr noalias %a2) #0 {
 b0:
   %v0 = alloca [129 x i32], align 8
   br i1 undef, label %b1, label %b3
@@ -22,9 +22,9 @@ b1:                                               ; preds = %b0
 
 b2:                                               ; preds = %b2, %b1
   %v1 = phi ptr [ %a0, %b1 ], [ %v2, %b2 ]
-  %v2 = phi ptr [ undef, %b1 ], [ %v15, %b2 ]
-  %v3 = phi ptr [ null, %b1 ], [ %v4, %b2 ]
-  %v4 = phi ptr [ null, %b1 ], [ %v14, %b2 ]
+  %v2 = phi ptr [ %a0, %b1 ], [ %v15, %b2 ]
+  %v3 = phi ptr [ %a2, %b1 ], [ %v4, %b2 ]
+  %v4 = phi ptr [ %a2, %b1 ], [ %v14, %b2 ]
   %v5 = phi i32 [ 0, %b1 ], [ %v13, %b2 ]
   %v6 = phi ptr [ undef, %b1 ], [ %v12, %b2 ]
   %v7 = load i16, ptr %v2, align 2
diff --git a/llvm/test/CodeGen/Hexagon/swp-resmii-1.ll b/llvm/test/CodeGen/Hexagon/swp-resmii-1.ll
index c6bb4a6d570f40..cd3c5ed58c8b2b 100644
--- a/llvm/test/CodeGen/Hexagon/swp-resmii-1.ll
+++ b/llvm/test/CodeGen/Hexagon/swp-resmii-1.ll
@@ -3,7 +3,7 @@
 
 ; Test that checks that we compute the correct ResMII for haar.
 
-; CHECK: MII = 4 MAX_II = 14 (rec=1, res=4)
+; CHECK: MII = {{[0-9]+}} MAX_II = {{[0-9]+}} (rec={{[0-9]+}}, res=4)
 
 ; Function Attrs: nounwind
 define void @f0(ptr noalias nocapture readonly %a0, i32 %a1, i32 %a2, i32 %a3, ptr noalias nocapture %a4, i32 %a5) #0 {
diff --git a/llvm/test/CodeGen/Hexagon/v6-haar-balign32.ll b/llvm/test/CodeGen/Hexagon/v6-haar-balign32.ll
index a31ccb408c6069..71232a8edbd274 100644
--- a/llvm/test/CodeGen/Hexagon/v6-haar-balign32.ll
+++ b/llvm/test/CodeGen/Hexagon/v6-haar-balign32.ll
@@ -2,7 +2,7 @@
 ; CHECK: .p2align{{.*}}5
 
 ; Function Attrs: nounwind
-define void @wobble(ptr noalias nocapture readonly %arg, i32 %arg1, i32 %arg2, i32 %arg3, ptr noalias nocapture %arg4, i32 %arg5) #0 {
+define void @wobble(ptr noalias nocapture readonly %arg, i32 %arg1, i32 %arg2, i32 %arg3, ptr noalias nocapture %arg4, i32 %arg5, ptr noalias nocapture %arg6) #0 {
 bb:
   %ashr = ashr i32 %arg3, 2
   %ashr6 = ashr i32 %arg3, 1
@@ -29,7 +29,7 @@ bb11:                                             ; preds = %bb9
   %add16 = add i32 %mul, %ashr
   %add17 = add i32 %mul, %ashr6
   %getelementptr = getelementptr inbounds i8, ptr %arg4, i32 %mul13
-  %getelementptr18 = getelementptr inbounds i8, ptr %arg4, i32 %mul14
+  %getelementptr18 = getelementptr inbounds i8, ptr %arg6, i32 %mul14
   %getelementptr19 = getelementptr inbounds i16, ptr %arg, i32 %add15
   %getelementptr20 = getelementptr inbounds i16, ptr %arg, i32 %add16
   %getelementptr21 = getelementptr inbounds i16, ptr %arg, i32 %add17
diff --git a/llvm/test/CodeGen/PowerPC/sms-store-dependence.ll b/llvm/test/CodeGen/PowerPC/sms-store-dependence.ll
index d1ec320d55680f..919a31f35b72b5 100644
--- a/llvm/test/CodeGen/PowerPC/sms-store-dependence.ll
+++ b/llvm/test/CodeGen/PowerPC/sms-store-dependence.ll
@@ -1,51 +1,18 @@
-; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py UTC_ARGS: --version 4
 ; RUN: llc < %s -mtriple=powerpc64le-unknown-linux-gnu -verify-machineinstrs\
-; RUN:       -mcpu=pwr9 --ppc-enable-pipeliner 2>&1 | FileCheck %s
+; RUN:       -mcpu=pwr9 --ppc-enable-pipeliner --debug-only=pipeliner 2>&1 | FileCheck %s
 
 ; Test that the pipeliner schedules the store instructions correctly. Since
 ; there is a dependence between the store, they cannot be scheduled further than
 ; MII cycles/instructions apart. That is, the first store cannot occur multiple
 ; times before the second ctore in the schedule.
+
+; CHECK: SU([[STORE0:[0-9]+]]): {{.*}} (store (s8) {{.*}})
+; CHECK: SU([[STORE1:[0-9]+]]): {{.*}} (store (s8) {{.*}})
+; CHECK: Schedule Found? 1
+; CHECK: cycle [[#CYCLE0:]] (1) ([[STORE1]])
+; CHECK: cycle [[#CYCLE0+1]]
+; CHECK: cycle {{[0-9]+}} (0) ([[STORE0]])
 define dso_local void @comp_method(ptr noalias nocapture noundef readonly %0, ptr nocapture noundef writeonly %1, ptr nocapture noundef writeonly %2, i32 noundef %3, i32 noundef %4, i32 noundef %5, i32 noundef %6, i64 %v1) local_unnamed_addr {
-; CHECK-LABEL: comp_method:
-; CHECK:       # %bb.0:
-; CHECK-NEXT:    extsw 7, 8
-; CHECK-NEXT:    extsw 8, 9
-; CHECK-NEXT:    clrldi 9, 6, 32
-; CHECK-NEXT:    addi 6, 3, -1
-; CHECK-NEXT:    mtctr 9
-; CHECK-NEXT:    li 11, 0
-; CHECK-NEXT:    sradi 12, 11, 2
-; CHECK-NEXT:    add 5, 5, 8
-; CHECK-NEXT:    li 8, 2
-; CHECK-NEXT:    li 3, 8
-; CHECK-NEXT:    addi 11, 7, 0
-; CHECK-NEXT:    std 30, -16(1) # 8-byte Folded Spill
-; CHECK-NEXT:    lbzu 9, 1(6)
-; CHECK-NEXT:    add 12, 12, 10
-; CHECK-NEXT:    extsb 9, 9
-; CHECK-NEXT:    stbx 8, 4, 9
-; CHECK-NEXT:    add 9, 9, 12
-; CHECK-NEXT:    bdz .LBB0_2
-; CHECK-NEXT:    .p2align 4
-; CHECK-NEXT:  .LBB0_1:
-; CHECK-NEXT:    lbzu 0, 1(6)
-; CHECK-NEXT:    sradi 12, 11, 2
-; CHECK-NEXT:    add 11, 11, 7
-; CHECK-NEXT:    add 12, 12, 10
-; CHECK-NEXT:    sldi 30, 9, 2
-; CHECK-NEXT:    add 9, 9, 30
-; CHECK-NEXT:    extsb 0, 0
-; CHECK-NEXT:    stbx 3, 5, 9
-; CHECK-NEXT:    add 9, 0, 12
-; CHECK-NEXT:    stbx 8, 4, 0
-; CHECK-NEXT:    bdnz .LBB0_1
-; CHECK-NEXT:  .LBB0_2:
-; CHECK-NEXT:    sldi 4, 9, 2
-; CHECK-NEXT:    ld 30, -16(1) # 8-byte Folded Reload
-; CHECK-NEXT:    add 4, 9, 4
-; CHECK-NEXT:    stbx 3, 5, 4
-; CHECK-NEXT:    blr
   %8 = icmp sgt i32 %3, 64
   tail call void @llvm.assume(i1 %8)
   %9 = and i32 %3, 1