[llvm] 878e498 - [AArch64] Expand typesizes of tests for constant srem/urem. NFC

Sun Jul 2 04:44:20 PDT 2023

Author: David Green
Date: 2023-07-02T12:44:15+01:00
New Revision: 878e498f0575581765b2b9fbaa48f2217bb03374

URL: https://github.com/llvm/llvm-project/commit/878e498f0575581765b2b9fbaa48f2217bb03374
DIFF: https://github.com/llvm/llvm-project/commit/878e498f0575581765b2b9fbaa48f2217bb03374.diff

LOG: [AArch64] Expand typesizes of tests for constant srem/urem. NFC

See D154049.

Added: 
    

Modified: 
    llvm/test/CodeGen/AArch64/srem-vector-lkk.ll
    llvm/test/CodeGen/AArch64/urem-vector-lkk.ll

Removed: 
    


################################################################################
diff  --git a/llvm/test/CodeGen/AArch64/srem-vector-lkk.ll b/llvm/test/CodeGen/AArch64/srem-vector-lkk.ll
index 827051ed47efe..5206c7735c73c 100644

--- a/llvm/test/CodeGen/AArch64/srem-vector-lkk.ll
+++ b/llvm/test/CodeGen/AArch64/srem-vector-lkk.ll
@@ -7,12 +7,12 @@ define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {
 ; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
 ; CHECK-NEXT:    smov w8, v0.h[1]
 ; CHECK-NEXT:    smov w9, v0.h[0]
-; CHECK-NEXT:    mov w10, #63421
-; CHECK-NEXT:    mov w11, #37253
+; CHECK-NEXT:    mov w10, #63421 // =0xf7bd
+; CHECK-NEXT:    mov w11, #37253 // =0x9185
 ; CHECK-NEXT:    movk w10, #31710, lsl #16
 ; CHECK-NEXT:    movk w11, #44150, lsl #16
 ; CHECK-NEXT:    smov w13, v0.h[2]
-; CHECK-NEXT:    mov w12, #33437
+; CHECK-NEXT:    mov w12, #33437 // =0x829d
 ; CHECK-NEXT:    smull x10, w8, w10
 ; CHECK-NEXT:    movk w12, #21399, lsl #16
 ; CHECK-NEXT:    smull x11, w9, w11
@@ -24,8 +24,8 @@ define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {
 ; CHECK-NEXT:    asr w15, w11, #6
 ; CHECK-NEXT:    add w10, w14, w10, lsr #31
 ; CHECK-NEXT:    add w11, w15, w11, lsr #31
-; CHECK-NEXT:    mov w14, #95
-; CHECK-NEXT:    mov w15, #-124
+; CHECK-NEXT:    mov w14, #95 // =0x5f
+; CHECK-NEXT:    mov w15, #-124 // =0xffffff84
 ; CHECK-NEXT:    smull x12, w13, w12
 ; CHECK-NEXT:    msub w9, w11, w14, w9
 ; CHECK-NEXT:    msub w8, w10, w15, w8
@@ -33,9 +33,9 @@ define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {
 ; CHECK-NEXT:    asr x11, x12, #37
 ; CHECK-NEXT:    smov w12, v0.h[3]
 ; CHECK-NEXT:    add w10, w11, w10
-; CHECK-NEXT:    mov w11, #98
+; CHECK-NEXT:    mov w11, #98 // =0x62
 ; CHECK-NEXT:    fmov s0, w9
-; CHECK-NEXT:    mov w9, #63249
+; CHECK-NEXT:    mov w9, #63249 // =0xf711
 ; CHECK-NEXT:    movk w9, #48808, lsl #16
 ; CHECK-NEXT:    msub w10, w10, w11, w13
 ; CHECK-NEXT:    smull x9, w12, w9
@@ -43,7 +43,7 @@ define <4 x i16> @fold_srem_vec_1(<4 x i16> %x) {
 ; CHECK-NEXT:    lsr x8, x9, #63
 ; CHECK-NEXT:    asr x9, x9, #40
 ; CHECK-NEXT:    add w8, w9, w8
-; CHECK-NEXT:    mov w9, #-1003
+; CHECK-NEXT:    mov w9, #-1003 // =0xfffffc15
 ; CHECK-NEXT:    mov v0.h[2], w10
 ; CHECK-NEXT:    msub w8, w8, w9, w12
 ; CHECK-NEXT:    mov v0.h[3], w8
@@ -58,11 +58,11 @@ define <4 x i16> @fold_srem_vec_2(<4 x i16> %x) {
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
 ; CHECK-NEXT:    smov w9, v0.h[0]
-; CHECK-NEXT:    mov w8, #37253
+; CHECK-NEXT:    mov w8, #37253 // =0x9185
 ; CHECK-NEXT:    movk w8, #44150, lsl #16
 ; CHECK-NEXT:    smov w10, v0.h[1]
 ; CHECK-NEXT:    smov w14, v0.h[2]
-; CHECK-NEXT:    mov w12, #95
+; CHECK-NEXT:    mov w12, #95 // =0x5f
 ; CHECK-NEXT:    smull x11, w9, w8
 ; CHECK-NEXT:    smull x13, w10, w8
 ; CHECK-NEXT:    lsr x11, x11, #32
@@ -105,12 +105,12 @@ define <4 x i16> @combine_srem_sdiv(<4 x i16> %x) {
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
 ; CHECK-NEXT:    smov w9, v0.h[0]
-; CHECK-NEXT:    mov w8, #37253
+; CHECK-NEXT:    mov w8, #37253 // =0x9185
 ; CHECK-NEXT:    movk w8, #44150, lsl #16
 ; CHECK-NEXT:    smov w10, v0.h[1]
 ; CHECK-NEXT:    smov w11, v0.h[2]
 ; CHECK-NEXT:    smov w12, v0.h[3]
-; CHECK-NEXT:    mov w14, #95
+; CHECK-NEXT:    mov w14, #95 // =0x5f
 ; CHECK-NEXT:    smull x13, w9, w8
 ; CHECK-NEXT:    smull x15, w10, w8
 ; CHECK-NEXT:    lsr x13, x13, #32
@@ -158,7 +158,7 @@ define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) {
 ; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
 ; CHECK-NEXT:    smov w9, v0.h[1]
 ; CHECK-NEXT:    smov w10, v0.h[0]
-; CHECK-NEXT:    mov w8, #37253
+; CHECK-NEXT:    mov w8, #37253 // =0x9185
 ; CHECK-NEXT:    smov w12, v0.h[2]
 ; CHECK-NEXT:    movk w8, #44150, lsl #16
 ; CHECK-NEXT:    negs w11, w9
@@ -181,7 +181,7 @@ define <4 x i16> @dont_fold_srem_power_of_two(<4 x i16> %x) {
 ; CHECK-NEXT:    csneg w9, w9, w10, mi
 ; CHECK-NEXT:    asr w10, w8, #6
 ; CHECK-NEXT:    add w8, w10, w8, lsr #31
-; CHECK-NEXT:    mov w10, #95
+; CHECK-NEXT:    mov w10, #95 // =0x5f
 ; CHECK-NEXT:    mov v0.h[2], w9
 ; CHECK-NEXT:    msub w8, w8, w10, w11
 ; CHECK-NEXT:    mov v0.h[3], w8
@@ -197,11 +197,11 @@ define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
 ; CHECK-NEXT:    smov w8, v0.h[1]
-; CHECK-NEXT:    mov w9, #30865
+; CHECK-NEXT:    mov w9, #30865 // =0x7891
 ; CHECK-NEXT:    movk w9, #51306, lsl #16
 ; CHECK-NEXT:    smov w10, v0.h[2]
-; CHECK-NEXT:    mov w11, #17097
-; CHECK-NEXT:    mov w12, #654
+; CHECK-NEXT:    mov w11, #17097 // =0x42c9
+; CHECK-NEXT:    mov w12, #654 // =0x28e
 ; CHECK-NEXT:    movk w11, #45590, lsl #16
 ; CHECK-NEXT:    smull x9, w8, w9
 ; CHECK-NEXT:    smull x11, w10, w11
@@ -211,13 +211,13 @@ define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {
 ; CHECK-NEXT:    asr w13, w9, #9
 ; CHECK-NEXT:    add w11, w11, w10
 ; CHECK-NEXT:    add w9, w13, w9, lsr #31
-; CHECK-NEXT:    mov w13, #23
+; CHECK-NEXT:    mov w13, #23 // =0x17
 ; CHECK-NEXT:    msub w8, w9, w12, w8
 ; CHECK-NEXT:    asr w9, w11, #4
 ; CHECK-NEXT:    smov w12, v0.h[3]
 ; CHECK-NEXT:    add w9, w9, w11, lsr #31
 ; CHECK-NEXT:    movi v0.2d, #0000000000000000
-; CHECK-NEXT:    mov w11, #47143
+; CHECK-NEXT:    mov w11, #47143 // =0xb827
 ; CHECK-NEXT:    movk w11, #24749, lsl #16
 ; CHECK-NEXT:    msub w9, w9, w13, w10
 ; CHECK-NEXT:    smull x10, w12, w11
@@ -225,7 +225,7 @@ define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {
 ; CHECK-NEXT:    lsr x8, x10, #63
 ; CHECK-NEXT:    asr x10, x10, #43
 ; CHECK-NEXT:    add w8, w10, w8
-; CHECK-NEXT:    mov w10, #5423
+; CHECK-NEXT:    mov w10, #5423 // =0x152f
 ; CHECK-NEXT:    mov v0.h[2], w9
 ; CHECK-NEXT:    msub w8, w8, w10, w12
 ; CHECK-NEXT:    mov v0.h[3], w8
@@ -241,11 +241,11 @@ define <4 x i16> @dont_fold_srem_i16_smax(<4 x i16> %x) {
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
 ; CHECK-NEXT:    smov w9, v0.h[2]
-; CHECK-NEXT:    mov w8, #17097
+; CHECK-NEXT:    mov w8, #17097 // =0x42c9
 ; CHECK-NEXT:    movk w8, #45590, lsl #16
 ; CHECK-NEXT:    smov w10, v0.h[1]
 ; CHECK-NEXT:    smov w12, v0.h[3]
-; CHECK-NEXT:    mov w11, #23
+; CHECK-NEXT:    mov w11, #23 // =0x17
 ; CHECK-NEXT:    movi v1.2d, #0000000000000000
 ; CHECK-NEXT:    smull x8, w9, w8
 ; CHECK-NEXT:    lsr x8, x8, #32
@@ -256,7 +256,7 @@ define <4 x i16> @dont_fold_srem_i16_smax(<4 x i16> %x) {
 ; CHECK-NEXT:    and w10, w10, #0x7fff
 ; CHECK-NEXT:    and w13, w13, #0x7fff
 ; CHECK-NEXT:    csneg w10, w10, w13, mi
-; CHECK-NEXT:    mov w13, #47143
+; CHECK-NEXT:    mov w13, #47143 // =0xb827
 ; CHECK-NEXT:    movk w13, #24749, lsl #16
 ; CHECK-NEXT:    msub w8, w8, w11, w9
 ; CHECK-NEXT:    smull x9, w12, w13
@@ -264,7 +264,7 @@ define <4 x i16> @dont_fold_srem_i16_smax(<4 x i16> %x) {
 ; CHECK-NEXT:    lsr x10, x9, #63
 ; CHECK-NEXT:    asr x9, x9, #43
 ; CHECK-NEXT:    add w9, w9, w10
-; CHECK-NEXT:    mov w10, #5423
+; CHECK-NEXT:    mov w10, #5423 // =0x152f
 ; CHECK-NEXT:    mov v1.h[2], w8
 ; CHECK-NEXT:    msub w8, w9, w10, w12
 ; CHECK-NEXT:    mov v1.h[3], w8
@@ -278,14 +278,14 @@ define <4 x i16> @dont_fold_srem_i16_smax(<4 x i16> %x) {
 define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {
 ; CHECK-LABEL: dont_fold_srem_i64:
 ; CHECK:       // %bb.0:
-; CHECK-NEXT:    mov x8, #8549
+; CHECK-NEXT:    mov x8, #8549 // =0x2165
 ; CHECK-NEXT:    fmov x9, d1
 ; CHECK-NEXT:    movk x8, #22795, lsl #16
-; CHECK-NEXT:    mov x12, #6055
+; CHECK-NEXT:    mov x12, #6055 // =0x17a7
 ; CHECK-NEXT:    movk x8, #17096, lsl #32
 ; CHECK-NEXT:    movk x12, #58853, lsl #16
 ; CHECK-NEXT:    movk x8, #45590, lsl #48
-; CHECK-NEXT:    mov x14, #21445
+; CHECK-NEXT:    mov x14, #21445 // =0x53c5
 ; CHECK-NEXT:    mov x10, v1.d[1]
 ; CHECK-NEXT:    movk x12, #47142, lsl #32
 ; CHECK-NEXT:    smulh x8, x9, x8
@@ -297,16 +297,16 @@ define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {
 ; CHECK-NEXT:    asr x13, x8, #4
 ; CHECK-NEXT:    movk x14, #25653, lsl #48
 ; CHECK-NEXT:    add x8, x13, x8, lsr #63
-; CHECK-NEXT:    mov w13, #23
+; CHECK-NEXT:    mov w13, #23 // =0x17
 ; CHECK-NEXT:    smulh x12, x10, x12
 ; CHECK-NEXT:    smulh x14, x11, x14
 ; CHECK-NEXT:    msub x8, x8, x13, x9
 ; CHECK-NEXT:    asr x13, x12, #11
 ; CHECK-NEXT:    add x12, x13, x12, lsr #63
 ; CHECK-NEXT:    asr x13, x14, #8
-; CHECK-NEXT:    mov w9, #5423
+; CHECK-NEXT:    mov w9, #5423 // =0x152f
 ; CHECK-NEXT:    add x13, x13, x14, lsr #63
-; CHECK-NEXT:    mov w14, #654
+; CHECK-NEXT:    mov w14, #654 // =0x28e
 ; CHECK-NEXT:    msub x9, x12, x9, x10
 ; CHECK-NEXT:    fmov d1, x8
 ; CHECK-NEXT:    msub x10, x13, x14, x11
@@ -317,3 +317,232 @@ define <4 x i64> @dont_fold_srem_i64(<4 x i64> %x) {
   %1 = srem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
   ret <4 x i64> %1
 }
+
+define <16 x i8> @fold_srem_v16i8(<16 x i8> %x) {
+; CHECK-LABEL: fold_srem_v16i8:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    movi v1.16b, #103
+; CHECK-NEXT:    smull2 v2.8h, v0.16b, v1.16b
+; CHECK-NEXT:    smull v1.8h, v0.8b, v1.8b
+; CHECK-NEXT:    uzp2 v1.16b, v1.16b, v2.16b
+; CHECK-NEXT:    movi v2.16b, #10
+; CHECK-NEXT:    sshr v1.16b, v1.16b, #2
+; CHECK-NEXT:    usra v1.16b, v1.16b, #7
+; CHECK-NEXT:    mls v0.16b, v1.16b, v2.16b
+; CHECK-NEXT:    ret
+  %1 = srem <16 x i8> %x, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
+  ret <16 x i8> %1
+}
+
+define <8 x i8> @fold_srem_v8i8(<8 x i8> %x) {
+; CHECK-LABEL: fold_srem_v8i8:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
+; CHECK-NEXT:    smov w10, v0.b[0]
+; CHECK-NEXT:    mov w8, #26215 // =0x6667
+; CHECK-NEXT:    movk w8, #26214, lsl #16
+; CHECK-NEXT:    smov w11, v0.b[1]
+; CHECK-NEXT:    smull x9, w10, w8
+; CHECK-NEXT:    smull x14, w11, w8
+; CHECK-NEXT:    lsr x12, x9, #63
+; CHECK-NEXT:    asr x13, x9, #34
+; CHECK-NEXT:    mov w9, #10 // =0xa
+; CHECK-NEXT:    add w12, w13, w12
+; CHECK-NEXT:    smov w13, v0.b[2]
+; CHECK-NEXT:    msub w10, w12, w9, w10
+; CHECK-NEXT:    lsr x12, x14, #63
+; CHECK-NEXT:    asr x14, x14, #34
+; CHECK-NEXT:    add w12, w14, w12
+; CHECK-NEXT:    smov w14, v0.b[3]
+; CHECK-NEXT:    smull x15, w13, w8
+; CHECK-NEXT:    msub w11, w12, w9, w11
+; CHECK-NEXT:    fmov s1, w10
+; CHECK-NEXT:    lsr x10, x15, #63
+; CHECK-NEXT:    asr x12, x15, #34
+; CHECK-NEXT:    add w10, w12, w10
+; CHECK-NEXT:    smull x12, w14, w8
+; CHECK-NEXT:    smov w15, v0.b[4]
+; CHECK-NEXT:    mov v1.b[1], w11
+; CHECK-NEXT:    msub w10, w10, w9, w13
+; CHECK-NEXT:    lsr x11, x12, #63
+; CHECK-NEXT:    asr x12, x12, #34
+; CHECK-NEXT:    add w11, w12, w11
+; CHECK-NEXT:    smov w13, v0.b[5]
+; CHECK-NEXT:    smull x12, w15, w8
+; CHECK-NEXT:    mov v1.b[2], w10
+; CHECK-NEXT:    msub w10, w11, w9, w14
+; CHECK-NEXT:    lsr x11, x12, #63
+; CHECK-NEXT:    asr x12, x12, #34
+; CHECK-NEXT:    add w11, w12, w11
+; CHECK-NEXT:    smull x12, w13, w8
+; CHECK-NEXT:    smov w14, v0.b[6]
+; CHECK-NEXT:    mov v1.b[3], w10
+; CHECK-NEXT:    msub w10, w11, w9, w15
+; CHECK-NEXT:    lsr x11, x12, #63
+; CHECK-NEXT:    asr x12, x12, #34
+; CHECK-NEXT:    add w11, w12, w11
+; CHECK-NEXT:    smov w15, v0.b[7]
+; CHECK-NEXT:    smull x12, w14, w8
+; CHECK-NEXT:    mov v1.b[4], w10
+; CHECK-NEXT:    msub w10, w11, w9, w13
+; CHECK-NEXT:    lsr x11, x12, #63
+; CHECK-NEXT:    asr x12, x12, #34
+; CHECK-NEXT:    add w11, w12, w11
+; CHECK-NEXT:    smull x8, w15, w8
+; CHECK-NEXT:    mov v1.b[5], w10
+; CHECK-NEXT:    msub w10, w11, w9, w14
+; CHECK-NEXT:    lsr x11, x8, #63
+; CHECK-NEXT:    asr x8, x8, #34
+; CHECK-NEXT:    add w8, w8, w11
+; CHECK-NEXT:    mov v1.b[6], w10
+; CHECK-NEXT:    msub w8, w8, w9, w15
+; CHECK-NEXT:    mov v1.b[7], w8
+; CHECK-NEXT:    fmov d0, d1
+; CHECK-NEXT:    ret
+  %1 = srem <8 x i8> %x, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
+  ret <8 x i8> %1
+}
+
+define <8 x i16> @fold_srem_v8i16(<8 x i16> %x) {
+; CHECK-LABEL: fold_srem_v8i16:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    mov w8, #26215 // =0x6667
+; CHECK-NEXT:    dup v1.8h, w8
+; CHECK-NEXT:    smull2 v2.4s, v0.8h, v1.8h
+; CHECK-NEXT:    smull v1.4s, v0.4h, v1.4h
+; CHECK-NEXT:    uzp2 v1.8h, v1.8h, v2.8h
+; CHECK-NEXT:    movi v2.8h, #10
+; CHECK-NEXT:    sshr v1.8h, v1.8h, #2
+; CHECK-NEXT:    usra v1.8h, v1.8h, #15
+; CHECK-NEXT:    mls v0.8h, v1.8h, v2.8h
+; CHECK-NEXT:    ret
+  %1 = srem <8 x i16> %x, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>
+  ret <8 x i16> %1
+}
+
+define <4 x i16> @fold_srem_v4i16(<4 x i16> %x) {
+; CHECK-LABEL: fold_srem_v4i16:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
+; CHECK-NEXT:    smov w9, v0.h[0]
+; CHECK-NEXT:    mov w8, #26215 // =0x6667
+; CHECK-NEXT:    movk w8, #26214, lsl #16
+; CHECK-NEXT:    smov w10, v0.h[1]
+; CHECK-NEXT:    mov w13, #10 // =0xa
+; CHECK-NEXT:    smull x11, w9, w8
+; CHECK-NEXT:    smull x14, w10, w8
+; CHECK-NEXT:    lsr x12, x11, #63
+; CHECK-NEXT:    asr x11, x11, #34
+; CHECK-NEXT:    add w11, w11, w12
+; CHECK-NEXT:    smov w12, v0.h[2]
+; CHECK-NEXT:    msub w9, w11, w13, w9
+; CHECK-NEXT:    lsr x11, x14, #63
+; CHECK-NEXT:    asr x14, x14, #34
+; CHECK-NEXT:    add w11, w14, w11
+; CHECK-NEXT:    smov w14, v0.h[3]
+; CHECK-NEXT:    smull x15, w12, w8
+; CHECK-NEXT:    msub w10, w11, w13, w10
+; CHECK-NEXT:    fmov s0, w9
+; CHECK-NEXT:    lsr x9, x15, #63
+; CHECK-NEXT:    asr x11, x15, #34
+; CHECK-NEXT:    add w9, w11, w9
+; CHECK-NEXT:    smull x8, w14, w8
+; CHECK-NEXT:    mov v0.h[1], w10
+; CHECK-NEXT:    msub w9, w9, w13, w12
+; CHECK-NEXT:    lsr x10, x8, #63
+; CHECK-NEXT:    asr x8, x8, #34
+; CHECK-NEXT:    add w8, w8, w10
+; CHECK-NEXT:    mov v0.h[2], w9
+; CHECK-NEXT:    msub w8, w8, w13, w14
+; CHECK-NEXT:    mov v0.h[3], w8
+; CHECK-NEXT:    // kill: def $d0 killed $d0 killed $q0
+; CHECK-NEXT:    ret
+  %1 = srem <4 x i16> %x, <i16 10, i16 10, i16 10, i16 10>
+  ret <4 x i16> %1
+}
+
+define <4 x i32> @fold_srem_v4i32(<4 x i32> %x) {
+; CHECK-LABEL: fold_srem_v4i32:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    mov w8, #26215 // =0x6667
+; CHECK-NEXT:    movk w8, #26214, lsl #16
+; CHECK-NEXT:    movi v3.4s, #10
+; CHECK-NEXT:    dup v1.4s, w8
+; CHECK-NEXT:    smull2 v2.2d, v0.4s, v1.4s
+; CHECK-NEXT:    smull v1.2d, v0.2s, v1.2s
+; CHECK-NEXT:    uzp2 v1.4s, v1.4s, v2.4s
+; CHECK-NEXT:    sshr v2.4s, v1.4s, #2
+; CHECK-NEXT:    usra v2.4s, v1.4s, #31
+; CHECK-NEXT:    mls v0.4s, v2.4s, v3.4s
+; CHECK-NEXT:    ret
+  %1 = srem <4 x i32> %x, <i32 10, i32 10, i32 10, i32 10>
+  ret <4 x i32> %1
+}
+
+define <2 x i32> @fold_srem_v2i32(<2 x i32> %x) {
+; CHECK-LABEL: fold_srem_v2i32:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
+; CHECK-NEXT:    mov w8, #26215 // =0x6667
+; CHECK-NEXT:    fmov w9, s0
+; CHECK-NEXT:    movk w8, #26214, lsl #16
+; CHECK-NEXT:    mov w10, v0.s[1]
+; CHECK-NEXT:    smull x11, w9, w8
+; CHECK-NEXT:    lsr x12, x11, #63
+; CHECK-NEXT:    asr x11, x11, #34
+; CHECK-NEXT:    add w11, w11, w12
+; CHECK-NEXT:    mov w12, #10 // =0xa
+; CHECK-NEXT:    smull x8, w10, w8
+; CHECK-NEXT:    msub w9, w11, w12, w9
+; CHECK-NEXT:    lsr x11, x8, #63
+; CHECK-NEXT:    asr x8, x8, #34
+; CHECK-NEXT:    add w8, w8, w11
+; CHECK-NEXT:    msub w8, w8, w12, w10
+; CHECK-NEXT:    fmov s0, w9
+; CHECK-NEXT:    mov v0.s[1], w8
+; CHECK-NEXT:    // kill: def $d0 killed $d0 killed $q0
+; CHECK-NEXT:    ret
+  %1 = srem <2 x i32> %x, <i32 10, i32 10>
+  ret <2 x i32> %1
+}
+
+define <2 x i64> @fold_srem_v2i64(<2 x i64> %x) {
+; CHECK-LABEL: fold_srem_v2i64:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    mov x8, #7378697629483820646 // =0x6666666666666666
+; CHECK-NEXT:    fmov x10, d0
+; CHECK-NEXT:    movk x8, #26215
+; CHECK-NEXT:    mov x9, v0.d[1]
+; CHECK-NEXT:    smulh x11, x10, x8
+; CHECK-NEXT:    asr x12, x11, #2
+; CHECK-NEXT:    smulh x8, x9, x8
+; CHECK-NEXT:    add x11, x12, x11, lsr #63
+; CHECK-NEXT:    mov w12, #10 // =0xa
+; CHECK-NEXT:    msub x10, x11, x12, x10
+; CHECK-NEXT:    asr x11, x8, #2
+; CHECK-NEXT:    add x8, x11, x8, lsr #63
+; CHECK-NEXT:    msub x8, x8, x12, x9
+; CHECK-NEXT:    fmov d0, x10
+; CHECK-NEXT:    mov v0.d[1], x8
+; CHECK-NEXT:    ret
+  %1 = srem <2 x i64> %x, <i64 10, i64 10>
+  ret <2 x i64> %1
+}
+
+define <1 x i64> @fold_srem_v1i64(<1 x i64> %x) {
+; CHECK-LABEL: fold_srem_v1i64:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
+; CHECK-NEXT:    mov x8, #7378697629483820646 // =0x6666666666666666
+; CHECK-NEXT:    fmov x9, d0
+; CHECK-NEXT:    movk x8, #26215
+; CHECK-NEXT:    smulh x8, x9, x8
+; CHECK-NEXT:    asr x10, x8, #2
+; CHECK-NEXT:    add x8, x10, x8, lsr #63
+; CHECK-NEXT:    mov w10, #10 // =0xa
+; CHECK-NEXT:    msub x8, x8, x10, x9
+; CHECK-NEXT:    fmov d0, x8
+; CHECK-NEXT:    ret
+  %1 = srem <1 x i64> %x, <i64 10>
+  ret <1 x i64> %1
+}

diff  --git a/llvm/test/CodeGen/AArch64/urem-vector-lkk.ll b/llvm/test/CodeGen/AArch64/urem-vector-lkk.ll
index 577829952becc..0970639c3f1f2 100644
--- a/llvm/test/CodeGen/AArch64/urem-vector-lkk.ll
+++ b/llvm/test/CodeGen/AArch64/urem-vector-lkk.ll
@@ -6,11 +6,11 @@ define <4 x i16> @fold_urem_vec_1(<4 x i16> %x) {
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
 ; CHECK-NEXT:    umov w8, v0.h[0]
-; CHECK-NEXT:    mov w9, #55879
+; CHECK-NEXT:    mov w9, #55879 // =0xda47
 ; CHECK-NEXT:    movk w9, #689, lsl #16
 ; CHECK-NEXT:    umov w10, v0.h[1]
-; CHECK-NEXT:    mov w11, #33826
-; CHECK-NEXT:    mov w12, #95
+; CHECK-NEXT:    mov w11, #33826 // =0x8422
+; CHECK-NEXT:    mov w12, #95 // =0x5f
 ; CHECK-NEXT:    movk w11, #528, lsl #16
 ; CHECK-NEXT:    umov w13, v0.h[2]
 ; CHECK-NEXT:    umull x9, w8, w9
@@ -18,21 +18,21 @@ define <4 x i16> @fold_urem_vec_1(<4 x i16> %x) {
 ; CHECK-NEXT:    lsr x9, x9, #32
 ; CHECK-NEXT:    lsr x11, x11, #32
 ; CHECK-NEXT:    msub w8, w9, w12, w8
-; CHECK-NEXT:    mov w9, #48149
+; CHECK-NEXT:    mov w9, #48149 // =0xbc15
 ; CHECK-NEXT:    movk w9, #668, lsl #16
-; CHECK-NEXT:    mov w12, #124
+; CHECK-NEXT:    mov w12, #124 // =0x7c
 ; CHECK-NEXT:    umull x9, w13, w9
 ; CHECK-NEXT:    msub w10, w11, w12, w10
 ; CHECK-NEXT:    umov w11, v0.h[3]
 ; CHECK-NEXT:    fmov s0, w8
-; CHECK-NEXT:    mov w12, #22281
+; CHECK-NEXT:    mov w12, #22281 // =0x5709
 ; CHECK-NEXT:    lsr x8, x9, #32
-; CHECK-NEXT:    mov w9, #98
+; CHECK-NEXT:    mov w9, #98 // =0x62
 ; CHECK-NEXT:    movk w12, #65, lsl #16
 ; CHECK-NEXT:    msub w8, w8, w9, w13
 ; CHECK-NEXT:    mov v0.h[1], w10
 ; CHECK-NEXT:    umull x9, w11, w12
-; CHECK-NEXT:    mov w10, #1003
+; CHECK-NEXT:    mov w10, #1003 // =0x3eb
 ; CHECK-NEXT:    lsr x9, x9, #32
 ; CHECK-NEXT:    mov v0.h[2], w8
 ; CHECK-NEXT:    msub w8, w9, w10, w11
@@ -48,10 +48,10 @@ define <4 x i16> @fold_urem_vec_2(<4 x i16> %x) {
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
 ; CHECK-NEXT:    umov w8, v0.h[0]
-; CHECK-NEXT:    mov w9, #55879
+; CHECK-NEXT:    mov w9, #55879 // =0xda47
 ; CHECK-NEXT:    movk w9, #689, lsl #16
 ; CHECK-NEXT:    umov w10, v0.h[1]
-; CHECK-NEXT:    mov w12, #95
+; CHECK-NEXT:    mov w12, #95 // =0x5f
 ; CHECK-NEXT:    umov w13, v0.h[2]
 ; CHECK-NEXT:    umull x11, w8, w9
 ; CHECK-NEXT:    umull x14, w10, w9
@@ -83,10 +83,10 @@ define <4 x i16> @combine_urem_udiv(<4 x i16> %x) {
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
 ; CHECK-NEXT:    umov w8, v0.h[0]
-; CHECK-NEXT:    mov w9, #55879
+; CHECK-NEXT:    mov w9, #55879 // =0xda47
 ; CHECK-NEXT:    movk w9, #689, lsl #16
 ; CHECK-NEXT:    umov w10, v0.h[1]
-; CHECK-NEXT:    mov w12, #95
+; CHECK-NEXT:    mov w12, #95 // =0x5f
 ; CHECK-NEXT:    umov w14, v0.h[2]
 ; CHECK-NEXT:    umov w15, v0.h[3]
 ; CHECK-NEXT:    umull x11, w8, w9
@@ -126,7 +126,7 @@ define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {
 ; CHECK-NEXT:    umov w9, v0.h[0]
 ; CHECK-NEXT:    umov w11, v0.h[1]
 ; CHECK-NEXT:    umov w10, v0.h[3]
-; CHECK-NEXT:    mov w8, #55879
+; CHECK-NEXT:    mov w8, #55879 // =0xda47
 ; CHECK-NEXT:    movk w8, #689, lsl #16
 ; CHECK-NEXT:    and w9, w9, #0x3f
 ; CHECK-NEXT:    umull x8, w10, w8
@@ -135,7 +135,7 @@ define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {
 ; CHECK-NEXT:    umov w11, v0.h[2]
 ; CHECK-NEXT:    lsr x8, x8, #32
 ; CHECK-NEXT:    mov v1.h[1], w9
-; CHECK-NEXT:    mov w9, #95
+; CHECK-NEXT:    mov w9, #95 // =0x5f
 ; CHECK-NEXT:    and w11, w11, #0x7
 ; CHECK-NEXT:    msub w8, w8, w9, w10
 ; CHECK-NEXT:    mov v1.h[2], w11
@@ -147,18 +147,18 @@ define <4 x i16> @dont_fold_urem_power_of_two(<4 x i16> %x) {
 }
 
 ; Don't fold if the divisor is one.
-define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {
-; CHECK-LABEL: dont_fold_srem_one:
+define <4 x i16> @dont_fold_urem_one(<4 x i16> %x) {
+; CHECK-LABEL: dont_fold_urem_one:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
 ; CHECK-NEXT:    umov w8, v0.h[1]
-; CHECK-NEXT:    mov w9, #13629
+; CHECK-NEXT:    mov w9, #13629 // =0x353d
 ; CHECK-NEXT:    movk w9, #100, lsl #16
 ; CHECK-NEXT:    umov w10, v0.h[2]
-; CHECK-NEXT:    mov w11, #25645
-; CHECK-NEXT:    mov w12, #654
+; CHECK-NEXT:    mov w11, #25645 // =0x642d
+; CHECK-NEXT:    mov w12, #654 // =0x28e
 ; CHECK-NEXT:    movk w11, #2849, lsl #16
-; CHECK-NEXT:    mov w13, #5560
+; CHECK-NEXT:    mov w13, #5560 // =0x15b8
 ; CHECK-NEXT:    umull x9, w8, w9
 ; CHECK-NEXT:    movk w13, #12, lsl #16
 ; CHECK-NEXT:    umull x11, w10, w11
@@ -167,9 +167,9 @@ define <4 x i16> @dont_fold_srem_one(<4 x i16> %x) {
 ; CHECK-NEXT:    lsr x11, x11, #32
 ; CHECK-NEXT:    msub w8, w9, w12, w8
 ; CHECK-NEXT:    umov w9, v0.h[3]
-; CHECK-NEXT:    mov w12, #23
+; CHECK-NEXT:    mov w12, #23 // =0x17
 ; CHECK-NEXT:    msub w10, w11, w12, w10
-; CHECK-NEXT:    mov w11, #5423
+; CHECK-NEXT:    mov w11, #5423 // =0x152f
 ; CHECK-NEXT:    mov v1.h[1], w8
 ; CHECK-NEXT:    umull x8, w9, w13
 ; CHECK-NEXT:    lsr x8, x8, #32
@@ -195,10 +195,10 @@ define <4 x i16> @dont_fold_urem_i16_smax(<4 x i16> %x) {
 define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {
 ; CHECK-LABEL: dont_fold_urem_i64:
 ; CHECK:       // %bb.0:
-; CHECK-NEXT:    mov x8, #17097
+; CHECK-NEXT:    mov x8, #17097 // =0x42c9
 ; CHECK-NEXT:    fmov x9, d1
 ; CHECK-NEXT:    movk x8, #45590, lsl #16
-; CHECK-NEXT:    mov x13, #21445
+; CHECK-NEXT:    mov x13, #21445 // =0x53c5
 ; CHECK-NEXT:    movk x8, #34192, lsl #32
 ; CHECK-NEXT:    movk x13, #1603, lsl #16
 ; CHECK-NEXT:    movk x8, #25644, lsl #48
@@ -210,19 +210,19 @@ define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {
 ; CHECK-NEXT:    sub x12, x9, x8
 ; CHECK-NEXT:    lsr x14, x10, #1
 ; CHECK-NEXT:    add x8, x8, x12, lsr #1
-; CHECK-NEXT:    mov x12, #12109
+; CHECK-NEXT:    mov x12, #12109 // =0x2f4d
 ; CHECK-NEXT:    movk x12, #52170, lsl #16
 ; CHECK-NEXT:    umulh x13, x14, x13
 ; CHECK-NEXT:    movk x12, #28749, lsl #32
-; CHECK-NEXT:    mov w14, #23
+; CHECK-NEXT:    mov w14, #23 // =0x17
 ; CHECK-NEXT:    movk x12, #49499, lsl #48
 ; CHECK-NEXT:    lsr x8, x8, #4
 ; CHECK-NEXT:    lsr x13, x13, #7
 ; CHECK-NEXT:    umulh x12, x11, x12
 ; CHECK-NEXT:    msub x8, x8, x14, x9
-; CHECK-NEXT:    mov w9, #5423
+; CHECK-NEXT:    mov w9, #5423 // =0x152f
 ; CHECK-NEXT:    lsr x12, x12, #12
-; CHECK-NEXT:    mov w14, #654
+; CHECK-NEXT:    mov w14, #654 // =0x28e
 ; CHECK-NEXT:    movi v0.2d, #0000000000000000
 ; CHECK-NEXT:    msub x9, x12, x9, x11
 ; CHECK-NEXT:    msub x10, x13, x14, x10
@@ -233,3 +233,198 @@ define <4 x i64> @dont_fold_urem_i64(<4 x i64> %x) {
   %1 = urem <4 x i64> %x, <i64 1, i64 654, i64 23, i64 5423>
   ret <4 x i64> %1
 }
+
+define <16 x i8> @fold_urem_v16i8(<16 x i8> %x) {
+; CHECK-LABEL: fold_urem_v16i8:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    movi v1.16b, #205
+; CHECK-NEXT:    umull2 v2.8h, v0.16b, v1.16b
+; CHECK-NEXT:    umull v1.8h, v0.8b, v1.8b
+; CHECK-NEXT:    uzp2 v1.16b, v1.16b, v2.16b
+; CHECK-NEXT:    movi v2.16b, #10
+; CHECK-NEXT:    ushr v1.16b, v1.16b, #3
+; CHECK-NEXT:    mls v0.16b, v1.16b, v2.16b
+; CHECK-NEXT:    ret
+  %1 = urem <16 x i8> %x, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
+  ret <16 x i8> %1
+}
+
+define <8 x i8> @fold_urem_v8i8(<8 x i8> %x) {
+; CHECK-LABEL: fold_urem_v8i8:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
+; CHECK-NEXT:    umov w8, v0.b[0]
+; CHECK-NEXT:    mov w9, #39322 // =0x999a
+; CHECK-NEXT:    movk w9, #6553, lsl #16
+; CHECK-NEXT:    umov w10, v0.b[1]
+; CHECK-NEXT:    mov w12, #10 // =0xa
+; CHECK-NEXT:    umov w13, v0.b[2]
+; CHECK-NEXT:    umull x11, w8, w9
+; CHECK-NEXT:    umull x14, w10, w9
+; CHECK-NEXT:    lsr x11, x11, #32
+; CHECK-NEXT:    umull x15, w13, w9
+; CHECK-NEXT:    lsr x14, x14, #32
+; CHECK-NEXT:    msub w8, w11, w12, w8
+; CHECK-NEXT:    umov w11, v0.b[3]
+; CHECK-NEXT:    msub w10, w14, w12, w10
+; CHECK-NEXT:    lsr x14, x15, #32
+; CHECK-NEXT:    msub w13, w14, w12, w13
+; CHECK-NEXT:    umov w14, v0.b[4]
+; CHECK-NEXT:    fmov s1, w8
+; CHECK-NEXT:    umull x8, w11, w9
+; CHECK-NEXT:    lsr x8, x8, #32
+; CHECK-NEXT:    mov v1.b[1], w10
+; CHECK-NEXT:    umull x10, w14, w9
+; CHECK-NEXT:    msub w8, w8, w12, w11
+; CHECK-NEXT:    umov w11, v0.b[5]
+; CHECK-NEXT:    lsr x10, x10, #32
+; CHECK-NEXT:    mov v1.b[2], w13
+; CHECK-NEXT:    msub w10, w10, w12, w14
+; CHECK-NEXT:    umov w13, v0.b[6]
+; CHECK-NEXT:    mov v1.b[3], w8
+; CHECK-NEXT:    umull x8, w11, w9
+; CHECK-NEXT:    lsr x8, x8, #32
+; CHECK-NEXT:    mov v1.b[4], w10
+; CHECK-NEXT:    umull x10, w13, w9
+; CHECK-NEXT:    msub w8, w8, w12, w11
+; CHECK-NEXT:    umov w11, v0.b[7]
+; CHECK-NEXT:    lsr x10, x10, #32
+; CHECK-NEXT:    msub w10, w10, w12, w13
+; CHECK-NEXT:    mov v1.b[5], w8
+; CHECK-NEXT:    umull x8, w11, w9
+; CHECK-NEXT:    lsr x8, x8, #32
+; CHECK-NEXT:    mov v1.b[6], w10
+; CHECK-NEXT:    msub w8, w8, w12, w11
+; CHECK-NEXT:    mov v1.b[7], w8
+; CHECK-NEXT:    fmov d0, d1
+; CHECK-NEXT:    ret
+  %1 = urem <8 x i8> %x, <i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10, i8 10>
+  ret <8 x i8> %1
+}
+
+define <8 x i16> @fold_urem_v8i16(<8 x i16> %x) {
+; CHECK-LABEL: fold_urem_v8i16:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    mov w8, #52429 // =0xcccd
+; CHECK-NEXT:    dup v1.8h, w8
+; CHECK-NEXT:    umull2 v2.4s, v0.8h, v1.8h
+; CHECK-NEXT:    umull v1.4s, v0.4h, v1.4h
+; CHECK-NEXT:    uzp2 v1.8h, v1.8h, v2.8h
+; CHECK-NEXT:    movi v2.8h, #10
+; CHECK-NEXT:    ushr v1.8h, v1.8h, #3
+; CHECK-NEXT:    mls v0.8h, v1.8h, v2.8h
+; CHECK-NEXT:    ret
+  %1 = urem <8 x i16> %x, <i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10, i16 10>
+  ret <8 x i16> %1
+}
+
+define <4 x i16> @fold_urem_v4i16(<4 x i16> %x) {
+; CHECK-LABEL: fold_urem_v4i16:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
+; CHECK-NEXT:    umov w8, v0.h[0]
+; CHECK-NEXT:    mov w9, #39322 // =0x999a
+; CHECK-NEXT:    movk w9, #6553, lsl #16
+; CHECK-NEXT:    umov w10, v0.h[1]
+; CHECK-NEXT:    mov w12, #10 // =0xa
+; CHECK-NEXT:    umov w13, v0.h[2]
+; CHECK-NEXT:    umull x11, w8, w9
+; CHECK-NEXT:    umull x14, w10, w9
+; CHECK-NEXT:    lsr x11, x11, #32
+; CHECK-NEXT:    msub w8, w11, w12, w8
+; CHECK-NEXT:    lsr x11, x14, #32
+; CHECK-NEXT:    umull x14, w13, w9
+; CHECK-NEXT:    msub w10, w11, w12, w10
+; CHECK-NEXT:    umov w11, v0.h[3]
+; CHECK-NEXT:    fmov s0, w8
+; CHECK-NEXT:    lsr x8, x14, #32
+; CHECK-NEXT:    msub w8, w8, w12, w13
+; CHECK-NEXT:    mov v0.h[1], w10
+; CHECK-NEXT:    umull x9, w11, w9
+; CHECK-NEXT:    lsr x9, x9, #32
+; CHECK-NEXT:    mov v0.h[2], w8
+; CHECK-NEXT:    msub w8, w9, w12, w11
+; CHECK-NEXT:    mov v0.h[3], w8
+; CHECK-NEXT:    // kill: def $d0 killed $d0 killed $q0
+; CHECK-NEXT:    ret
+  %1 = urem <4 x i16> %x, <i16 10, i16 10, i16 10, i16 10>
+  ret <4 x i16> %1
+}
+
+define <4 x i32> @fold_urem_v4i32(<4 x i32> %x) {
+; CHECK-LABEL: fold_urem_v4i32:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    mov w8, #52429 // =0xcccd
+; CHECK-NEXT:    movk w8, #52428, lsl #16
+; CHECK-NEXT:    dup v1.4s, w8
+; CHECK-NEXT:    umull2 v2.2d, v0.4s, v1.4s
+; CHECK-NEXT:    umull v1.2d, v0.2s, v1.2s
+; CHECK-NEXT:    uzp2 v1.4s, v1.4s, v2.4s
+; CHECK-NEXT:    movi v2.4s, #10
+; CHECK-NEXT:    ushr v1.4s, v1.4s, #3
+; CHECK-NEXT:    mls v0.4s, v1.4s, v2.4s
+; CHECK-NEXT:    ret
+  %1 = urem <4 x i32> %x, <i32 10, i32 10, i32 10, i32 10>
+  ret <4 x i32> %1
+}
+
+define <2 x i32> @fold_urem_v2i32(<2 x i32> %x) {
+; CHECK-LABEL: fold_urem_v2i32:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
+; CHECK-NEXT:    mov w8, #52429 // =0xcccd
+; CHECK-NEXT:    fmov w9, s0
+; CHECK-NEXT:    movk w8, #52428, lsl #16
+; CHECK-NEXT:    mov w10, v0.s[1]
+; CHECK-NEXT:    mov w12, #10 // =0xa
+; CHECK-NEXT:    umull x11, w9, w8
+; CHECK-NEXT:    lsr x11, x11, #35
+; CHECK-NEXT:    umull x8, w10, w8
+; CHECK-NEXT:    msub w9, w11, w12, w9
+; CHECK-NEXT:    lsr x8, x8, #35
+; CHECK-NEXT:    msub w8, w8, w12, w10
+; CHECK-NEXT:    fmov s0, w9
+; CHECK-NEXT:    mov v0.s[1], w8
+; CHECK-NEXT:    // kill: def $d0 killed $d0 killed $q0
+; CHECK-NEXT:    ret
+  %1 = urem <2 x i32> %x, <i32 10, i32 10>
+  ret <2 x i32> %1
+}
+
+define <2 x i64> @fold_urem_v2i64(<2 x i64> %x) {
+; CHECK-LABEL: fold_urem_v2i64:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    mov x8, #-3689348814741910324 // =0xcccccccccccccccc
+; CHECK-NEXT:    fmov x9, d0
+; CHECK-NEXT:    movk x8, #52429
+; CHECK-NEXT:    mov w12, #10 // =0xa
+; CHECK-NEXT:    mov x10, v0.d[1]
+; CHECK-NEXT:    umulh x11, x9, x8
+; CHECK-NEXT:    lsr x11, x11, #3
+; CHECK-NEXT:    umulh x8, x10, x8
+; CHECK-NEXT:    msub x9, x11, x12, x9
+; CHECK-NEXT:    lsr x8, x8, #3
+; CHECK-NEXT:    msub x8, x8, x12, x10
+; CHECK-NEXT:    fmov d0, x9
+; CHECK-NEXT:    mov v0.d[1], x8
+; CHECK-NEXT:    ret
+  %1 = urem <2 x i64> %x, <i64 10, i64 10>
+  ret <2 x i64> %1
+}
+
+define <1 x i64> @fold_urem_v1i64(<1 x i64> %x) {
+; CHECK-LABEL: fold_urem_v1i64:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    // kill: def $d0 killed $d0 def $q0
+; CHECK-NEXT:    mov x8, #-3689348814741910324 // =0xcccccccccccccccc
+; CHECK-NEXT:    fmov x9, d0
+; CHECK-NEXT:    movk x8, #52429
+; CHECK-NEXT:    mov w10, #10 // =0xa
+; CHECK-NEXT:    umulh x8, x9, x8
+; CHECK-NEXT:    lsr x8, x8, #3
+; CHECK-NEXT:    msub x8, x8, x10, x9
+; CHECK-NEXT:    fmov d0, x8
+; CHECK-NEXT:    ret
+  %1 = urem <1 x i64> %x, <i64 10>
+  ret <1 x i64> %1
+}