[llvm] 6f4773f - [RISCV] Add codegen coverage for get.active.lane.mask

Wed Jul 6 14:50:58 PDT 2022

Author: Philip Reames
Date: 2022-07-06T14:50:41-07:00
New Revision: 6f4773f06428d16cb4716e9d1ba590d8c2ff7596

URL: https://github.com/llvm/llvm-project/commit/6f4773f06428d16cb4716e9d1ba590d8c2ff7596
DIFF: https://github.com/llvm/llvm-project/commit/6f4773f06428d16cb4716e9d1ba590d8c2ff7596.diff

LOG: [RISCV] Add codegen coverage for get.active.lane.mask

Added: 
    llvm/test/CodeGen/RISCV/rvv/active_lane_mask.ll

Modified: 
    

Removed: 
    


################################################################################
diff  --git a/llvm/test/CodeGen/RISCV/rvv/active_lane_mask.ll b/llvm/test/CodeGen/RISCV/rvv/active_lane_mask.ll
new file mode 100644
index 0000000000000..fd96785e1e614

--- /dev/null
+++ b/llvm/test/CodeGen/RISCV/rvv/active_lane_mask.ll
@@ -0,0 +1,221 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc -mtriple=riscv64 -mattr=+m,+v -riscv-v-vector-bits-min=128  -verify-machineinstrs < %s | FileCheck %s --check-prefixes=CHECK
+
+define <vscale x 1 x i1> @get_lane_mask(ptr %p, i64 %index, i64 %tc) {
+; CHECK-LABEL: get_lane_mask:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsetvli a0, zero, e64, m1, ta, mu
+; CHECK-NEXT:    vid.v v8
+; CHECK-NEXT:    vsaddu.vx v8, v8, a1
+; CHECK-NEXT:    vmsltu.vx v0, v8, a2
+; CHECK-NEXT:    ret
+  %mask = call <vscale x 1 x i1> @llvm.get.active.lane.mask.nxv1i1.i64(i64 %index, i64 %tc)
+  ret <vscale x 1 x i1> %mask
+}
+
+define <vscale x 1 x i1> @constant_zero_index(ptr %p, i64 %tc) {
+; CHECK-LABEL: constant_zero_index:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsetvli a0, zero, e64, m1, ta, mu
+; CHECK-NEXT:    vid.v v8
+; CHECK-NEXT:    vmsltu.vx v0, v8, a1
+; CHECK-NEXT:    ret
+  %mask = call <vscale x 1 x i1> @llvm.get.active.lane.mask.nxv1i1.i64(i64 0, i64 %tc)
+  ret <vscale x 1 x i1> %mask
+}
+
+define <vscale x 1 x i1> @constant_nonzero_index(ptr %p, i64 %tc) {
+; CHECK-LABEL: constant_nonzero_index:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsetvli a0, zero, e64, m1, ta, mu
+; CHECK-NEXT:    vid.v v8
+; CHECK-NEXT:    li a0, 24
+; CHECK-NEXT:    vsaddu.vx v8, v8, a0
+; CHECK-NEXT:    vmsltu.vx v0, v8, a1
+; CHECK-NEXT:    ret
+  %mask = call <vscale x 1 x i1> @llvm.get.active.lane.mask.nxv1i1.i64(i64 24, i64 %tc)
+  ret <vscale x 1 x i1> %mask
+}
+
+define <vscale x 1 x i1> @constant_tripcount(ptr %p, i64 %index) {
+; CHECK-LABEL: constant_tripcount:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsetvli a0, zero, e64, m1, ta, mu
+; CHECK-NEXT:    vid.v v8
+; CHECK-NEXT:    vsaddu.vx v8, v8, a1
+; CHECK-NEXT:    li a0, 1024
+; CHECK-NEXT:    vmsltu.vx v0, v8, a0
+; CHECK-NEXT:    ret
+  %mask = call <vscale x 1 x i1> @llvm.get.active.lane.mask.nxv1i1.i64(i64 %index, i64 1024)
+  ret <vscale x 1 x i1> %mask
+}
+
+define <vscale x 1 x i1> @constant_both(ptr %p) {
+; CHECK-LABEL: constant_both:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsetvli a0, zero, e64, m1, ta, mu
+; CHECK-NEXT:    vid.v v8
+; CHECK-NEXT:    li a0, 1024
+; CHECK-NEXT:    vmsltu.vx v0, v8, a0
+; CHECK-NEXT:    ret
+  %mask = call <vscale x 1 x i1> @llvm.get.active.lane.mask.nxv1i1.i64(i64 0, i64 1024)
+  ret <vscale x 1 x i1> %mask
+}
+
+; Architectural max VLEN=64k, so result is "as-if" TC=1024
+define <vscale x 1 x i1> @above_maxvl(ptr %p) {
+; CHECK-LABEL: above_maxvl:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsetvli a0, zero, e64, m1, ta, mu
+; CHECK-NEXT:    vid.v v8
+; CHECK-NEXT:    lui a0, 1
+; CHECK-NEXT:    addiw a0, a0, -2048
+; CHECK-NEXT:    vmsltu.vx v0, v8, a0
+; CHECK-NEXT:    ret
+  %mask = call <vscale x 1 x i1> @llvm.get.active.lane.mask.nxv1i1.i64(i64 0, i64 2048)
+  ret <vscale x 1 x i1> %mask
+}
+
+define <8 x i1> @fv8(ptr %p, i64 %index, i64 %tc) {
+; CHECK-LABEL: fv8:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsetivli zero, 8, e64, m4, ta, mu
+; CHECK-NEXT:    vmv.v.x v8, a1
+; CHECK-NEXT:    vid.v v12
+; CHECK-NEXT:    vsaddu.vv v8, v8, v12
+; CHECK-NEXT:    vmsltu.vx v0, v8, a2
+; CHECK-NEXT:    ret
+  %mask = call <8 x i1> @llvm.get.active.lane.mask.v8i1.i64(i64 %index, i64 %tc)
+  ret <8 x i1> %mask
+}
+
+define <32 x i1> @fv32(ptr %p, i64 %index, i64 %tc) {
+; CHECK-LABEL: fv32:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    lui a0, %hi(.LCPI7_0)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI7_0)
+; CHECK-NEXT:    vle64.v v8, (a0)
+; CHECK-NEXT:    vmv.v.x v16, a1
+; CHECK-NEXT:    vsaddu.vv v8, v16, v8
+; CHECK-NEXT:    vmsltu.vx v24, v8, a2
+; CHECK-NEXT:    vid.v v8
+; CHECK-NEXT:    vsaddu.vv v8, v16, v8
+; CHECK-NEXT:    vmsltu.vx v0, v8, a2
+; CHECK-NEXT:    vsetivli zero, 4, e8, mf4, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v24, 2
+; CHECK-NEXT:    ret
+  %mask = call <32 x i1> @llvm.get.active.lane.mask.v32i1.i64(i64 %index, i64 %tc)
+  ret <32 x i1> %mask
+}
+
+define <64 x i1> @fv64(ptr %p, i64 %index, i64 %tc) {
+; CHECK-LABEL: fv64:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    lui a0, %hi(.LCPI8_0)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI8_0)
+; CHECK-NEXT:    vle64.v v16, (a0)
+; CHECK-NEXT:    vmv.v.x v8, a1
+; CHECK-NEXT:    vsaddu.vv v16, v8, v16
+; CHECK-NEXT:    vmsltu.vx v24, v16, a2
+; CHECK-NEXT:    vid.v v16
+; CHECK-NEXT:    vsaddu.vv v16, v8, v16
+; CHECK-NEXT:    vmsltu.vx v0, v16, a2
+; CHECK-NEXT:    vsetivli zero, 4, e8, mf2, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v24, 2
+; CHECK-NEXT:    lui a0, %hi(.LCPI8_1)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI8_1)
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    vle64.v v16, (a0)
+; CHECK-NEXT:    vsaddu.vv v16, v8, v16
+; CHECK-NEXT:    vmsltu.vx v24, v16, a2
+; CHECK-NEXT:    vsetivli zero, 6, e8, mf2, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v24, 4
+; CHECK-NEXT:    lui a0, %hi(.LCPI8_2)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI8_2)
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    vle64.v v16, (a0)
+; CHECK-NEXT:    vsaddu.vv v8, v8, v16
+; CHECK-NEXT:    vmsltu.vx v16, v8, a2
+; CHECK-NEXT:    vsetivli zero, 8, e8, mf2, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v16, 6
+; CHECK-NEXT:    ret
+  %mask = call <64 x i1> @llvm.get.active.lane.mask.v64i1.i64(i64 %index, i64 %tc)
+  ret <64 x i1> %mask
+}
+
+define <128 x i1> @fv128(ptr %p, i64 %index, i64 %tc) {
+; CHECK-LABEL: fv128:
+; CHECK:       # %bb.0:
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    lui a0, %hi(.LCPI9_0)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI9_0)
+; CHECK-NEXT:    vle64.v v16, (a0)
+; CHECK-NEXT:    vmv.v.x v8, a1
+; CHECK-NEXT:    vsaddu.vv v16, v8, v16
+; CHECK-NEXT:    vmsltu.vx v24, v16, a2
+; CHECK-NEXT:    vid.v v16
+; CHECK-NEXT:    vsaddu.vv v16, v8, v16
+; CHECK-NEXT:    vmsltu.vx v0, v16, a2
+; CHECK-NEXT:    vsetivli zero, 4, e8, m1, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v24, 2
+; CHECK-NEXT:    lui a0, %hi(.LCPI9_1)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI9_1)
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    vle64.v v16, (a0)
+; CHECK-NEXT:    vsaddu.vv v16, v8, v16
+; CHECK-NEXT:    vmsltu.vx v24, v16, a2
+; CHECK-NEXT:    vsetivli zero, 6, e8, m1, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v24, 4
+; CHECK-NEXT:    lui a0, %hi(.LCPI9_2)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI9_2)
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    vle64.v v16, (a0)
+; CHECK-NEXT:    vsaddu.vv v16, v8, v16
+; CHECK-NEXT:    vmsltu.vx v24, v16, a2
+; CHECK-NEXT:    vsetivli zero, 8, e8, m1, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v24, 6
+; CHECK-NEXT:    lui a0, %hi(.LCPI9_3)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI9_3)
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    vle64.v v16, (a0)
+; CHECK-NEXT:    vsaddu.vv v16, v8, v16
+; CHECK-NEXT:    vmsltu.vx v24, v16, a2
+; CHECK-NEXT:    vsetivli zero, 10, e8, m1, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v24, 8
+; CHECK-NEXT:    lui a0, %hi(.LCPI9_4)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI9_4)
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    vle64.v v16, (a0)
+; CHECK-NEXT:    vsaddu.vv v16, v8, v16
+; CHECK-NEXT:    vmsltu.vx v24, v16, a2
+; CHECK-NEXT:    vsetivli zero, 12, e8, m1, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v24, 10
+; CHECK-NEXT:    lui a0, %hi(.LCPI9_5)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI9_5)
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    vle64.v v16, (a0)
+; CHECK-NEXT:    vsaddu.vv v16, v8, v16
+; CHECK-NEXT:    vmsltu.vx v24, v16, a2
+; CHECK-NEXT:    vsetivli zero, 14, e8, m1, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v24, 12
+; CHECK-NEXT:    lui a0, %hi(.LCPI9_6)
+; CHECK-NEXT:    addi a0, a0, %lo(.LCPI9_6)
+; CHECK-NEXT:    vsetivli zero, 16, e64, m8, ta, mu
+; CHECK-NEXT:    vle64.v v16, (a0)
+; CHECK-NEXT:    vsaddu.vv v8, v8, v16
+; CHECK-NEXT:    vmsltu.vx v16, v8, a2
+; CHECK-NEXT:    vsetvli zero, zero, e8, m1, tu, mu
+; CHECK-NEXT:    vslideup.vi v0, v16, 14
+; CHECK-NEXT:    ret
+  %mask = call <128 x i1> @llvm.get.active.lane.mask.v128i1.i64(i64 %index, i64 %tc)
+  ret <128 x i1> %mask
+}
+
+
+declare <vscale x 1 x i1> @llvm.get.active.lane.mask.nxv1i1.i64(i64, i64)
+declare <8 x i1> @llvm.get.active.lane.mask.v8i1.i64(i64, i64)
+declare <32 x i1> @llvm.get.active.lane.mask.v32i1.i64(i64, i64)
+declare <64 x i1> @llvm.get.active.lane.mask.v64i1.i64(i64, i64)
+declare <128 x i1> @llvm.get.active.lane.mask.v128i1.i64(i64, i64)