[llvm] [AArch64] Fold setm with eor even if it is fcmp (PR #184445)

Wed Mar 4 07:09:39 PST 2026

https://github.com/SiliconA-Z updated https://github.com/llvm/llvm-project/pull/184445

>From b62235a185e755568e91cb08e7e3edae6e250126 Mon Sep 17 00:00:00 2001
From: AZero13 <gfunni234 at gmail.com>
Date: Tue, 3 Mar 2026 17:09:07 -0500
Subject: [PATCH 1/2] Pre-commit test (NFC)

---
 llvm/test/CodeGen/AArch64/xor-fp-csinv.ll | 74 +++++++++++++++++++++++
 1 file changed, 74 insertions(+)
 create mode 100644 llvm/test/CodeGen/AArch64/xor-fp-csinv.ll

diff --git a/llvm/test/CodeGen/AArch64/xor-fp-csinv.ll b/llvm/test/CodeGen/AArch64/xor-fp-csinv.ll
new file mode 100644
index 0000000000000..4e28463c6d5d9
--- /dev/null
+++ b/llvm/test/CodeGen/AArch64/xor-fp-csinv.ll
@@ -0,0 +1,74 @@
+; NOTE: Assertions have been autogenerated by utils/update_llc_test_checks.py
+; RUN: llc < %s -mtriple=aarch64 | FileCheck %s
+
+; Test that (xor x, (select_cc fp_a, fp_b, cc, 0, -1)) folds to CSINV
+; with an FCMP instead of falling back to CSETM + EOR.
+
+define i32 @xor_fp_ogt_f32(float %a, float %b, i32 %x) {
+; CHECK-LABEL: xor_fp_ogt_f32:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    fcmp s0, s1
+; CHECK-NEXT:    csetm w8, gt
+; CHECK-NEXT:    eor w0, w0, w8
+; CHECK-NEXT:    ret
+  %cmp = fcmp ogt float %a, %b
+  %mask = sext i1 %cmp to i32
+  %result = xor i32 %x, %mask
+  ret i32 %result
+}
+
+define i32 @xor_fp_olt_f64(double %a, double %b, i32 %x) {
+; CHECK-LABEL: xor_fp_olt_f64:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    fcmp d0, d1
+; CHECK-NEXT:    csetm w8, mi
+; CHECK-NEXT:    eor w0, w0, w8
+; CHECK-NEXT:    ret
+  %cmp = fcmp olt double %a, %b
+  %mask = sext i1 %cmp to i32
+  %result = xor i32 %x, %mask
+  ret i32 %result
+}
+
+; Inverted pattern: TVal=-1, FVal=0 (should still fold via CC inversion)
+define i32 @xor_fp_ole_f32_inverted(float %a, float %b, i32 %x) {
+; CHECK-LABEL: xor_fp_ole_f32_inverted:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    fcmp s0, s1
+; CHECK-NEXT:    csetm w8, ls
+; CHECK-NEXT:    eor w0, w0, w8
+; CHECK-NEXT:    ret
+  %cmp = fcmp ole float %a, %b
+  %mask = sext i1 %cmp to i32
+  %result = xor i32 %x, %mask
+  ret i32 %result
+}
+
+; 64-bit integer result
+define i64 @xor_fp_oge_f32_i64(float %a, float %b, i64 %x) {
+; CHECK-LABEL: xor_fp_oge_f32_i64:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    fcmp s0, s1
+; CHECK-NEXT:    csetm x8, ge
+; CHECK-NEXT:    eor x0, x0, x8
+; CHECK-NEXT:    ret
+  %cmp = fcmp oge float %a, %b
+  %mask = sext i1 %cmp to i64
+  %result = xor i64 %x, %mask
+  ret i64 %result
+}
+
+; Dual-CC condition (SETONE) — should NOT fold to CSINV (bails out)
+define i32 @xor_fp_one_f32(float %a, float %b, i32 %x) {
+; CHECK-LABEL: xor_fp_one_f32:
+; CHECK:       // %bb.0:
+; CHECK-NEXT:    fcmp s0, s1
+; CHECK-NEXT:    csetm w8, mi
+; CHECK-NEXT:    csinv w8, w8, wzr, le
+; CHECK-NEXT:    eor w0, w0, w8
+; CHECK-NEXT:    ret
+  %cmp = fcmp one float %a, %b
+  %mask = sext i1 %cmp to i32
+  %result = xor i32 %x, %mask
+  ret i32 %result
+}

>From c6e54bce6d47e2b589b8c4da97cdb29875b99be5 Mon Sep 17 00:00:00 2001
From: AZero13 <gfunni234 at gmail.com>
Date: Tue, 3 Mar 2026 17:11:11 -0500
Subject: [PATCH 2/2] fold setm with eor even if it is fcmp

---
 llvm/lib/Target/AArch64/AArch64ISelLowering.cpp | 17 ++++++++++++++---
 llvm/test/CodeGen/AArch64/xor-fp-csinv.ll       | 12 ++++--------
 2 files changed, 18 insertions(+), 11 deletions(-)

diff --git a/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp b/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp
index 0201d45010195..69e3b9deab8c9 100644
--- a/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp
+++ b/llvm/lib/Target/AArch64/AArch64ISelLowering.cpp
@@ -4566,8 +4566,9 @@ SDValue AArch64TargetLowering::LowerXOR(SDValue Op, SelectionDAG &DAG) const {
   SDValue TVal = Sel.getOperand(2);
   SDValue FVal = Sel.getOperand(3);
 
-  // FIXME: This could be generalized to non-integer comparisons.
-  if (LHS.getValueType() != MVT::i32 && LHS.getValueType() != MVT::i64)
+  EVT CmpVT = LHS.getValueType();
+  if (CmpVT != MVT::i32 && CmpVT != MVT::i64 && CmpVT != MVT::f16 &&
+      CmpVT != MVT::bf16 && CmpVT != MVT::f32 && CmpVT != MVT::f64)
     return Op;
 
   ConstantSDNode *CFVal = dyn_cast<ConstantSDNode>(FVal);
@@ -4588,7 +4589,17 @@ SDValue AArch64TargetLowering::LowerXOR(SDValue Op, SelectionDAG &DAG) const {
   // If the constants line up, perform the transform!
   if (CTVal->isZero() && CFVal->isAllOnes()) {
     SDValue CCVal;
-    SDValue Cmp = getAArch64Cmp(LHS, RHS, CC, CCVal, DAG, DL);
+    SDValue Cmp;
+    if (CmpVT.isInteger()) {
+      Cmp = getAArch64Cmp(LHS, RHS, CC, CCVal, DAG, DL);
+    } else {
+      AArch64CC::CondCode CC1, CC2;
+      changeFPCCToAArch64CC(CC, CC1, CC2);
+      if (CC2 != AArch64CC::AL)
+        return Op; // Bail out for conditions needing two CCs (e.g. SETONE)
+      Cmp = emitComparison(LHS, RHS, CC, DL, DAG);
+      CCVal = getCondCode(DAG, CC1);
+    }
 
     FVal = Other;
     TVal = DAG.getNode(ISD::XOR, DL, Other.getValueType(), Other,
diff --git a/llvm/test/CodeGen/AArch64/xor-fp-csinv.ll b/llvm/test/CodeGen/AArch64/xor-fp-csinv.ll
index 4e28463c6d5d9..84aed5b0350ba 100644
--- a/llvm/test/CodeGen/AArch64/xor-fp-csinv.ll
+++ b/llvm/test/CodeGen/AArch64/xor-fp-csinv.ll
@@ -8,8 +8,7 @@ define i32 @xor_fp_ogt_f32(float %a, float %b, i32 %x) {
 ; CHECK-LABEL: xor_fp_ogt_f32:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    fcmp s0, s1
-; CHECK-NEXT:    csetm w8, gt
-; CHECK-NEXT:    eor w0, w0, w8
+; CHECK-NEXT:    cinv w0, w0, gt
 ; CHECK-NEXT:    ret
   %cmp = fcmp ogt float %a, %b
   %mask = sext i1 %cmp to i32
@@ -21,8 +20,7 @@ define i32 @xor_fp_olt_f64(double %a, double %b, i32 %x) {
 ; CHECK-LABEL: xor_fp_olt_f64:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    fcmp d0, d1
-; CHECK-NEXT:    csetm w8, mi
-; CHECK-NEXT:    eor w0, w0, w8
+; CHECK-NEXT:    cinv w0, w0, mi
 ; CHECK-NEXT:    ret
   %cmp = fcmp olt double %a, %b
   %mask = sext i1 %cmp to i32
@@ -35,8 +33,7 @@ define i32 @xor_fp_ole_f32_inverted(float %a, float %b, i32 %x) {
 ; CHECK-LABEL: xor_fp_ole_f32_inverted:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    fcmp s0, s1
-; CHECK-NEXT:    csetm w8, ls
-; CHECK-NEXT:    eor w0, w0, w8
+; CHECK-NEXT:    cinv w0, w0, ls
 ; CHECK-NEXT:    ret
   %cmp = fcmp ole float %a, %b
   %mask = sext i1 %cmp to i32
@@ -49,8 +46,7 @@ define i64 @xor_fp_oge_f32_i64(float %a, float %b, i64 %x) {
 ; CHECK-LABEL: xor_fp_oge_f32_i64:
 ; CHECK:       // %bb.0:
 ; CHECK-NEXT:    fcmp s0, s1
-; CHECK-NEXT:    csetm x8, ge
-; CHECK-NEXT:    eor x0, x0, x8
+; CHECK-NEXT:    cinv x0, x0, ge
 ; CHECK-NEXT:    ret
   %cmp = fcmp oge float %a, %b
   %mask = sext i1 %cmp to i64