[llvm] r323690 - [X86] Avoid using high register trick for test instruction

Wed Jan 31 02:54:15 PST 2018

Thanks,

Sorry for the inconvenience.

Amaury Séchet

2018-01-30 15:16 GMT+01:00 Eric Liu <ioeric at google.com>:

> Hi Amaury,
>
> I am seeing crash in llc caused by this commit. A repro is attached.
> Please run llc (with assertion on) to reproduce the crash. I'll revert the
> commit for now. Let me know if you need more information from me.
>
> ```
> ./bin/llc repro.ll
> /home/ioeric/llvm/lib/CodeGen/SelectionDAG/InstrEmitter.cpp:469: unsigned
> int llvm::InstrEmitter::ConstrainForSubReg(unsigned int, unsigned int,
> llvm::MVT, const llvm::DebugLoc &): Assertion `RC && "No legal register
> class for VT supports that SubIdx"' failed.
> #0 0x0000000002fc9134 PrintStackTraceSignalHandler(void*)
> (./bin/llc+0x2fc9134)
> #1 0x0000000002fc9496 SignalHandler(int) (./bin/llc+0x2fc9496)
> #2 0x00007fa2af1690c0 __restore_rt (/lib/x86_64-linux-gnu/
> libpthread.so.0+0x110c0)
> #3 0x00007fa2adcfefcf gsignal (/lib/x86_64-linux-gnu/libc.so.6+0x32fcf)
> #4 0x00007fa2add003fa abort (/lib/x86_64-linux-gnu/libc.so.6+0x343fa)
> #5 0x00007fa2adcf7e37 (/lib/x86_64-linux-gnu/libc.so.6+0x2be37)
> #6 0x00007fa2adcf7ee2 (/lib/x86_64-linux-gnu/libc.so.6+0x2bee2)
> #7 0x0000000002dc3883 llvm::InstrEmitter::ConstrainForSubReg(unsigned
> int, unsigned int, llvm::MVT, llvm::DebugLoc const&) (./bin/llc+0x2dc3883)
> #8 0x0000000002dc3ebe llvm::InstrEmitter::EmitSubregNode(llvm::SDNode*,
> llvm::DenseMap<llvm::SDValue, unsigned int, llvm::DenseMapInfo<llvm::SDValue>,
> llvm::detail::DenseMapPair<llvm::SDValue, unsigned int> >&, bool, bool)
> (./bin/llc+0x2dc3ebe)
> #9 0x0000000002dd7c29 llvm::ScheduleDAGSDNodes::EmitSchedule(llvm::
> MachineInstrBundleIterator<llvm::MachineInstr, false>&)
> (./bin/llc+0x2dd7c29)
> #10 0x0000000002e81fe2 llvm::SelectionDAGISel::CodeGenAndEmitDAG()
> (./bin/llc+0x2e81fe2)
> #11 0x0000000002e7ecd8 llvm::SelectionDAGISel::SelectAllBasicBlocks(llvm::Function
> const&) (./bin/llc+0x2e7ecd8)
> #12 0x0000000002e7adc4 llvm::SelectionDAGISel::runOnMachineFunction(llvm::MachineFunction&)
> (./bin/llc+0x2e7adc4)
> #13 0x00000000022f69b1 (anonymous namespace)::X86DAGToDAGISel::
> runOnMachineFunction(llvm::MachineFunction&) (./bin/llc+0x22f69b1)
> #14 0x000000000268b5e8 llvm::MachineFunctionPass::runOnFunction(llvm::Function&)
> (./bin/llc+0x268b5e8)
> #15 0x00000000029a775f llvm::FPPassManager::runOnFunction(llvm::Function&)
> (./bin/llc+0x29a775f)
> #16 0x00000000029a7a23 llvm::FPPassManager::runOnModule(llvm::Module&)
> (./bin/llc+0x29a7a23)
> #17 0x00000000029a7f49 llvm::legacy::PassManagerImpl::run(llvm::Module&)
> (./bin/llc+0x29a7f49)
> #18 0x00000000017f18d1 compileModule(char**, llvm::LLVMContext&)
> (./bin/llc+0x17f18d1)
> #19 0x00000000017ef0eb main (./bin/llc+0x17ef0eb)
> #20 0x00007fa2adcec2b1 __libc_start_main (/lib/x86_64-linux-gnu/libc.
> so.6+0x202b1)
> #21 0x00000000017ee02a _start (./bin/llc+0x17ee02a)
> Stack dump:
> 0.      Program arguments: ./bin/llc repro.ll
> 1.      Running pass 'Function Pass Manager' on module 'repro.ll'.
> 2.      Running pass 'X86 DAG->DAG Instruction Selection' on function
> '@str_copy'
> Aborted
> ```
>
> Regards,
> Eric
>
> On Mon, Jan 29, 2018 at 9:56 PM Amaury Sechet via llvm-commits <
> llvm-commits at lists.llvm.org> wrote:
>
>> Author: deadalnix
>> Date: Mon Jan 29 12:54:33 2018
>> New Revision: 323690
>>
>> URL: http://llvm.org/viewvc/llvm-project?rev=323690&view=rev
>> Log:
>> [X86] Avoid using high register trick for test instruction
>>
>> Summary:
>> It seems it's main effect is to create addition copies when values are
>> inr register that do not support this trick, which increase register
>> pressure and makes the code bigger.
>>
>> The main noteworthy regression I was able to observe was pattern of the
>> type (setcc (trunc (and X, C)), 0) where C is such as it would benefit from
>> the hi register trick. To prevent this, a new pattern is added to
>> materialize such pattern using a 32 bits test. This has the added benefit
>> of working with any constant that is materializable as a 32bits immediate,
>> not just the ones that can leverage the high register trick, as
>> demonstrated by the test case in test-shrink.ll using the constant 2049 .
>>
>> Reviewers: craig.topper, niravd, spatel, hfinkel
>>
>> Subscribers: llvm-commits
>>
>> Differential Revision: https://reviews.llvm.org/D42646
>>
>> Modified:
>>     llvm/trunk/lib/Target/X86/X86ISelDAGToDAG.cpp
>>     llvm/trunk/lib/Target/X86/X86InstrArithmetic.td
>>     llvm/trunk/lib/Target/X86/X86InstrInfo.cpp
>>     llvm/trunk/lib/Target/X86/X86MacroFusion.cpp
>>     llvm/trunk/test/CodeGen/X86/test-shrink.ll
>>     llvm/trunk/test/CodeGen/X86/testb-je-fusion.ll
>>     llvm/trunk/test/CodeGen/X86/vastart-defs-eflags.ll
>>
>> Modified: llvm/trunk/lib/Target/X86/X86ISelDAGToDAG.cpp
>> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/
>> X86/X86ISelDAGToDAG.cpp?rev=323690&r1=323689&r2=323690&view=diff
>> ============================================================
>> ==================
>> --- llvm/trunk/lib/Target/X86/X86ISelDAGToDAG.cpp (original)
>> +++ llvm/trunk/lib/Target/X86/X86ISelDAGToDAG.cpp Mon Jan 29 12:54:33
>> 2018
>> @@ -3073,67 +3073,33 @@ void X86DAGToDAGISel::Select(SDNode *Nod
>>          return;
>>        }
>>
>> -      // For example, "testl %eax, $2048" to "testb %ah, $8".
>> -      if (isShiftedUInt<8, 8>(Mask) &&
>> -          (!(Mask & 0x8000) || hasNoSignedComparisonUses(Node))) {
>> -        // Shift the immediate right by 8 bits.
>> -        SDValue ShiftedImm = CurDAG->getTargetConstant(Mask >> 8, dl,
>> MVT::i8);
>> -        SDValue Reg = N0.getOperand(0);
>> -
>> -        // Extract the h-register.
>> -        SDValue Subreg = CurDAG->getTargetExtractSubreg(X86::sub_8bit_hi,
>> dl,
>> -                                                        MVT::i8, Reg);
>> -
>> -        // Emit a testb.  The EXTRACT_SUBREG becomes a COPY that can only
>> -        // target GR8_NOREX registers, so make sure the register class is
>> -        // forced.
>> -        SDNode *NewNode = CurDAG->getMachineNode(X86::TEST8ri_NOREX, dl,
>> -                                                 MVT::i32, Subreg,
>> ShiftedImm);
>> -        // Replace SUB|CMP with TEST, since SUB has two outputs while
>> TEST has
>> -        // one, do not call ReplaceAllUsesWith.
>> -        ReplaceUses(SDValue(Node, (Opcode == X86ISD::SUB ? 1 : 0)),
>> -                    SDValue(NewNode, 0));
>> -        CurDAG->RemoveDeadNode(Node);
>> -        return;
>> -      }
>> -
>> -      // For example, "testl %eax, $32776" to "testw %ax, $32776".
>> -      // NOTE: We only want to form TESTW instructions if optimizing for
>> -      // min size. Otherwise we only save one byte and possibly get a
>> length
>> -      // changing prefix penalty in the decoders.
>> -      if (OptForMinSize && isUInt<16>(Mask) && N0.getValueType() !=
>> MVT::i16 &&
>> -          (!(Mask & 0x8000) || hasNoSignedComparisonUses(Node))) {
>> -        SDValue Imm = CurDAG->getTargetConstant(Mask, dl, MVT::i16);
>> -        SDValue Reg = N0.getOperand(0);
>> -
>> -        // Extract the 16-bit subregister.
>> -        SDValue Subreg = CurDAG->getTargetExtractSubreg(X86::sub_16bit,
>> dl,
>> -                                                        MVT::i16, Reg);
>> -
>> -        // Emit a testw.
>> -        SDNode *NewNode = CurDAG->getMachineNode(X86::TEST16ri, dl,
>> MVT::i32,
>> -                                                 Subreg, Imm);
>> -        // Replace SUB|CMP with TEST, since SUB has two outputs while
>> TEST has
>> -        // one, do not call ReplaceAllUsesWith.
>> -        ReplaceUses(SDValue(Node, (Opcode == X86ISD::SUB ? 1 : 0)),
>> -                    SDValue(NewNode, 0));
>> -        CurDAG->RemoveDeadNode(Node);
>> -        return;
>> -      }
>> -
>>        // For example, "testq %rax, $268468232" to "testl %eax,
>> $268468232".
>> -      if (isUInt<32>(Mask) && N0.getValueType() == MVT::i64 &&
>> +      if (isUInt<32>(Mask) &&
>>            (!(Mask & 0x80000000) || hasNoSignedComparisonUses(Node))) {
>> -        SDValue Imm = CurDAG->getTargetConstant(Mask, dl, MVT::i32);
>> +        MVT VT = MVT::i32;
>> +        int SubRegOp = X86::sub_32bit;
>> +        unsigned Op = X86::TEST32ri;
>> +
>> +        // For example, "testl %eax, $32776" to "testw %ax, $32776".
>> +        // NOTE: We only want to form TESTW instructions if optimizing
>> for
>> +        // min size. Otherwise we only save one byte and possibly get a
>> length
>> +        // changing prefix penalty in the decoders.
>> +        if (OptForMinSize && isUInt<16>(Mask) &&
>> +            (!(Mask & 0x8000) || hasNoSignedComparisonUses(Node))) {
>> +          VT = MVT::i16;
>> +          SubRegOp = X86::sub_16bit;
>> +          Op = X86::TEST16ri;
>> +        }
>> +
>> +        SDValue Imm = CurDAG->getTargetConstant(Mask, dl, VT);
>>          SDValue Reg = N0.getOperand(0);
>>
>> -        // Extract the 32-bit subregister.
>> -        SDValue Subreg = CurDAG->getTargetExtractSubreg(X86::sub_32bit,
>> dl,
>> -                                                        MVT::i32, Reg);
>> +        // Extract the subregister if necessary.
>> +        if (N0.getValueType() != VT)
>> +          Reg = CurDAG->getTargetExtractSubreg(SubRegOp, dl, VT, Reg);
>>
>> -        // Emit a testl.
>> -        SDNode *NewNode = CurDAG->getMachineNode(X86::TEST32ri, dl,
>> MVT::i32,
>> -                                                 Subreg, Imm);
>> +        // Emit a testl or testw.
>> +        SDNode *NewNode = CurDAG->getMachineNode(Op, dl, MVT::i32, Reg,
>> Imm);
>>          // Replace SUB|CMP with TEST, since SUB has two outputs while
>> TEST has
>>          // one, do not call ReplaceAllUsesWith.
>>          ReplaceUses(SDValue(Node, (Opcode == X86ISD::SUB ? 1 : 0)),
>>
>> Modified: llvm/trunk/lib/Target/X86/X86InstrArithmetic.td
>> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/
>> X86/X86InstrArithmetic.td?rev=323690&r1=323689&r2=323690&view=diff
>> ============================================================
>> ==================
>> --- llvm/trunk/lib/Target/X86/X86InstrArithmetic.td (original)
>> +++ llvm/trunk/lib/Target/X86/X86InstrArithmetic.td Mon Jan 29 12:54:33
>> 2018
>> @@ -1257,14 +1257,6 @@ let isCompare = 1 in {
>>      def TEST32mi   : BinOpMI_F<0xF6, "test", Xi32, X86testpat, MRM0m>;
>>      let Predicates = [In64BitMode] in
>>      def TEST64mi32 : BinOpMI_F<0xF6, "test", Xi64, X86testpat, MRM0m>;
>> -
>> -    // When testing the result of EXTRACT_SUBREG sub_8bit_hi, make sure
>> the
>> -    // register class is constrained to GR8_NOREX. This pseudo is
>> explicitly
>> -    // marked side-effect free, since it doesn't have an isel pattern
>> like
>> -    // other test instructions.
>> -    let isPseudo = 1, hasSideEffects = 0 in
>> -    def TEST8ri_NOREX : I<0, Pseudo, (outs), (ins GR8_NOREX:$src,
>> i8imm:$mask),
>> -                          "", [], IIC_BIN_NONMEM>, Sched<[WriteALU]>;
>>    } // Defs = [EFLAGS]
>>
>>    def TEST8i8    : BinOpAI_F<0xA8, "test", Xi8 , AL,
>>
>> Modified: llvm/trunk/lib/Target/X86/X86InstrInfo.cpp
>> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/
>> X86/X86InstrInfo.cpp?rev=323690&r1=323689&r2=323690&view=diff
>> ============================================================
>> ==================
>> --- llvm/trunk/lib/Target/X86/X86InstrInfo.cpp (original)
>> +++ llvm/trunk/lib/Target/X86/X86InstrInfo.cpp Mon Jan 29 12:54:33 2018
>> @@ -8018,9 +8018,6 @@ bool X86InstrInfo::expandPostRAPseudo(Ma
>>    case X86::VMOVUPSZ256mr_NOVLX:
>>      return expandNOVLXStore(MIB, &getRegisterInfo(),
>> get(X86::VMOVUPSYmr),
>>                              get(X86::VEXTRACTF64x4Zmr), X86::sub_ymm);
>> -  case X86::TEST8ri_NOREX:
>> -    MI.setDesc(get(X86::TEST8ri));
>> -    return true;
>>    case X86::MOV32ri64:
>>      MI.setDesc(get(X86::MOV32ri));
>>      return true;
>>
>> Modified: llvm/trunk/lib/Target/X86/X86MacroFusion.cpp
>> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/
>> X86/X86MacroFusion.cpp?rev=323690&r1=323689&r2=323690&view=diff
>> ============================================================
>> ==================
>> --- llvm/trunk/lib/Target/X86/X86MacroFusion.cpp (original)
>> +++ llvm/trunk/lib/Target/X86/X86MacroFusion.cpp Mon Jan 29 12:54:33 2018
>> @@ -86,7 +86,6 @@ static bool shouldScheduleAdjacent(const
>>    case X86::TEST16mr:
>>    case X86::TEST32mr:
>>    case X86::TEST64mr:
>> -  case X86::TEST8ri_NOREX:
>>    case X86::AND16i16:
>>    case X86::AND16ri:
>>    case X86::AND16ri8:
>>
>> Modified: llvm/trunk/test/CodeGen/X86/test-shrink.ll
>> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/test/
>> CodeGen/X86/test-shrink.ll?rev=323690&r1=323689&r2=323690&view=diff
>> ============================================================
>> ==================
>> --- llvm/trunk/test/CodeGen/X86/test-shrink.ll (original)
>> +++ llvm/trunk/test/CodeGen/X86/test-shrink.ll Mon Jan 29 12:54:33 2018
>> @@ -484,8 +484,7 @@ no:
>>  define void @truncand32(i16 inreg %x) nounwind {
>>  ; CHECK-LINUX64-LABEL: truncand32:
>>  ; CHECK-LINUX64:       # %bb.0:
>> -; CHECK-LINUX64-NEXT:    andl $2049, %edi # imm = 0x801
>> -; CHECK-LINUX64-NEXT:    testw %di, %di
>> +; CHECK-LINUX64-NEXT:    testl $2049, %edi # imm = 0x801
>>  ; CHECK-LINUX64-NEXT:    je .LBB11_1
>>  ; CHECK-LINUX64-NEXT:  # %bb.2: # %no
>>  ; CHECK-LINUX64-NEXT:    retq
>> @@ -498,8 +497,7 @@ define void @truncand32(i16 inreg %x) no
>>  ; CHECK-WIN32-64-LABEL: truncand32:
>>  ; CHECK-WIN32-64:       # %bb.0:
>>  ; CHECK-WIN32-64-NEXT:    subq $40, %rsp
>> -; CHECK-WIN32-64-NEXT:    andl $2049, %ecx # imm = 0x801
>> -; CHECK-WIN32-64-NEXT:    testw %cx, %cx
>> +; CHECK-WIN32-64-NEXT:    testl $2049, %ecx # imm = 0x801
>>  ; CHECK-WIN32-64-NEXT:    je .LBB11_1
>>  ; CHECK-WIN32-64-NEXT:  # %bb.2: # %no
>>  ; CHECK-WIN32-64-NEXT:    addq $40, %rsp
>> @@ -511,8 +509,7 @@ define void @truncand32(i16 inreg %x) no
>>  ;
>>  ; CHECK-X86-LABEL: truncand32:
>>  ; CHECK-X86:       # %bb.0:
>> -; CHECK-X86-NEXT:    andl $2049, %eax # imm = 0x801
>> -; CHECK-X86-NEXT:    testw %ax, %ax
>> +; CHECK-X86-NEXT:    testl $2049, %eax # imm = 0x801
>>  ; CHECK-X86-NEXT:    je .LBB11_1
>>  ; CHECK-X86-NEXT:  # %bb.2: # %no
>>  ; CHECK-X86-NEXT:    retl
>>
>> Modified: llvm/trunk/test/CodeGen/X86/testb-je-fusion.ll
>> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/test/
>> CodeGen/X86/testb-je-fusion.ll?rev=323690&r1=323689&r2=323690&view=diff
>> ============================================================
>> ==================
>> --- llvm/trunk/test/CodeGen/X86/testb-je-fusion.ll (original)
>> +++ llvm/trunk/test/CodeGen/X86/testb-je-fusion.ll Mon Jan 29 12:54:33
>> 2018
>> @@ -6,9 +6,8 @@
>>  define i32 @check_flag(i32 %flags, ...) nounwind {
>>  ; CHECK-LABEL: check_flag:
>>  ; CHECK:       # %bb.0: # %entry
>> -; CHECK-NEXT:    movl %edi, %ecx
>>  ; CHECK-NEXT:    xorl %eax, %eax
>> -; CHECK-NEXT:    testb $2, %ch
>> +; CHECK-NEXT:    testl $512, %edi # imm = 0x200
>>  ; CHECK-NEXT:    je .LBB0_2
>>  ; CHECK-NEXT:  # %bb.1: # %if.then
>>  ; CHECK-NEXT:    movl $1, %eax
>>
>> Modified: llvm/trunk/test/CodeGen/X86/vastart-defs-eflags.ll
>> URL: http://llvm.org/viewvc/llvm-project/llvm/trunk/test/
>> CodeGen/X86/vastart-defs-eflags.ll?rev=323690&r1=
>> 323689&r2=323690&view=diff
>> ============================================================
>> ==================
>> --- llvm/trunk/test/CodeGen/X86/vastart-defs-eflags.ll (original)
>> +++ llvm/trunk/test/CodeGen/X86/vastart-defs-eflags.ll Mon Jan 29
>> 12:54:33 2018
>> @@ -8,9 +8,7 @@ target triple = "x86_64-apple-macosx10.1
>>  define i32 @check_flag(i32 %flags, ...) nounwind {
>>  ; CHECK-LABEL: check_flag:
>>  ; CHECK:       ## %bb.0: ## %entry
>> -; CHECK-NEXT:    pushq %rbx
>> -; CHECK-NEXT:    subq $48, %rsp
>> -; CHECK-NEXT:    movl %edi, %ebx
>> +; CHECK-NEXT:    subq $56, %rsp
>>  ; CHECK-NEXT:    testb %al, %al
>>  ; CHECK-NEXT:    je LBB0_2
>>  ; CHECK-NEXT:  ## %bb.1: ## %entry
>> @@ -29,7 +27,7 @@ define i32 @check_flag(i32 %flags, ...)
>>  ; CHECK-NEXT:    movq %rdx, -{{[0-9]+}}(%rsp)
>>  ; CHECK-NEXT:    movq %rsi, -{{[0-9]+}}(%rsp)
>>  ; CHECK-NEXT:    xorl %eax, %eax
>> -; CHECK-NEXT:    testb $2, %bh
>> +; CHECK-NEXT:    testl $512, %edi ## imm = 0x200
>>  ; CHECK-NEXT:    je LBB0_4
>>  ; CHECK-NEXT:  ## %bb.3: ## %if.then
>>  ; CHECK-NEXT:    leaq -{{[0-9]+}}(%rsp), %rax
>> @@ -40,8 +38,7 @@ define i32 @check_flag(i32 %flags, ...)
>>  ; CHECK-NEXT:    movl $8, 0
>>  ; CHECK-NEXT:    movl $1, %eax
>>  ; CHECK-NEXT:  LBB0_4: ## %if.end
>> -; CHECK-NEXT:    addq $48, %rsp
>> -; CHECK-NEXT:    popq %rbx
>> +; CHECK-NEXT:    addq $56, %rsp
>>  ; CHECK-NEXT:    retq
>>  entry:
>>    %and = and i32 %flags, 512
>>
>>
>> _______________________________________________
>> llvm-commits mailing list
>> llvm-commits at lists.llvm.org
>> http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-commits
>>
>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.llvm.org/pipermail/llvm-commits/attachments/20180131/28816767/attachment.html>