<div dir="ltr">I think this is a Valgrind false-positive.<div><br></div><div>Reading uninitialized memory is safe provided the result isn't observed.</div><div><br></div><div>The isReg() test and the isDef() test are OK because whether bit 25 is set or not is irrelevant if the low bits are not zero (the comparison will be false no matter what value bit 25 holds). So there is only an observable effect of examining bit 25 if the low bits are all zero, satisfying the abstract requirement.</div><div><br></div><div>Valgrind can't know this sadly, so it flags this as a bug. This is something that I would expect MSan to do a better job of by helping the compiler not merge these two tests by showing a MSan check that differentiates them.</div><div><br></div><div>-Chandler</div></div><br><div class="gmail_quote"><div dir="ltr">On Mon, Nov 21, 2016 at 10:06 PM regehr via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Just want to emphasize that on x86-64 and using Valgrind:<br class="gmail_msg">
<br class="gmail_msg">
LLVM compiled with LLVM gets 360 unexpected test fails<br class="gmail_msg">
<br class="gmail_msg">
LLVM compiled with GCC gets 22 unexpected test fails<br class="gmail_msg">
<br class="gmail_msg">
Of course I don't know how many of these are caused by this bitfield<br class="gmail_msg">
speculation issue.<br class="gmail_msg">
<br class="gmail_msg">
John<br class="gmail_msg">
<br class="gmail_msg">
<br class="gmail_msg">
On 11/21/2016 10:48 PM, regehr via llvm-dev wrote:<br class="gmail_msg">
> Alright, here's what seems to be happening...<br class="gmail_msg">
><br class="gmail_msg">
> The testcase mentioned below builds a MachineOperand that prints like this:<br class="gmail_msg">
><br class="gmail_msg">
> <BB#2><br class="gmail_msg">
><br class="gmail_msg">
> The bottom word of this MachineOperand now looks like this, with<br class="gmail_msg">
> (according to Valgrind) the x's corresponding to uninitialized bits:<br class="gmail_msg">
><br class="gmail_msg">
> xxxx xxxx xxxx 0000 0000 0000 0000 0100<br class="gmail_msg">
><br class="gmail_msg">
> At this point isReg() can be called safely since it looks only at the<br class="gmail_msg">
> lower bits.  isDef() cannot be called safely because it looks at bit 25.<br class="gmail_msg">
>  However it is clear that the C++ code (below) never calls isDef() when<br class="gmail_msg">
> isReg() returns false, as it does here.<br class="gmail_msg">
><br class="gmail_msg">
> So now back to the asm:<br class="gmail_msg">
><br class="gmail_msg">
> 0000000000000000<br class="gmail_msg">
> <_Z6xfuncxPKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoEPNS_9BitVectorE>:<br class="gmail_msg">
><br class="gmail_msg">
>    0:    b8 ff 00 00 01           mov    $0x10000ff,%eax<br class="gmail_msg">
>    5:    23 07                    and    (%rdi),%eax<br class="gmail_msg">
>    7:    3d 00 00 00 01           cmp    $0x1000000,%eax<br class="gmail_msg">
>    c:    75 05                    jne    13<br class="gmail_msg">
> <_Z6xfuncxPKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoEPNS_9BitVectorE+0x13><br class="gmail_msg">
><br class="gmail_msg">
>    e:    e9 00 00 00 00           jmpq   13<br class="gmail_msg">
> <_Z6xfuncxPKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoEPNS_9BitVectorE+0x13><br class="gmail_msg">
><br class="gmail_msg">
>   13:    48 89 d6                 mov    %rdx,%rsi<br class="gmail_msg">
>   16:    e9 00 00 00 00           jmpq   1b <.LCPI5_1+0xb><br class="gmail_msg">
><br class="gmail_msg">
> It grabs the low word of the MO and uses a mask to grab bit 25 and also<br class="gmail_msg">
> the low 8 bits.  Next, it branches on bit 25, which isn't initialized.<br class="gmail_msg">
> The code is clever but -- I think -- wrong.<br class="gmail_msg">
><br class="gmail_msg">
> GCC does the right thing here, first branching on the low bits and only<br class="gmail_msg">
> then looking at bit 25.<br class="gmail_msg">
><br class="gmail_msg">
> Sorry if I got anything wrong here!<br class="gmail_msg">
><br class="gmail_msg">
> John<br class="gmail_msg">
><br class="gmail_msg">
><br class="gmail_msg">
><br class="gmail_msg">
> On 11/21/2016 04:38 PM, regehr via llvm-dev wrote:<br class="gmail_msg">
>> I spent some time digging into a Valgrind report of uninitialized values<br class="gmail_msg">
>> in LLVM r287520 built using itself.  (One of quite a few such reports<br class="gmail_msg">
>> that comes up during a "make check".)<br class="gmail_msg">
>><br class="gmail_msg">
>> I could use another set of eyes on the issue if someone has time.<br class="gmail_msg">
>><br class="gmail_msg">
>> This command gives me an error:<br class="gmail_msg">
>><br class="gmail_msg">
>> valgrind -q ./bin/llc <<br class="gmail_msg">
>> /home/regehr/llvm/test/CodeGen/Hexagon/hwloop-dbg.ll -march=hexagon<br class="gmail_msg">
>> -mcpu=hexagonv4<br class="gmail_msg">
>><br class="gmail_msg">
>> The error is at this line:<br class="gmail_msg">
>><br class="gmail_msg">
>> <a href="https://github.com/llvm-mirror/llvm/blob/master/lib/CodeGen/DeadMachineInstructionElim.cpp#L142" rel="noreferrer" class="gmail_msg" target="_blank">https://github.com/llvm-mirror/llvm/blob/master/lib/CodeGen/DeadMachineInstructionElim.cpp#L142</a><br class="gmail_msg">
>><br class="gmail_msg">
>><br class="gmail_msg">
>><br class="gmail_msg">
>> Here I've refactored the code into a minimal (noinline) function that<br class="gmail_msg">
>> still triggers the problem.  xfunc2() and xfunc3() are also noinline.<br class="gmail_msg">
>> The problem goes away if either isReg() or isDef() is marked noinline.<br class="gmail_msg">
>><br class="gmail_msg">
>> void xfuncx(const MachineOperand &MO,<br class="gmail_msg">
>>         const TargetRegisterInfo *TRI,<br class="gmail_msg">
>>        BitVector &LivePhysRegs)  {<br class="gmail_msg">
>>   if (MO.isReg() &&  // <<<<------ problem reported here<br class="gmail_msg">
>>       MO.isDef()) {<br class="gmail_msg">
>>     xfunc2(MO, TRI, LivePhysRegs);<br class="gmail_msg">
>>   } else {<br class="gmail_msg">
>>     xfunc3(MO, LivePhysRegs);<br class="gmail_msg">
>>   }<br class="gmail_msg">
>> }<br class="gmail_msg">
>><br class="gmail_msg">
>> The asm is below.  Maybe I've been staring too long but I don't see the<br class="gmail_msg">
>> problem Valgrind is talking about.<br class="gmail_msg">
>><br class="gmail_msg">
>> John<br class="gmail_msg">
>><br class="gmail_msg">
>><br class="gmail_msg">
>>     .section<br class="gmail_msg">
>> .text._Z6xfuncxRKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoERNS_9BitVectorE,"ax",@progbits<br class="gmail_msg">
>><br class="gmail_msg">
>><br class="gmail_msg">
>>     .globl<br class="gmail_msg">
>> _Z6xfuncxRKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoERNS_9BitVectorE<br class="gmail_msg">
>><br class="gmail_msg">
>>     .p2align    4, 0x90<br class="gmail_msg">
>>     .type<br class="gmail_msg">
>> _Z6xfuncxRKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoERNS_9BitVectorE,@function<br class="gmail_msg">
>><br class="gmail_msg">
>><br class="gmail_msg">
>> _Z6xfuncxRKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoERNS_9BitVectorE:<br class="gmail_msg">
>><br class="gmail_msg">
>> #<br class="gmail_msg">
>> @_Z6xfuncxRKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoERNS_9BitVectorE<br class="gmail_msg">
>><br class="gmail_msg">
>><br class="gmail_msg">
>> .Lfunc_begin4:<br class="gmail_msg">
>>     .loc    2 126 0                 #<br class="gmail_msg">
>> ../lib/CodeGen/DeadMachineInstructionElim.cpp:126:0<br class="gmail_msg">
>>     .cfi_startproc<br class="gmail_msg">
>> # BB#0:                                 # %entry<br class="gmail_msg">
>>     #DEBUG_VALUE: xfuncx:MO <- %RDI<br class="gmail_msg">
>>     #DEBUG_VALUE: xfuncx:TRI <- %RSI<br class="gmail_msg">
>>     #DEBUG_VALUE: xfuncx:LivePhysRegs <- %RDX<br class="gmail_msg">
>>     #DEBUG_VALUE: isReg:this <- %RDI<br class="gmail_msg">
>>     .loc    2 127 18 prologue_end   #<br class="gmail_msg">
>> ../lib/CodeGen/DeadMachineInstructionElim.cpp:127:18<br class="gmail_msg">
>>     movl    $16777471, %eax         # imm = 0x10000FF<br class="gmail_msg">
>>     andl    (%rdi), %eax<br class="gmail_msg">
>> .Ltmp128:<br class="gmail_msg">
>>     #DEBUG_VALUE: isReg:this <- %RDI<br class="gmail_msg">
>>     cmpl    $16777216, %eax         # imm = 0x1000000<br class="gmail_msg">
>>     jne    .LBB4_2<br class="gmail_msg">
>> # BB#1:                                 # %if.then<br class="gmail_msg">
>>     #DEBUG_VALUE: xfuncx:LivePhysRegs <- %RDX<br class="gmail_msg">
>>     #DEBUG_VALUE: xfuncx:TRI <- %RSI<br class="gmail_msg">
>>     #DEBUG_VALUE: xfuncx:MO <- %RDI<br class="gmail_msg">
>> .Ltmp129:<br class="gmail_msg">
>>     .loc    2 129 5                 #<br class="gmail_msg">
>> ../lib/CodeGen/DeadMachineInstructionElim.cpp:129:5<br class="gmail_msg">
>>     jmp<br class="gmail_msg">
>> _Z6xfunc2RKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoERNS_9BitVectorE@PLT<br class="gmail_msg">
>><br class="gmail_msg">
>> # TAILCALL<br class="gmail_msg">
>> .Ltmp130:<br class="gmail_msg">
>> .LBB4_2:                                # %if.else<br class="gmail_msg">
>>     #DEBUG_VALUE: xfuncx:LivePhysRegs <- %RDX<br class="gmail_msg">
>>     #DEBUG_VALUE: xfuncx:TRI <- %RSI<br class="gmail_msg">
>>     #DEBUG_VALUE: xfuncx:MO <- %RDI<br class="gmail_msg">
>>     .loc    2 131 5                 #<br class="gmail_msg">
>> ../lib/CodeGen/DeadMachineInstructionElim.cpp:131:5<br class="gmail_msg">
>>     movq    %rdx, %rsi<br class="gmail_msg">
>>     jmp    _Z6xfunc3RKN4llvm14MachineOperandERNS_9BitVectorE@PLT #<br class="gmail_msg">
>> TAILCALL<br class="gmail_msg">
>> .Ltmp131:<br class="gmail_msg">
>> .Lfunc_end4:<br class="gmail_msg">
>>     .size<br class="gmail_msg">
>> _Z6xfuncxRKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoERNS_9BitVectorE,<br class="gmail_msg">
>><br class="gmail_msg">
>> .Lfunc_end4-_Z6xfuncxRKN4llvm14MachineOperandEPKNS_18TargetRegisterInfoERNS_9BitVectorE<br class="gmail_msg">
>><br class="gmail_msg">
>><br class="gmail_msg">
>>     .cfi_endproc<br class="gmail_msg">
>> _______________________________________________<br class="gmail_msg">
>> LLVM Developers mailing list<br class="gmail_msg">
>> <a href="mailto:llvm-dev@lists.llvm.org" class="gmail_msg" target="_blank">llvm-dev@lists.llvm.org</a><br class="gmail_msg">
>> <a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" class="gmail_msg" target="_blank">http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev</a><br class="gmail_msg">
> _______________________________________________<br class="gmail_msg">
> LLVM Developers mailing list<br class="gmail_msg">
> <a href="mailto:llvm-dev@lists.llvm.org" class="gmail_msg" target="_blank">llvm-dev@lists.llvm.org</a><br class="gmail_msg">
> <a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" class="gmail_msg" target="_blank">http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev</a><br class="gmail_msg">
_______________________________________________<br class="gmail_msg">
LLVM Developers mailing list<br class="gmail_msg">
<a href="mailto:llvm-dev@lists.llvm.org" class="gmail_msg" target="_blank">llvm-dev@lists.llvm.org</a><br class="gmail_msg">
<a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" class="gmail_msg" target="_blank">http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev</a><br class="gmail_msg">
</blockquote></div>