<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div><br></div><div>Updated the patches and submitted r159465 and r159470, corresponding to #1 and #2.</div><div>I will be modifying the patch for X86 (#3).</div><div><br></div><div>Thanks,</div><div>Manman</div><div><br><div><div>On Jun 29, 2012, at 1:41 AM, Chandler Carruth wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite">Sorry for the delays, and thanks for the ping. =] Had to switch this back into context.<div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jun 27, 2012 at 4:30 PM, Manman Ren <span dir="ltr"><<a href="mailto:mren@apple.com" target="_blank" class="cremed">mren@apple.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div><br></div>I updated the patch, please review and provide feedback.<div><div><br>
</div><div>Update peephole optimization for X86 and ARM:</div><div>1> Interface: added SrcReg2 to analyzeCompare and optimizeCompare.</div><div>                       AnalyzeCompare to analyzeCompare ...</div><div><br>
</div><div>2> ARM: Clean up, no functional change.</div><div>Replaced a loop with existing interfaces: modifiesRegister and readsRegister.</div><div>Factored out code into inline functions and simplified the code.</div>
</div></div></blockquote><div><br></div><div>I would submit these two as two separate patches first -- smaller, more focused patches make both review and triaging test failures much easier.</div><div><br></div><div>For #1, I can't really review the benefit of this change, perhaps because I don't know ARM... It seems plausible in the implementation, but you didn't update the comments for the methods to talk about the new parameter. I like to use full doxygen comments to help remind myself to document everything:</div>
<div><br></div><div>/// \brief This method does foo.</div><div>///</div><div>/// Some details about how it does foo. Can be longer.</div><div>/// \param[in] x An input parameter.</div><div>/// \param[in,out] y An input and output parameter.</div>
<div>/// \param[out] z An output parameter.</div><div><br></div><div>However, this can be very verbose. ;] Often, a really good parameter name/type obviates the need for this level of commenting, but 'SrcReg2' as an 'unsigned' doesn't really tell me much at all.</div>
<div><br></div><div>For #2, everything seems generally fine. One nit-pick:</div><div><br></div><div><div>-    SmallVector<MachineOperand*, 4> OperandsToUpdate;</div><div>+    SmallVector<std::pair<MachineOperand*, ARMCC::CondCodes>, 4></div>
<div>+                                                               OperandsToUpdate;</div></div><div><br></div><div>I would just indent the second line here by 4 spaces instead of 2 spaces. Right-justifying things is really hard on most editors, and often quite hard for the reader...</div>
<div><br></div><div>I think with these tweaks these first two LGTM.</div><div><br></div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word">
<div><div>3> X86: added peephole optimization to remove cmp instruction<br></div><div>It will optimize the following:</div><div class="im"><div>  sub r1, r3</div><div>  cmp r3, r1 or cmp r1, r3</div><div>  bge L1</div>
<div>TO</div><div>  sub r1, r3</div><div>  bge L1 or ble L1</div><div>If the branch instruction can use flag from "sub", then we can eliminate</div><div>the "cmp" instruction.</div><div><br></div></div>
<div>For this optimization, we need to first check the condition code of</div><div>SET|CMOV|Jcc and then update the condition code.</div><div><br></div><div><div>This patch implemented 4 helper functions:</div><div>getSwappedConditionForCMov</div>
<div>getSwappedConditionForBranch</div><div>getSwappedConditionForSET</div><div>isRedundantFlagInstr</div></div><div><br></div><div>I can't think of a way to easily update the condition code of an instruction</div><div>
by adding flags in td file or data in MCInstrDesc, since the condition code</div><div>is hard-coded in the opcode.</div></div></div></blockquote><div><br></div><div>Ugh. I see the challenge here, it just results in a pretty impressive pile of switch code. However, I agree that there doesn't seem to be a better technique.</div>
<div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div><div><br></div><div>From what I know, there are 3 pairs of equivalent falg instructions for ARM:</div>
<div>CMP vs SUB, CMN vs ADD, TST vs AND</div><div>2 pairs for X86:</div><div>CMP vs SUB, TST vs AND</div><div>If there are more pairs, or there is a better way to implement isRedundantFlagInstr, please let me know.</div></div>
</div></blockquote><div><br></div><div>Now I see what you're driving at, and why my comments were confusing. =]</div><div><br></div><div>You're trying to find instructions which set *exactly* equivalent flags for a set of inputs, modulo swapping the condition codes, and only these two make sense there.</div></div></div></blockquote>Yes :)<br><blockquote type="cite"><div class="gmail_extra"><div class="gmail_quote">
<div><br></div><div>What I was pointing out is that there are more narrow, but possibly interesting cases as well if you consider the specific flag being tested:</div><div><br></div><div>neg %rax</div><div>... <some non-flag-setting instructions> ...</div>
<div>test %rax,%rax</div><div>jz ...</div><div><br></div><div>Here, we're just testing for %rax to be zero, and neg actually sets CF if its operand is zero, so we could transform this to:</div><div><br></div><div>neg %rax</div>
<div>... <some non-flag-setting instructions> ...</div><div>jc ...</div><div><br></div><div>Here is one I've actually seen in real code:</div><div><br></div><div>bsr %rax,%rbx</div><div>...</div><div>test %rax,%rax<br>
</div><div>cmovz 0,%rbx</div><div><br></div><div>Where the test can be deleted -- the flags are even the same.</div></div></div></blockquote>For ARM, this is handled in ARM peephole, where "CMP %reg, 0" can be eliminated if the destination instruction of %reg can be used to update the flags.</div><div>I thought this is covered in X86 somehow, maybe in DAG combine.</div><div>If you happen to have a test case for X86, where a "CMP %reg, 0" can be removed, please let me know.<br><blockquote type="cite"><div class="gmail_extra"><div class="gmail_quote"><div><div><br></div></div><div>There are lots of equivalences similar to this that aren't true for all flags, but may be true for the specific flag in use. Clearly, any extension to cover these other patterns should be a follow-up patch, I just wanted to clarify what I was talking about.</div>
<div><br></div><div><br></div><div><br></div><div>For the actual patch part of #3, I think you skipped a few of my comments:</div><div><br></div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div style="word-wrap:break-word"><div><div><blockquote type="cite"><p>><br>
> +                     int CmpValue, const MachineRegisterInfo *MRI) const {<br>
> +  MachineRegisterInfo::def_iterator DI = MRI->def_begin(SrcReg);<br>
> +  if (llvm::next(DI) != MRI->def_end())<br>
> +    // Only support one definition.<br>
> +    return false;<br>
> +<br>
> +  MachineInstr *MI = &*DI;<br>
> +  // Get ready to iterate backward from CmpInstr.<br>
> +  MachineBasicBlock::iterator I = CmpInstr, E = MI,<br>
> +                              B = CmpInstr->getParent()->begin();<br></p><p>Reverse iterators please. Iterating backwards is too hard to follow otherwise. Add the iterators if they're missing.<br>
 <br>
><br>
> +<br>
> +  // Early exit if CmpInstr is at the beginning of the BB.<br>
> +  if (I == B) return false;<br></p><p>Set up your loop variables below, where you're looping. You shouldn't need to do early exits etc, the loop simply won't iterate...<br></p></blockquote></div></div></div>
</blockquote><div>Specifically these two.</div><div><br></div><div><br></div><div>Other comments:</div><div><br></div><div><div>+/// isRedundantFlagInstr - check whether the first instruction, whose only</div><div>+/// purpose is to update flags, can be made redundant.</div>
<div>+/// CMPrr can be made redundant by SUBrr if the operands are the same.</div><div>+/// CMPri can be made redundant by SUBri if the operands are the same.</div><div>+/// This function can be extended later on.</div><div>
+inline static bool isRedundantFlagInstr(MachineInstr *FlagI, unsigned SrcReg,</div><div>+                                        unsigned SrcReg2, int ImmValue,</div><div>+                                        MachineInstr *OI) {</div>
</div><div><br></div><div>Why is it necessary to pass in the registers and immediate values? That is, why not extract them from FlagI the way we do from OI? I see that the outer API does (and mentioned up above that I didn't quite understand it), and seeing this I'm a bit more confused. I'm fine with either an explanation in comments, or changing the interface if that makes sense -- I'm just trying to get the code to be more clear to a future reader, not claiming what the right interface is.</div>
<div><br></div><div>Also, is there a better name than OI?</div><div><br></div><div>+  for (MachineBasicBlock::iterator I = CmpInstr,<br></div><div><div>+       E = CmpInstr->getParent()->end(); !IsSafe && ++I != E; ) {</div>
</div><div><br></div><div>Don't shadow the 'I' loop variable you already have here... This may get fixed by fixing the two comments above, but it needs to get fixed.</div><div><br></div><div>Also, it would be very nice to avoid incrementing inside the condition expression.... That's subtle and likely to be missed in the future.</div>
<div><br></div><div>Actually, you don't use IsSafe anywhere that I see. You 'break' out of the loop right after setting it to true, so its never even compared. Can you just kill this variable?</div><div><br></div>
</div></div>
</blockquote></div><br></div></body></html>