<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><div class="">Hi Derek,</div><br class=""><div><blockquote type="cite" class=""><div class="">On May 27, 2016, at 9:59 AM, Derek Schuff <<a href="mailto:dschuff@google.com" class="">dschuff@google.com</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><div dir="ltr" class="">Personally I find the approach of setting function pointers that do either something or nothing less straightforward and understandable than just checking a boolean variable or target hook. (That's why my initial attempts at this patch did exactly that). Obviously if there is just a boolean variable or target hook, then it's more readable if the uses of it are fewer and at a higher level (instead of scattered everywhere in the code). Making the check happen at pass instantiation time as is done here kind of forces things in that direction. Now that I think about it though, I actually think that the more uses there need to be, the better it is just to have some boolean (since you would just end up having a lot of function pointers); as Justin pointed out, I still failed to get everything into one place because of the check in `getRequiredProperties()`. Also the difference between traditional and virtual-reg architectures still leaks through via the use of MinCSFrameIndex and MaxCSFrameIndex in calculateFrameObjectOffsets(). So I guess that's just a long-winded way of repeating that I agree with Justin. <span style="line-height:1.5" class="">I also don't know of anywhere else in LLVM where we use this approach; generally we just put a check against the target hook in a conditional.</span><div class=""><div class=""><br class=""></div><div class="">The original concern and goal of all of this was that this code never had to consider virtual registers before, and we wanted to more clearly separate code that now has to deal with a virtual targets from code which doesn't. In this case that's the CSR spilling code and the register scavenging code, which are now factored into functions. Maybe it would accomplish the same purpose and be simpler just to put something like `if(TM->usesPhysRegsForPEI()) return;` with an explanatory comment at the top of those functions?</div></div></div></div></blockquote><div><br class=""></div><div>To be fair, I think the whole PEI and the related APIs (scavenger and such) would need a bigger revamp to properly adjust to the fact that PEI may occur on unallocated code. I still see the current approach as a hack and that is why I was trying to conceal it in one place.</div><div><br class=""></div><div>That being said, I agree the current approach is indeed unnatural compared to other LLVM passes and given both Justin and Derek have raised concerns about that I am fine reverting my position on that patch.</div><div><br class=""></div><div>The bottom line is (I am going to regret this :P), Derek, please go ahead with the usesPhysRegsForPEI approach instead of the function pointers.</div><div><br class=""></div><div>Cheers,</div><div>-Quentin</div><br class=""><blockquote type="cite" class=""><div class=""><br class=""><div class="gmail_quote"><div dir="ltr" class="">On Mon, May 23, 2016 at 2:58 PM Quentin Colombet <<a href="mailto:qcolombet@apple.com" class="">qcolombet@apple.com</a>> wrote:<br class=""></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br class="">
> On May 23, 2016, at 2:15 PM, Justin Bogner <<a href="mailto:mail@justinbogner.com" target="_blank" class="">mail@justinbogner.com</a>> wrote:<br class="">
><br class="">
> Quentin Colombet <<a href="mailto:qcolombet@apple.com" target="_blank" class="">qcolombet@apple.com</a>> writes:<br class="">
>> Hi Justin,<br class="">
>><br class="">
>> On May 23, 2016, at 1:25 PM, Justin Bogner via llvm-commits <<a href="mailto:llvm-commits@lists.llvm.org" target="_blank" class="">llvm-commits@lists.llvm.org</a>> wrote:<br class="">
>>> Derek Schuff via llvm-commits <<a href="mailto:llvm-commits@lists.llvm.org" target="_blank" class="">llvm-commits@lists.llvm.org</a> <mailto:<a href="mailto:llvm-commits@lists.llvm.org" target="_blank" class="">llvm-commits@lists.llvm.org</a>>> writes:<br class="">
>>>> -  PEI() : MachineFunctionPass(ID) {<br class="">
>>>> + explicit PEI(const TargetMachine *TM = nullptr) :<br class="">
>> MachineFunctionPass(ID) {<br class="">
>>>>    initializePEIPass(*PassRegistry::getPassRegistry());<br class="">
>>>> +<br class="">
>>>> +    if (TM && (!TM->usesPhysRegsForPEI())) {<br class="">
>>>> +      SpillCalleeSavedRegisters = [](MachineFunction &, RegScavenger *,<br class="">
>>>> + unsigned &, unsigned &, const MBBVector &,<br class="">
>>>> +                                     const MBBVector &) {};<br class="">
>>>> +      ScavengeFrameVirtualRegs = [](MachineFunction &, RegScavenger *) {};<br class="">
>>>> +    } else {<br class="">
>>>> +      SpillCalleeSavedRegisters = doSpillCalleeSavedRegs;<br class="">
>>>> +      ScavengeFrameVirtualRegs = doScavengeFrameVirtualRegs;<br class="">
>>>> +      UsesCalleeSaves = true;<br class="">
>>>> +    }<br class="">
>>><br class="">
>>> This is a pretty strange and confusing way to do this. Wouldn't it be<br class="">
>>> way simpler to just set a bool (I'd call it UsesPhysReg) and check it<br class="">
>>> before the single call to each of these functions? You'd presumably also<br class="">
>>> be able to use the same bool in the one place we check UsesCalleeSaves<br class="">
>>> as well.<br class="">
>><br class="">
>> A comment on that, because this situation is my doing :).<br class="">
><br class="">
> Personally I think the more direct style would be better, but the<br class="">
> difference isn't all that big so I'll just explain my rationale and move<br class="">
> on. You or Derek can change it if you're convinced by my argument.<br class="">
><br class="">
>> The difference is performance and maintainability.<br class="">
>> Performance: We check what to call only once (at build time) against<br class="">
>> every time we process a function.<br class="">
><br class="">
> Is the performance impact of this measurable?<br class="">
<br class="">
No idea.<br class="">
<br class="">
> I would expect the branch<br class="">
> to be predicted very well, since it never changes, so I doubt this<br class="">
> really matters. There's also the fact that this changes a bunch of<br class="">
> direct calls to indirect calls, so we've balanced out saving a check<br class="">
> with making the call impossible to inline.<br class="">
<br class="">
Well, bunch is 2 here :). Anyhow, there is nothing to inline in one case, but yeah the performance argument is probably weak.<br class="">
<br class="">
><br class="">
>> Maintainability: All the code that is modified because of that check<br class="">
>> is in one place.<br class="">
><br class="">
> Well, sort of. Except it basically splits this into three variables<br class="">
> instead of one - it's easy to grep for "UsesPhysReg" and find everything<br class="">
> that the bool modifies and update accordingly. It's harder to grep for<br class="">
> two functions and a bool to see where this makes a difference.<br class="">
<br class="">
There is actually more than that. The reason why I wanted to have these changes all gathered at one point is because I do not want to spread the use of UsesPhysReg all around. IMHO, it confuses the reader than anything else to have ifs around. Indeed, the pass is about laying the prologue and epilogue, I.e., we are after register allocation, but we still have to do special cases for virtual registers?!<br class="">
<br class="">
<br class="">
> There's<br class="">
> also the small matter that we set a bool based on this check *anyway*<br class="">
> and have to check that elsewhere, so we haven't even accomplished<br class="">
> getting all of the checks in the same place.<br class="">
<br class="">
This one is actually a fairly new mechanism and I actually missed it in the review. We should rethink how we could change that as well… An additional indirect call would do the job :P.<br class="">
@Derek could you do that?<br class="">
We shouldn’t have any check of UsePhysReg out of the constructor.<br class="">
<br class="">
The thing I like with the current approach (modulo this one place) is that we are sure all places that need to operate differently are set once and for all for the whole process.<br class="">
<br class="">
><br class="">
> OTOH, there's a third element to the tradeoff here, which is<br class="">
> discoverability/clarity. If I read through runOnMachineFunction I see a<br class="">
> call to `SpillCalleeSavedRegisters`, so it looks like this always<br class="">
> Happens.<br class="">
<br class="">
You should expect that. Only “weird" targets won’t do that.<br class="">
<br class="">
> People don't generally expect a function to sometimes be empty<br class="">
> based on a runtime check somewhere else in the file.<br class="">
<br class="">
That could actually be a static check if we bothered pushing different very of the pass for the “weird” target. What I am saying is that the “weird” targets know what they are doing and the others get what they expect and reading through the code does not involve the confusing boolean :).<br class="">
<br class="">
Cheers,<br class="">
-Quentin<br class="">
<br class="">
<br class="">
</blockquote></div>
</div></blockquote></div><br class=""></body></html>