<br><br><div class="gmail_quote">On Mon, Mar 25, 2013 at 2:07 PM, Jakob Stoklund Olesen <span dir="ltr"><<a href="mailto:stoklund@2pi.dk" target="_blank">stoklund@2pi.dk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im"><br>
On Mar 25, 2013, at 1:41 PM, Akira Hatanaka <<a href="mailto:ahatanak@gmail.com">ahatanak@gmail.com</a>> wrote:<br>
<br>
> Hi Jakob,<br>
><br>
> I believe Hal is trying to enable register scavenger to find two (or more) registers that can be used as temporaries.<br>
><br>
> One problem I see with this approach is that, if you use register scavenger during PEI, you will have to pessimistically set aside two emergency spill slots before you call scavengeRegister, even if it turns out you only need one. Having an extra stack slot might not be a big problem, but still it is nice if we can avoid allocating a slot unnecessarily.<br>

><br>
> I probably won't need these pseudo instructions that are expanded post-RA in the first place if I can tell the register allocators to spill accumulator registers to general purpose integer registers instead of directly to stack and disallow copying between accumulator registers. But I guess that is a much more difficult problem to solve. Is that right?<br>

<br>
</div>That depends.<br>
<br>
The register allocator can spill across register classes, but it calls the functionality "live range splitting" and "register class inflation". Here's how you enable it:<br>
<br>
- Define a union register class that contains both CPU64Regs and ACRegs.<br>
<br>
- Implement TRI::getLargestLegalSuperClass(), and return the new union register class when asked about CPU64Regs or ACRegs (or their sub-classes).<br>
<br>
- Teach TII::copyPhysReg() to handle the cross-class copies.<br>
<br>
- Teach TII::storeRegToStackSlot() to constrain the register class to CPU64Regs when asked to spill a virtual register from the union register class.<br>
<br>
This will use cross-class spilling in most cases, but unfortunately we can't guarantee that an ACRegs virtual register will never be spilled. This just makes it much less likely to happen.<br>
<br></blockquote><div><br>I will look into this. It will probably alleviate the problem.<br> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Targets are still required to be able to spill all legal register classes.<br>
<br>
<br>
Instead of scavenging for registers during pseudo-expansion, I would like to make it possible to create new virtual registers during spilling. The plan is to give TII::storeRegToStackSlot() permission to:<br>
<br>
- Insert multiple instructions at the provided iterator, and<br>
<br>
- Create new virtual registers, possibly from different register classes.<br>
<br>
I think that functionality would solve your problems, right?<br>
<br></blockquote><div><br>Yes, it sounds like it will solve the problem.<br><br>Using the following example where live ranges of accumulators $vreg_acc0 and $vreg_acc1 conflict,<br><br>MULT $vreg_acc0, $vreg_gpr0, $vreg_gpr1<br>
MULT $vreg_acc1, $vreg_gpr2, $vreg_gpr3<br>
<br>(consumer of $vreg_acc1)<br>(consumer of $vreg_acc0)<br>
<br>if the register can create new virtual registers $vreg_gpr4 and $vreg_gpr5, I think spilling can be avoided:<br><br><br>MULT $vreg_acc0, $vreg_gpr0, $vreg_gpr1<br>copy $vreg_gpr4, $vreg_acc0:lo // spill lo<br>copy $vreg_gpr5, $vreg_acc0:hi // spill hi<br>

MULT $vreg_acc1, $vreg_gpr2, $vreg_gpr3<br>

<br>
(consumer of $vreg_acc1)<br>
copy $vreg_acc0:lo, $vreg_gpr4 // restore lo<br>
copy $vreg_acc0:hi, $vreg_gpr5 // restore hi<br>

(consumer of $vreg_acc0)<br>

<br><br>Also, should RA avoid splitting live intervals of accumulators, which creates copy instructions?<br><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

The general idea is that the scavenger should only be used when it is not possible to determine at RA time if a register is needed. That would typically be because the frame layout is not known yet. If a register is always needed, RA should pick it. It is going to do better than the scavenger.<br>

<br>
<br>
Can you use Hal's scavenger tricks until we get this functionality added to the register allocators? (Help implementing it is always welcome, of course).<br>
<span class="HOEnZb"><font color="#888888"><br></font></span></blockquote><div>Yes, I think I can, but I have to understand details of Hal's patch first.<br> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<span class="HOEnZb"><font color="#888888">
/jakob<br>
<br>
</font></span></blockquote></div><br>