<html><head><meta http-equiv="Content-Type" content="text/html charset=us-ascii"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">Hi Vivek,<div class=""><br class=""></div><div class="">What is the scope of your extended rematerialization support?</div><div class=""><br class=""></div><div class="">Indeed, rematerialization is usually a way to avoid spilling, but proposed solution sounds more like an optimization to get rid of some load/store pairs.</div><div class="">It seems to me clumsy to extend rematerialization after RA, because that means we have to check and recompute extra things to be able to do it. For instance, we have to rebuild the live-ranges, check for redefinition etc.</div><div class=""><br class=""></div><div class="">In my opinion, if you want to stay away of the register allocator, it would make more sense to explore a rematerialization algorithm working on SSA that uses register pressure to take rematerialization decisions.</div><div class=""><br class=""></div><div class="">Anyhow, whatever is the direction we want to pursue, I believe it is best to start with motivating examples where the current framework is not sufficient and see what would work best.</div><div class=""><br class=""></div><div class="">Cheers,</div><div class="">-Quentin <br class=""><div><blockquote type="cite" class=""><div class="">On Oct 18, 2016, at 9:23 AM, vivek pandya via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org" class="">llvm-dev@lists.llvm.org</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><div dir="ltr" class=""><div style="font-size:13px" class="">Dear Community,</div><div style="font-size:13px" class=""><br class=""></div><div style="font-size:13px" class="">I would like to discuss few points to use RDF to extend register remat scope. Mr. Krzysztof and I have started discussion this on private mail.  But I think now it would be better to include community. </div><div style="font-size:13px" class="">Interested community member kindly previous discussion (at the end of mail) before starting here.</div><div style="font-size:13px" class=""><br class=""></div><div style="font-size:13px" class="">After analyzing if RDF can be used for solving Remat, we think that problem with RDF is that since it is post-RA, rematable register values also will be spilled and all its use will be surrounded with load-spill instructions. So identifying rematable sequence of instructions will be possible with RDF but its uses will not be associated with these instructions with any use-def chain because live-ranges have been split by spill-relaod. </div><div style="font-size:13px" class=""><br class=""></div><div style="font-size:13px" class="">One solution that I can think of is that during RA when a spill code is inserted , it can add a dummy instruction as a maker that can be used after post-RA to identify live-range (reg value) which was spilled and which instructions is using it after reloading (i.e where to use remated value). The post-RA pass can use RDF to construct remat sequence and use it and remove spill/restore as well as the marker instruction (dummy) inserted during the spill code generation. Is this possible with out changing much of Spill code framework? What all steps are required to add such a dummy /debug instruction at MIR ?</div><div style="font-size:13px" class=""><br class=""></div><div style="font-size:13px" class="">In case if RDF graph is not useable for this problem then simply use-def chain on MIR can be traversed in bottom up manner to identify remat instruction sequence. </div><div style="font-size:13px" class=""><br class=""></div><div style="font-size:13px" class="">Please share your thoughts.</div><div style="font-size:13px" class="">Vivek</div><div class="gmail_extra"><br class=""><div class="gmail_quote">On Tue, Oct 11, 2016 at 12:34 AM, Krzysztof Parzyszek <span dir="ltr" class=""><<a href="mailto:kparzysz@codeaurora.org" target="_blank" class="">kparzysz@codeaurora.org</a>></span> wrote:<br class=""><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">Hi Vivek,<br class="">
Yes, RDF would help with that, even if these instructions were not in the same block.<br class="">
<br class="">
Once you have the node corresponding to the use of R3 in the last statement, you can get the node corresponding to the reaching def of that node. This def node would be a member of the "oris" statement. Within that statement you would then look for use nodes and you'd find the use node for R3: "oris r3, *r3*, 35809". From that node, you'd follow the reaching def and this would give you: "sldi *r3*, r3, 32". Then you'd look for use nodes and you'd get "sldi r3, *r3*, 32". Following this traversal would eventually get you to the first "lis".<br class="">
<br class="">
Getting from use-node to def-node is a single step.<br class="">
Visiting other def/use nodes from the same statement, given a def-node is linear in terms of number of def/use nodes in that statement.<br class="">
<br class="">
If you want to rematerialize r30, then the whole sequence would need to use r30 (instead of r3). This is because r3 may not be available at the point where r30 is to be rematerialized. Finding out if r3 is live or not is also possible, but would require extra analysis.<br class="">
<br class="">
Getting an instruction, given an RDF node is easy:<br class="">
- def/use nodes have a pointer to MachineOperand,<br class="">
- statement node has a pointer to MachineInstr,<br class="">
- block node has a pointer to MachineBasicBlok.<br class="">
<br class="">
I don't think there are functions to do the inverse, i.e. given a MachineInstr, find the corresponding node. If necessary, such functions could be added, but existing RDF applications were simply traversing the RDF graph itself (instead of traversing the function and then finding corresponding nodes in the graph).<br class="">
<br class="">
Overall, RDF would definitely provide you with the information you are looking for.<br class="">
<br class="">
You can even try to see what you get without regmasks. Regmasks are used by most targets to provide a whole set of registers in a single machine operand, and they are mostly used in call instructions, where they indicate which registers are clobbered. This is mostly to avoid having tens of operands on these instructions. Hexagon doesn't use regmasks (I guess they were not present when the backend was first added, and we never switched over). R3 is used by PowerPC as a parameter/return value register, so a call should modify it explicitly (and not via regmask). For other registers, a regmask would simply be ignored (right now), which could lead to wrong results.<br class="">
<br class="">
-Krzysztof<div class="gmail-HOEnZb"><div class="gmail-h5"><br class="">
<br class="">
<br class="">
On 10/10/2016 1:34 PM, vivek pandya wrote:<br class="">
<blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
Hello Sir,<br class="">
<br class="">
I have a problem that I think can be solved with RDF. But I am not able<br class="">
to identify runtime complexity for this.<br class="">
Consider following powerpc asm :<br class="">
        lis 3, 12414<br class="">
        ori 3, 3, 27470<br class="">
        sldi 3, 3, 32<br class="">
        oris 3, 3, 35809<br class="">
        ori 30, 3, 20615<br class="">
here what I am looking for is that value in reg 30 is rematerilizable<br class="">
(can be recalculated) because this whole sequence is using constants to<br class="">
calculate the value that is in reg 30.<br class="">
So this is how I think I can use RDFGraph here, for statement<br class="">
ori 30, 3, 20615<br class="">
reaching defs for reg 3 can be traced back on RDFGraph if it found to be<br class="">
(rematerilizable) then continue going backward on RDFGraph untill a live<br class="">
range of reg 3 does not end (in this example it will be lis 3, 12414)<br class="">
This is very primitive example and also this may require RDFLiveness<br class="">
analysis.<br class="">
<br class="">
But do you think this problem is feasible to solve with RDF if yes than<br class="">
can you help me to build a concrete idea? (we may switch to llvm-dev if<br class="">
this seems a possible path).<br class="">
Ultimately this can be used to avoid spill by recalculating the value<br class="">
for a register. This also means that it may require to access RDFGraph<br class="">
based on the register i.e if RAX is required to be spilled I would like<br class="">
to check if RAX at statement X is having rematerilizable value or not.<br class="">
Also this may require to access instruction for a given RDFNode.<br class="">
Also will it be a liner time algorithm in terms of number of nodes in<br class="">
RDFGraph?<br class="">
<br class="">
Please share your thoughts.<br class="">
<br class="">
Sincerely,<br class="">
Vivek<br class="">
</blockquote>
<br class=""></div></div><span class="gmail-HOEnZb"><font color="#888888" class="">
-- <br class="">
Qualcomm Innovation Center, Inc. is a member of Code Aurora Forum, hosted by The Linux Foundation<br class="">
</font></span></blockquote></div><br class=""></div></div>
_______________________________________________<br class="">LLVM Developers mailing list<br class=""><a href="mailto:llvm-dev@lists.llvm.org" class="">llvm-dev@lists.llvm.org</a><br class="">http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev<br class=""></div></blockquote></div><br class=""></div></body></html>