<HTML>
<HEAD>
<TITLE>Re: [LLVMdev] Eliminating gotos</TITLE>
</HEAD>
<BODY>
<FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'>Hi Owen,<BR>
<BR>
On 12/08/2008 16:52, "Owen Anderson" <<a href="resistor@mac.com">resistor@mac.com</a>> wrote:<BR>
<BR>
</SPAN></FONT><BLOCKQUOTE><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'><BR>
SNIP<BR>
<BR>
<BR>
I'm still not seeing how these two are any different.  You just replace the text of "if" with "br", and add the explicit target labels.  I should also point out that, in LLVM IR, the order the blocks are laid out in is not meaningful and could change, so representing them explicitly in the branch or "if" is a requirement.  Also, this ordering (and, indeed, the number and structure of basic blocks) is not guaranteed to be preserved into the Machine-level phase of code generation.<BR>
<BR>
What I'm guessing you're getting at is that you need is to insert an end-if instruction at some point.  If this is the case, I don't think radically changing the LLVM IR is the path of least resistance.  What about having a Machine-level pass that enforces the ordering of blocks that you require and inserts the special instructions based on a high-level control flow reconstruction?  At the Machine-level, blocks are allowed to have multiple exits, so you could even implement the non-optimized case you gave first.  Also, loop-structure analysis is available at the Machine level as well, which might help.<BR>
<BR>
</SPAN></FONT></BLOCKQUOTE><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'>[bg] Ok so I think I’m starting to get it. You are correct in your assertion that we need to insert the end-if instruction at some point and of course else in the case of if-then-else constructs. But we also need to reconstruct while-loops and it is unclear to me if you approach works for all cases of gotos. The other concern here is that as we are targeting an instruction set with virtual registers and register allocation and scheduling will be performed by our assembler not within LLVM and so we are planning on implementing a language style backend, similar in style to the MSIL backend, and as such it is possible to use a  machine-level pass?  <BR>
</SPAN></FONT><BLOCKQUOTE><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'><BR>
Seems like a lot simpler than massively altering the IR.<BR>
<BR>
</SPAN></FONT><BLOCKQUOTE><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'> I agree that in some sense this is an argument over syntax but the issue for us is that our ISA represents control flow using structured ops and so we have no option but to re-write the code into this form or change the hardware :-)!<BR>
 <BR>
</SPAN></FONT></BLOCKQUOTE><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'><BR>
I'm still not understanding your point here.  Even if LLVM spells it as "br", your target isel can match it to something spelled "if" with no problem.  See my suggestions above about inserting other special instructions and enforcing block ordering above.<BR>
</SPAN><SPAN STYLE='font-size:11.5pt'> <BR>
</SPAN></FONT><BLOCKQUOTE><BLOCKQUOTE><OL><LI><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'>Extend LLVM with news ops to support if/loop. 
</SPAN></FONT><LI><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'>Implement this with the insertion of intrinsics to represent high-level control-flow, introducing “false” dependencies if necessary to allow optimizations to be applied without changing the semantics. 
</SPAN></FONT><LI><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'>Implement some structure of to the side that represents this high-level flow. 
</SPAN></FONT><LI><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'> 
</SPAN></FONT><LI><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'> <BR>
</SPAN></FONT></OL><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'><BR>
  Thoughts?<BR>
 <BR>
</SPAN></FONT></BLOCKQUOTE></BLOCKQUOTE><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'><BR>
I missed pointing this one out earlier, but you won't be able to do this with intrinsics, as block labels cannot be used as first class values, and so cannot be passed to a function call.  You'd actually have to add instructions to the IR, or come up with a string-based tagging scheme or something<BR>
<BR>
Actually I was thinking something along the following lines:<BR>
<BR>
OpenCL -> LLVM IR<BR>
2 SSA (mem2reg)<BR>
LLVM optimizations <BR>
2 !SSA (phi2copy)<BR>
Goto elimination with intrinsics<BR>
</SPAN></FONT></BLOCKQUOTE><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'>          Code gen (without register allocation and so on)<BR>
</SPAN></FONT><BLOCKQUOTE><FONT FACE="Calibri, Verdana, Helvetica, Arial"><SPAN STYLE='font-size:11pt'><BR>
Where the goto elimination pass would generate something like:<BR>
<BR>
define i32 @foo(i32 %x, i32 %y) {<BR>
entry:    <BR>
    %tobool    = icmp eq i32 %x, 0 <BR>
<BR>
    %dummy1  = call i1 %if i1 %tobool<BR>
        %add = add i32 %x, 10<BR>
        ret i32 %add<BR>
    call void %endif i1 %dummy1<BR>
<BR>
    %call = tail call i32 (...)* @bar( )   <BR>
    ret i32 %y<BR>
}<BR>
<BR>
I’m not sure all this makes sense rather I’m just thinking about the options and trying to develop a whole picture.<BR>
<BR>
Ben<BR>
<BR>
<BR>
<HR ALIGN=CENTER SIZE="3" WIDTH="95%"></SPAN></FONT><FONT SIZE="2"><FONT FACE="Consolas, Courier New, Courier"><SPAN STYLE='font-size:10pt'>_______________________________________________<BR>
LLVM Developers mailing list<BR>
<a href="LLVMdev@cs.uiuc.edu">LLVMdev@cs.uiuc.edu</a>         <a href="http://llvm.cs.uiuc.edu">http://llvm.cs.uiuc.edu</a><BR>
<a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev">http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev</a><BR>
</SPAN></FONT></FONT></BLOCKQUOTE>
</BODY>
</HTML>