<br><br><div class="gmail_quote">On Wed, Jul 20, 2011 at 11:20 AM, Andrew Trick <span dir="ltr"><<a href="mailto:atrick@apple.com">atrick@apple.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

<div style="word-wrap:break-word"><div><div class="im"><div>On Jul 19, 2011, at 10:06 AM, Peter Lawrence wrote:</div><br><blockquote type="cite"><div style="word-wrap:break-word">
 Talin,<div>          how about having the front-end generate an llvm.safe.point() intrinsic call at</div><div>the desired safe points,  and having the addresses of the GC roots (at that point,</div><div>can vary from call to call) be the parameters (with noescape attribute) to the intrinsic,</div>

<div><br></div><div>IIUC currently the GC roots are tagged, and all analysis and transform optimizations</div><div>have to special case these tagged objects, but if instead their addresses were taken at</div><div>the safe points no special casing would have to be done -- all analysis and transform</div>

<div>optimizations already know how to deal with objects whose address is taken,</div><div><br></div><div>and since llvm does already have a "noescape" (not sure that's the correct name?)</div><div>attribute for parameters, these addresses won't be misinterpreted by any alias</div>

<div>analysis either, and llvm is free to go ahead and keep these values in registers</div><div>between safe points  -- you can stop asking how to allow GC roots as SSA values,</div><div>any traditional load-store optimization pass will do it for you for free.</div>

<div><br></div><div>*** without you having to insert explicit load and store instructions, and having to</div><div>somehow mark them as non-delete-able, or always omit optimization passes that</div><div>you would otherwise like to have enabled ***</div>

<div><br></div><div>and also without you having to store NULL into a safe point to end its lifetime.</div><div>and I would suggest eliminating the gcroot() intrinsic as it's information content</div><div>would be redundant.</div>

<div><br></div><div><br></div><div>thoughts, comments ???</div><div><br></div><div><br></div><div>-Peter Lawrence.</div></div></blockquote><div><br></div></div><div>It is helpful to think of the stack/register map generation in two</div>

<div>phases: before and after identifying the location of heap</div><div>pointers. Say PrePtrMap and PostPtrMap. We don't need to know stack</div><div>offsets and register names at that point, but do we need a 1-1 mapping</div>

<div>from pointer values to identifiable physical locations. I deliberately</div><div>avoid calling these values roots here, because we may have multiple</div><div>live pointers derived from an object and multiple copies of the same</div>

<div>pointer. GC only needs to see one of these values to trace roots, but</div><div>each of these still needs its own entry in the stack/register map for</div><div>a moving collector.</div><div><br></div><div>PrePtrMap, we need a type system to precisely tag all values known to</div>

<div>contain valid heap pointers. No potentially uninitialized/undefined</div><div>values allowed here. IntPtr/PtrInt casts become control dependent.</div><div><br></div><div>PostPtrMap, we need an IR that represents mapped pointers as live-in</div>

<div>to safepoints, *and* safepoints need to be defined as clobbering all</div><div>locations that may contain a pointer. For example, if we have a</div><div>register map, then we can no longer move and add instruction across a</div>

<div>call if it may operate on a pointer. Obviously, it's easier to avoid</div><div>invalidating a stack map, but fundamentally the same problem. No</div><div>amount of spilling can bail you out without updating the map.</div>

<div><br></div><div>The current gcroot solution works around the lack of LLVM type system</div><div>support for heap pointers by effectively mapping pointers very early</div><div>(in the front end), reloading roots after safepoints (so we only need</div>

<div>one map entry per root), and relying on the rules that allows callees</div><div>to write their caller's stack under certain circumstances (someone</div><div>needs to explain these rules to me--is it only possible when an alloca</div>

<div>pointer is taken?).</div><div><br></div><div>Your proposal is exactly the same in terms of when the heap pointers</div><div>are identified. That leaves all of the LLVM optimizer and codegen</div><div>running in PostPtrMap mode. The problem is that LLVM is free to make</div>

<div>copies of pointers and optimize across call sites without knowing how to</div><div>update the map.</div><div><br></div><div>The most efficient way to support GC is to move identification of</div><div>pointer locations as late as possible. Optimization across safepoints</div>

<div>needs to be effectively disabled after that point.</div><div><br></div><div>-Andy</div><div><br></div></div></div></blockquote><div><br></div><div>Achievement unlocked: People who are smarter than me and more knowledgeable about the LLVM backends are arguing over the details of how GC ought to work :) </div>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;"><div style="word-wrap:break-word"><div><blockquote type="cite"><div class="im"><div style="word-wrap:break-word"><div>

<div><div>On Jul 18, 2011, at 10:53 PM, Talin wrote:</div><br><blockquote type="cite">On Mon, Jul 18, 2011 at 11:00 AM, Peter Lawrence <span dir="ltr"><<a href="mailto:peterl95124@sbcglobal.net" target="_blank">peterl95124@sbcglobal.net</a>></span> wrote:<br>

<div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"> Talin,<br>           do you identify safe-points in the current or proposed llvm scheme, and if so how,<br>

 or are they implicit as being at all call sites (which begs the question what about leaves<br> in the call tree, how does GC get started at all in that case).<br><font color="#888888"> <br></font></blockquote><div>The LLVM linker has a feature where you can specify what kind of safe points your collector requires - the options are Loop, Return, PreCall and PostCall. You can also override this behavior and examine each instruction and return a boolean indicating whether it is or isn't a safe point.</div>

 <div><br></div><div>Currently I only have function calls as safe points, although I may eventually enable loops as well. As far as leaf functions go, consider that the call to allocate memory is also a safe point - and if a function doesn't allocate any memory then we don't care if the GC is involved or not.</div>

 <div><br></div><div>One complication with the current scheme is that the frontend has to have a sense of where the safe points are going to be. Because the current scheme requires the frontend to insert additional loads and stores around safe points (for spilling register values to memory so they can be traced), the frontend has to be able to guess which function call might be a safe point - but it can't know for sure due to the fact that optimization and inlining (which happens much later) may cause the removal of the actual call instruction. The safe but inefficient approach is to insert the extra loads and stores around every call instruction.</div>

 <div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><font color="#888888"> Peter Lawrence.<br> </font></blockquote></div><br>-- <br>-- Talin<br></blockquote>

</div><br></div></div></div><div class="im">_______________________________________________<br>LLVM Developers mailing list<br><a href="mailto:LLVMdev@cs.uiuc.edu" target="_blank">LLVMdev@cs.uiuc.edu</a>         <a href="http://llvm.cs.uiuc.edu" target="_blank">http://llvm.cs.uiuc.edu</a><br>

<a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev</a><br></div></blockquote></div><br></div></blockquote></div><br><br clear="all"><br>-- <br>-- Talin<br>