<div dir="ltr">The intention sounds reasonable. Given they are common and motivate the convergent attribute, I don't object to introducing some implementation-independent SIMT concepts. But I understand that could be more controversial. <div><br></div><div>My general concern is still that some terms in this definition are not well-defined for arbitrary transformations especially duplication. For example, regarding</div><div><br></div><div><span style="font-size:12.8px">> convergent - this operation may not be made control dependent on any additional values (aka may not be sunk into a condition)</span><br></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Is LLVM allowed to unroll</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">for (int i = 0; i < 4; ++i) {</span></div><div><span style="font-size:12.8px">  if (i < c) // c is loop invariant</span></div><div><span style="font-size:12.8px">    convergent();</span></div><div><span style="font-size:12.8px">}</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">to</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">if (0 < c)</span></div><div><span style="font-size:12.8px">  convergent();</span></div><div><div><span style="font-size:12.8px">if (1 < c)</span></div><div><span style="font-size:12.8px">  convergent();</span></div></div><div><div><span style="font-size:12.8px">if (2 < c)</span></div><div><span style="font-size:12.8px">  convergent();</span></div></div><div><div><span style="font-size:12.8px">if (3 < c)</span></div><div><span style="font-size:12.8px">  convergent();</span></div></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">?</span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">Is "0 < c" considered "an additional value"? I'd vote no, but one can argue the other way. </span></div><div><span style="font-size:12.8px"><br></span></div><div><span style="font-size:12.8px">One approach (Bjarke's idea) to work around such ambiguities is to define: a program is convergent-correct if everything marked convergent are indeed convergent. Then a transformation is convergent-correct unless it transforms a convergent-correct program to a convergent-incorrect one. However, defining "convergent-correct" involves SIMT concepts which you want to avoid here. </span></div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Sep 22, 2015 at 10:39 AM, Owen Anderson <span dir="ltr"><<a href="mailto:resistor@mac.com" target="_blank">resistor@mac.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word">Hi Jingyue,<div><br></div><div>I consider it a very important element of the design of convergent that it does not require baseline LLVM to contain a definition of uniformity, which would itself pull in a definition of SIMT/SPMD, warps, threads, etc.  The intention is that it should be a conservative (but hopefully not too conservative) approximation, and that implementations of specific GPU programming models (CUDA, OpenCL, individual GPU vendors, etc) may layer more permissive semantics on top of it in code that is specific to that programming model.</div><span class="HOEnZb"><font color="#888888"><div><br></div><div>—Owen</div></font></span><div><div class="h5"><div><br><div><div><blockquote type="cite"><div>On Sep 22, 2015, at 10:33 AM, Jingyue Wu <<a href="mailto:jingyue@google.com" target="_blank">jingyue@google.com</a>> wrote:</div><br><div><div dir="ltr">Hi Owen, <div><br></div><div>This is very interesting. </div><div><br></div><div>How different is "convergent" from "uniform"? An instruction is uniform if threads in the same SIMT unit (e.g. warp) do not diverge when executing this instruction. <div><br></div><div>I ask this because Bjarke recently came up with a mathematical definition of uniformity. I wonder if that is a foundation "convergent" needs as well. AFAICT, Bjarke's definition of "uniformity" is less restrictive than "convergent". For example, <span style="font-size:12.8px">it allows loop unswitching the following code if "c" is uniform, which seems a case you ideally want to allow. </span></div><div><br></div><div><span style="font-size:12.8px">DISALLOWED:</span><br style="font-size:12.8px"><span style="font-size:12.8px">for (…) {</span><br style="font-size:12.8px"><span style="font-size:12.8px">  if (c) { … }</span><br style="font-size:12.8px"><span style="font-size:12.8px">  convergent();</span><br style="font-size:12.8px"><span style="font-size:12.8px">}</span><br></div><div><br></div><div>Jingyue</div></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Sep 4, 2015 at 1:25 PM, Owen Anderson via llvm-dev <span dir="ltr"><<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi all,<br>
<br>
In light of recent discussions regarding updating passes to respect convergent semantics, and whether or not it is sufficient for barriers, I would like to propose a change in convergent semantics that should resolve a lot of the identified problems regarding loop unrolling, loop unswitching, etc.  Credit to John McCall for talking this over with me and seeding the core ideas.<br>
<br>
Today, convergent operations may only be moved into control-equivalent locations, or, in layman’s terms, a convergent operation may neither be sunk into nor hoisted out of, a condition.  This causes problems for full loop unrolling, as the control dependence on the loop counter is eliminated, but our intuition indicates that this dependence was somehow trivial.  More concretely, all know uses of convergent are OK with full unrolling, making this semantic undesirable.  Related problems arise in loop unswitching as well.<br>
<br>
The proposed change is to split the semantics of convergent into two annotations:<br>
        convergent - this operation may not be made control dependent on any additional values (aka may not be sunk into a condition)<br>
        nospeculate - this operation may not be added to any program trace on which it was not previously executed (same as notrap?)<br>
<br>
Most of today’s convergent operations (barriers, arithmetic gradients) would continue to be marked only as convergent.  The new semantics would allow full loop unrolling, and provide clarity on which loop unswitching operations are allowed, examples below.<br>
<br>
The one case where nospeculate would also be needed is in the case of texture fetches that compute implicit gradients.  Because the computed gradient forms part of the addressing mode, gibberish gradients here can cause invalid memory dereferences.<br>
<br>
—Owen<br>
<br>
——————————————————<br>
<br>
Loop Unswitching Examples<br>
<br>
ALLOWED:<br>
for (…) {<br>
  if (c) { convergent(); }<br>
}<br>
<br>
DISALLOWED:<br>
for (…) {<br>
  if (c) { … }<br>
  convergent();<br>
}<br>
<br>
<br>
_______________________________________________<br>
LLVM Developers mailing list<br>
<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a><br>
<a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev</a><br>
</blockquote></div><br></div>
</div></blockquote></div><br></div></div></div></div></div></blockquote></div><br></div>