<html><head><style type='text/css'>p { margin: 0; }</style></head><body><div style='font-family: arial,helvetica,sans-serif; font-size: 10pt; color: #000000'><br><hr id="zwchr"><blockquote style="border-left: 2px solid rgb(16, 16, 255); margin-left: 5px; padding-left: 5px; color: rgb(0, 0, 0); font-weight: normal; font-style: normal; text-decoration: none; font-family: Helvetica,Arial,sans-serif; font-size: 12pt;"><b>From: </b>"Daniel Berlin" <dberlin@dberlin.org><br><b>To: </b>"Olivier Sallenave" <ol.sall@gmail.com><br><b>Cc: </b>llvmdev@cs.uiuc.edu<br><b>Sent: </b>Sunday, March 15, 2015 6:48:41 PM<br><b>Subject: </b>Re: [LLVMdev] Alias analysis issue with structs on PPC<br><br><div dir="ltr"><br><br><div class="gmail_quote">On Sun, Mar 15, 2015 at 4:34 PM Olivier Sallenave <<a href="mailto:ol.sall@gmail.com" target="_blank">ol.sall@gmail.com</a>> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div dir="ltr">Hi Daniel,<div><br></div><div>Thanks for your feedback. I would prefer not to write a new AA. Can't we directly implement that traversal in BasicAA?</div></div></blockquote><div>Can I ask why?<br>Outside of the "well, it's another pass", i mean?<br><br></div><div>BasicAA is stateless, so you can't cache, and you really don't want to redo these walks repeatedly (especially when the answer doesn't change unless AA is invalidated).  It would be really expensive.</div><div>Doing this in a separate analysis pass, caching the answer, and producing AA results, seems to me exactly the right thing.</div><div><br></div><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div dir="ltr"><div><br></div><div>Otherwise, I'll investigate why this i64 was generated in the first place (but like you, I don't really want to know why :-)</div></div></blockquote><div><br></div><div>Reid walked over to my desk and told me all the gory details - the clang ABI lowering of  structs like these for anything but x86 basically says "oh, this  really should be 2 8 byte GPR's, and the way it makes this happen is by using i64's :)</div><div><br></div><div id="DWT21290">If you want to do it at a clang level, the right thing to do is to fixup the ABI lowerings for pointers to keep them pointers in this case.</div></div></div></blockquote>So this is an artifact of the way that we pass structures, and constructing a general solution at the ABI level might be tricky. I've cc'd Uli, who did most of the recent work here.<br><br>For the single-element struct case, we could fix this by keeping it a pointer type.  The relevant code in Clang is in lib/CodeGen/TargetInfo.cpp (look at PPC64_SVR4_ABIInfo::classifyArgumentType and nearby code). But that does not really address the underlying issue:<br><br>If I take your example and modify it so that we have:<br><br>struct box {<br>    double* source;<br>    double* source2;<br>};<br><br>then the parameter is passed as:<br><br>define void @test(double* noalias nocapture %result, [2 x i64] %my_struct.coerce, i32 signext %len) #0<br><br>and is extracted the same way:<br><br>  %my_struct.coerce.fca.0.extract = extractvalue [2 x i64] %my_struct.coerce, 0<br>  %0 = inttoptr i64 %my_struct.coerce.fca.0.extract to double*<br><br>but, it is also important to realize that the i64 here in the array type is actually chosen to satisfy alignment requirements. If we have this:<br><br>typedef float __attribute__((ext_vector_type(4))) vt;<br>struct box {<br>    double* source;<br>    double* source2;<br>    vt v;<br>};<br><br>then the struct is passed as:<br><br>define void @test(double* noalias nocapture %result, [2 x i128] %my_struct.coerce, i32 signext %len)<br><br>and the extraction code looks like:<br><br>  %my_struct.coerce.fca.0.extract = extractvalue [2 x i128] %my_struct.coerce, 0<br>  %my_struct.sroa.0.sroa.0.0.extract.shift = lshr i128 %my_struct.coerce.fca.0.extract, 64<br>  %my_struct.sroa.0.sroa.0.0.extract.trunc = trunc i128 %my_struct.sroa.0.sroa.0.0.extract.shift to i64<br>  %0 = inttoptr i64 %my_struct.sroa.0.sroa.0.0.extract.trunc to double*<br><br>so just using pointer types instead of i64 will help common cases, but will not address the general issue. Now part of this does some down to using array parameters as a substitute for byval/direct parameters. As I recall, this was done because it allowed a natural partial decomposition between GPRs and stack for structures that straddle the number of available parameter-passing GPRs. If we could accomplish that with regular byval parameters and regular direct parameters, then we'd not need any of this array coercion, and the system, including for the purposes of aliasing analysis, would work as intended. There may be some infrastructure work required in the backend (SelectionDAG builder, etc.) -- Uli, if you know please comment -- but I think moving away from the array coercions might be the right solution, even if that requires some infrastructure enhancements.<br><br> -Hal<br><blockquote style="border-left: 2px solid rgb(16, 16, 255); margin-left: 5px; padding-left: 5px; color: rgb(0, 0, 0); font-weight: normal; font-style: normal; text-decoration: none; font-family: Helvetica,Arial,sans-serif; font-size: 12pt;"><div dir="ltr"><div class="gmail_quote"><div></div><div><br></div><div>For something simpler, if you wanted, you could do the *exact* opposite of happens now and you'd get better results.</div><div><br></div><div>This is, pass everything that needs to be 2 8 byte regs as 8 byte pointers, and cast it back to something if it's not really a pointer, using ptrtoint.</div><div><br></div><div>if it's not really a pointer, we don't care what AA says about it.</div><div>If it is a pointer, now we don't get bad AA answers, because there is no inttoptr being used like there is now.<br></div><div><br></div><div>Of course, i have no idea if this strategy is going to produce correct ABI results on all platforms, it depends on whether they treat pointers as special.</div><div><br></div><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div dir="ltr"><div></div><div>Olivier</div></div><div class="gmail_extra"><br><div class="gmail_quote">2015-03-13 18:51 GMT-04:00 Daniel Berlin <span dir="ltr"><<a href="mailto:dberlin@dberlin.org" target="_blank">dberlin@dberlin.org</a>></span>:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"></blockquote></div></div><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div dir="ltr"><br><br><div class="gmail_quote"><div><div>On Fri, Mar 13, 2015 at 2:54 PM Daniel Berlin <<a href="mailto:dberlin@dberlin.org" target="_blank">dberlin@dberlin.org</a>> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div dir="ltr"><div class="gmail_quote">On Fri, Mar 13, 2015 at 2:39 PM Olivier H Sallenave <<a href="mailto:ohsallen@us.ibm.com" target="_blank">ohsallen@us.ibm.com</a>> wrote:<br><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div>
<p><font face="sans-serif">Hi,</font><br>
<br>
<font face="sans-serif">I have the following C loop to vectorize:</font><br>
<br>
<font face="sans-serif">struct box {</font><br>
<font face="sans-serif">    double* source;</font><br>
<font face="sans-serif">};</font><br>
<br>
<font face="sans-serif">void test(double* restrict result, struct box my_struct, int len)</font><br>
<font face="sans-serif">{</font><br>
<font face="sans-serif">    for (int i=0 ; i<len; i++) {</font><br>
<font face="sans-serif">        result[i] = my_struct.source[i] * my_struct.source[i];</font><br>
<font face="sans-serif">    }</font><br>
<font face="sans-serif">}</font><br>
<br>
<font face="sans-serif">There are two references in the loop, result[i] (restrict) and my_struct.source[i] (readonly). The compiler should easily figure out that they do not alias.</font><br>
<br>
<font face="sans-serif">Compiling for x86, the loop alias analysis works just fine:</font><br>
<font face="sans-serif">  AST: Alias Set Tracker: 2 alias sets for 2 pointer values.</font><br>
<font face="sans-serif">  AliasSet[0x7fd8e2f32290, 1] must alias, No access Pointers: (double* %arrayidx5, 18446744073709551615)</font><br>
<font face="sans-serif">  AliasSet[0x7fd8e2f322e0, 1] must alias, No access Pointers: (double* %arrayidx, 18446744073709551615)</font><br>
<br>
<font face="sans-serif">Compilin</font><font face="sans-serif">g for PPC with -target powerpc64le-ibm-linux-gnu, the two addresses now alias:</font><br>
<font face="sans-serif">  AST: Alias Set Tracker: 1 alias sets for 2 pointer values.</font><br>
<font face="sans-serif">  AliasSet[0x7f931bd5bdc0, 2] may alias, No access Pointers: (double* %arrayidx5, 18446744073709551615), (double* %arrayidx, 18446744073709551615)</font><br>
<br>
<font face="sans-serif">BasicAA is used for both targets by default. The difference is that in PPC, the IR obtained from Clang takes an i64 as parameter instead of a double* for my_struct.</font></p></div></blockquote><div><br></div></div></div><div dir="ltr"><div class="gmail_quote"><div>I don't even want to know why this would be the case :)</div></div></div><div dir="ltr"><div class="gmail_quote"><div> </div><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div><p><font face="sans-serif"> This parameter is then coerced into double* using an inttoptr instruction. The code in BasicAliasAnalysis.cpp which is triggered for x86 is the following:</font><br>
<br>
<font face="sans-serif">    </font><font face="sans-serif">// Function arguments can't alias with things that are known to be</font><br>
<font face="sans-serif">    </font><font face="sans-serif">// </font><font face="sans-serif">unambigously</font><font face="sans-serif"> identified at the function level.</font><br>
<font face="sans-serif">    </font><font face="sans-serif">if</font><font face="sans-serif"> </font><font face="sans-serif">((</font><font face="sans-serif">isa<Argument></font><font face="sans-serif">(</font><font face="sans-serif">O1</font><font face="sans-serif">)</font><font face="sans-serif"> </font><font face="sans-serif">&&</font><font face="sans-serif"> </font><font face="sans-serif">isId<u></u>entifiedFunctionLocal</font><font face="sans-serif">(</font><font face="sans-serif">O2</font><font face="sans-serif">))</font><font face="sans-serif"> </font><font face="sans-serif">||</font><br>
<font face="sans-serif">        </font><font face="sans-serif">(</font><font face="sans-serif">isa<Argument></font><font face="sans-serif">(</font><font face="sans-serif">O2</font><font face="sans-serif">)</font><font face="sans-serif"> </font><font face="sans-serif">&&</font><font face="sans-serif"> </font><font face="sans-serif">isIdenti<u></u>fiedFunctionLocal</font><font face="sans-serif">(</font><font face="sans-serif">O1</font><font face="sans-serif">)))</font><br>
<font face="sans-serif">      </font><font face="sans-serif">return</font><font face="sans-serif"> </font><font face="sans-serif">NoAlias</font><font face="sans-serif">;</font><br>
<br>
<font face="sans-serif">isIdentifiedFunctionLocal(V) returns true for a noalias argument (such as result), but the other address (my_struct) must be a function argument in order to return NoAlias, which is not the case anymore for PPC (since my_struct is now the result from an inttoptr instruction). If I understand, the problem is that we cannot trust the fact that locals do not alias with restrict parameters (because the compiler could generate some locals which alias)?</font></p></div></blockquote></div></div><div dir="ltr"><div class="gmail_quote"><div>Yes, because pointers *based on* the noalias'd argument are legal aliases.</div><div> <br></div><div>So if you don't know it's an argument or an identified local, it could be based on the restricted pointer, and thus, alias it.</div></div></div><div dir="ltr"><div class="gmail_quote"><div><br></div><div><br></div><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;"><div><p><font face="sans-serif"> If someone has suggestions about this, that would help a lot.</font></p></div></blockquote></div></div><div dir="ltr"><div class="gmail_quote"><div><br>The only way you could prove something in this case would be to walk the chain and prove the value comes directly from an argument with no modification.</div></div></div></blockquote><div><br></div></div></div><div>Actually, you could do the opposite, too, pretty cheaply.</div><div><br></div><div>You could write a new pass or AA.</div><div>It traverses chains in the reverse direction (IE it goes from the arguments, and walks down the immediate use chain, marking things as based on arguments or not), and makes a lookup table of things it can prove are also  unmolested identified objects.</div><div>(which would be the result of inttoptr in your case).</div><div><br></div><div>You can then use this simple lookup table to answer the isIdentifiedObject question better.</div><div>(You'd have to make isIdentifiedObject part of the AA interface, or take an optional table, blah blah blah)</div><div><br></div></div></div>
<br></blockquote></div></div><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">_______________________________________________<br>
LLVM Developers mailing list<br>
<a href="mailto:LLVMdev@cs.uiuc.edu" target="_blank">LLVMdev@cs.uiuc.edu</a>         <a href="http://llvm.cs.uiuc.edu" target="_blank">http://llvm.cs.uiuc.edu</a><br>
<a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev</a><br>
<br></blockquote></div></div></blockquote></div></div>
<br>_______________________________________________<br>LLVM Developers mailing list<br>LLVMdev@cs.uiuc.edu         http://llvm.cs.uiuc.edu<br>http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev<br></blockquote><br><br><br>-- <br><div><span name="x"></span>Hal Finkel<br>Assistant Computational Scientist<br>Leadership Computing Facility<br>Argonne National Laboratory<span name="x"></span><br></div></div></body></html>