<div dir="ltr"><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Apr 17, 2014 at 4:03 PM, Nadav Rotem <span dir="ltr"><<a href="mailto:nrotem@apple.com" target="_blank">nrotem@apple.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="">On Apr 17, 2014, at 3:41 PM, Robison, Arch <<a href="mailto:arch.robison@intel.com">arch.robison@intel.com</a>> wrote:<br>

<br>
> While playing with SLPVectorizer, I notice that it will happily vectorize cases involving extractelement/insertelement, but won't vectorize isomorphic cases involving extractvalue/insertvalue (such as the attached example).  Is that something that could be straightforward to add to SLPVectorizer, or are there some hard issue?  In particular, the transformation would seem to require casts of structures to vectors and back.  The bitcast instruction requires a non-aggregate value.<br>

><br>
> I'm thinking such vectorization might be useful for codes that use structs for tuples, like (x,y,z) coordinates or complex numbers.<br>
<br>
</div>Vectorization of struct values is not supported because it is not something we considered until now. It never showed up in any workload I looked at. It should not be too difficult to implement. We already insert casts when we vectorize loads and stores from memory.</blockquote>
</div><br></div><div class="gmail_extra">So, the first thing to understand (for Arch who may not have this context) is that almost all insertvalue/extractvalue instructions should be optimized out of the IR long before any vectorizer sees it. The SROA pass completely removes these instructions.</div>
<div class="gmail_extra"><br></div><div class="gmail_extra">The only time they are likely to show up is when forming (or decomposing) aggregates passed or returned by value at the LLVM IR level due to ABI concerns. It would indeed be nice if the SLPVectorizer could vectorize through these so that we end up with vector code and a tiny scalar peel right at the ABI boundary where we need to arrange the elements into specific registers.</div>
</div>