<div dir="ltr"><div class="gmail_extra"><br><div class="gmail_quote">On Sat, Sep 20, 2014 at 7:12 AM, Simon Pilgrim <span dir="ltr"><<a href="mailto:llvm-dev@redking.me.uk" target="_blank">llvm-dev@redking.me.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div id=":8q0" class="a3s" style="overflow:hidden">Hi Andrea /  Chandler / Quentin,<br>
<br>
If AVX is available I would expect the vpermilps/vpermilpd instruction to be used for all float/double single vector shuffles, especially as it can deal with the folded load case as well - this would avoid the integer/float execution domain transfer issue with using vpshufd.<br></div></blockquote><div><br></div><div>Yes, this is the obvious solution to folding memory loads. It just isn't implemented yet.</div><div><br></div><div>Well, actually it is, but I haven't finished writing tests for it. =] </div></div></div></div>