Well I didn't understand the FIXME comment about the JIT issue around the AVX_SET0PSY and AVX_SET0PDY. So I did it this way. If you can shed any light on that FIXME that would be great. What about the V_SET0 having VR128, do we need a separate one for VR256 or is there some way to do this?<br>
<br><div class="gmail_quote">On Fri, Jan 13, 2012 at 10:23 AM, Jakob Stoklund Olesen <span dir="ltr"><<a href="mailto:stoklund@2pi.dk">stoklund@2pi.dk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="im"><br>
On Jan 13, 2012, at 12:12 AM, Craig Topper wrote:<br>
<br>
> Author: ctopper<br>
> Date: Fri Jan 13 02:12:35 2012<br>
> New Revision: 148108<br>
><br>
> URL: <a href="http://llvm.org/viewvc/llvm-project?rev=148108&view=rev" target="_blank">http://llvm.org/viewvc/llvm-project?rev=148108&view=rev</a><br>
> Log:<br>
> Make X86 instruction selection use 256-bit VPXOR for build_vector of all ones if AVX2 is enabled. This gives the ExeDepsFix pass a chance to choose FP vs int as appropriate. Also use v8i32 as the type for getZeroVector if AVX2 is enabled. This is consistent with SSE2 using prefering v4i32.<br>

<br>
</div>Hi Craig,<br>
<br>
Can't you handle this the same way as the V_SET0 instruction?<br>
<br>
It shouldn't be necessary to have AVX_SET0PSY, AVX_SET0PDY, and AVX2_SET0. Just use one pseudo-instruction that gets lowered PostRA. ExeDepsFix never needs to see it. It can work on the xor instructions.<br>
<span class="HOEnZb"><font color="#888888"><br>
/jakob<br>
<br>
</font></span></blockquote></div><br><br clear="all"><br>-- <br>~Craig<br>