<div><div dir="auto">Yeah let’s backport it.</div></div><div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sat, May 11, 2019 at 2:26 AM Tom Stellard via llvm-commits <<a href="mailto:llvm-commits@lists.llvm.org">llvm-commits@lists.llvm.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">On 05/10/2019 09:19 PM, Craig Topper via llvm-commits wrote:<br>
> Author: ctopper<br>
> Date: Fri May 10 21:19:33 2019<br>
> New Revision: 360512<br>
> <br>
> URL: <a href="http://llvm.org/viewvc/llvm-project?rev=360512&view=rev" rel="noreferrer" target="_blank">http://llvm.org/viewvc/llvm-project?rev=360512&view=rev</a><br>
> Log:<br>
> [X86] Don't emit MOVNTDQA loads from fast-isel without SSE4.1.<br>
> <br>
> We were checking for SSE4.1 for FP types, but not integer 128-bit types.<br>
> <br>
> Fixes PR41837.<br>
> <br>
<br>
Should this be backported to the release_80 branch?<br>
<br>
-Tom<br>
<br>
> Modified:<br>
>     llvm/trunk/lib/Target/X86/X86FastISel.cpp<br>
>     llvm/trunk/test/CodeGen/X86/fast-isel-nontemporal.ll<br>
> <br>
> Modified: llvm/trunk/lib/Target/X86/X86FastISel.cpp<br>
> URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/X86/X86FastISel.cpp?rev=360512&r1=360511&r2=360512&view=diff" rel="noreferrer" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/lib/Target/X86/X86FastISel.cpp?rev=360512&r1=360511&r2=360512&view=diff</a><br>
> ==============================================================================<br>
> --- llvm/trunk/lib/Target/X86/X86FastISel.cpp (original)<br>
> +++ llvm/trunk/lib/Target/X86/X86FastISel.cpp Fri May 10 21:19:33 2019<br>
> @@ -396,7 +396,7 @@ bool X86FastISel::X86FastEmitLoad(EVT VT<br>
>    case MVT::v2i64:<br>
>    case MVT::v8i16:<br>
>    case MVT::v16i8:<br>
> -    if (IsNonTemporal && Alignment >= 16)<br>
> +    if (IsNonTemporal && Alignment >= 16 && HasSSE41)<br>
>        Opc = HasVLX ? X86::VMOVNTDQAZ128rm :<br>
>              HasAVX ? X86::VMOVNTDQArm : X86::MOVNTDQArm;<br>
>      else if (Alignment >= 16)<br>
> <br>
> Modified: llvm/trunk/test/CodeGen/X86/fast-isel-nontemporal.ll<br>
> URL: <a href="http://llvm.org/viewvc/llvm-project/llvm/trunk/test/CodeGen/X86/fast-isel-nontemporal.ll?rev=360512&r1=360511&r2=360512&view=diff" rel="noreferrer" target="_blank">http://llvm.org/viewvc/llvm-project/llvm/trunk/test/CodeGen/X86/fast-isel-nontemporal.ll?rev=360512&r1=360511&r2=360512&view=diff</a><br>
> ==============================================================================<br>
> --- llvm/trunk/test/CodeGen/X86/fast-isel-nontemporal.ll (original)<br>
> +++ llvm/trunk/test/CodeGen/X86/fast-isel-nontemporal.ll Fri May 10 21:19:33 2019<br>
> @@ -300,10 +300,20 @@ entry:<br>
>  }<br>
>  <br>
>  define <16 x i8> @test_load_nt16xi8(<16 x i8>* nocapture %ptr) {<br>
> -; SSE-LABEL: test_load_nt16xi8:<br>
> -; SSE:       # %bb.0: # %entry<br>
> -; SSE-NEXT:    movntdqa (%rdi), %xmm0<br>
> -; SSE-NEXT:    retq<br>
> +; SSE2-LABEL: test_load_nt16xi8:<br>
> +; SSE2:       # %bb.0: # %entry<br>
> +; SSE2-NEXT:    movdqa (%rdi), %xmm0<br>
> +; SSE2-NEXT:    retq<br>
> +;<br>
> +; SSE4A-LABEL: test_load_nt16xi8:<br>
> +; SSE4A:       # %bb.0: # %entry<br>
> +; SSE4A-NEXT:    movdqa (%rdi), %xmm0<br>
> +; SSE4A-NEXT:    retq<br>
> +;<br>
> +; SSE41-LABEL: test_load_nt16xi8:<br>
> +; SSE41:       # %bb.0: # %entry<br>
> +; SSE41-NEXT:    movntdqa (%rdi), %xmm0<br>
> +; SSE41-NEXT:    retq<br>
>  ;<br>
>  ; AVX-LABEL: test_load_nt16xi8:<br>
>  ; AVX:       # %bb.0: # %entry<br>
> @@ -320,10 +330,20 @@ entry:<br>
>  }<br>
>  <br>
>  define <8 x i16> @test_load_nt8xi16(<8 x i16>* nocapture %ptr) {<br>
> -; SSE-LABEL: test_load_nt8xi16:<br>
> -; SSE:       # %bb.0: # %entry<br>
> -; SSE-NEXT:    movntdqa (%rdi), %xmm0<br>
> -; SSE-NEXT:    retq<br>
> +; SSE2-LABEL: test_load_nt8xi16:<br>
> +; SSE2:       # %bb.0: # %entry<br>
> +; SSE2-NEXT:    movdqa (%rdi), %xmm0<br>
> +; SSE2-NEXT:    retq<br>
> +;<br>
> +; SSE4A-LABEL: test_load_nt8xi16:<br>
> +; SSE4A:       # %bb.0: # %entry<br>
> +; SSE4A-NEXT:    movdqa (%rdi), %xmm0<br>
> +; SSE4A-NEXT:    retq<br>
> +;<br>
> +; SSE41-LABEL: test_load_nt8xi16:<br>
> +; SSE41:       # %bb.0: # %entry<br>
> +; SSE41-NEXT:    movntdqa (%rdi), %xmm0<br>
> +; SSE41-NEXT:    retq<br>
>  ;<br>
>  ; AVX-LABEL: test_load_nt8xi16:<br>
>  ; AVX:       # %bb.0: # %entry<br>
> @@ -340,10 +360,20 @@ entry:<br>
>  }<br>
>  <br>
>  define <4 x i32> @test_load_nt4xi32(<4 x i32>* nocapture %ptr) {<br>
> -; SSE-LABEL: test_load_nt4xi32:<br>
> -; SSE:       # %bb.0: # %entry<br>
> -; SSE-NEXT:    movntdqa (%rdi), %xmm0<br>
> -; SSE-NEXT:    retq<br>
> +; SSE2-LABEL: test_load_nt4xi32:<br>
> +; SSE2:       # %bb.0: # %entry<br>
> +; SSE2-NEXT:    movdqa (%rdi), %xmm0<br>
> +; SSE2-NEXT:    retq<br>
> +;<br>
> +; SSE4A-LABEL: test_load_nt4xi32:<br>
> +; SSE4A:       # %bb.0: # %entry<br>
> +; SSE4A-NEXT:    movdqa (%rdi), %xmm0<br>
> +; SSE4A-NEXT:    retq<br>
> +;<br>
> +; SSE41-LABEL: test_load_nt4xi32:<br>
> +; SSE41:       # %bb.0: # %entry<br>
> +; SSE41-NEXT:    movntdqa (%rdi), %xmm0<br>
> +; SSE41-NEXT:    retq<br>
>  ;<br>
>  ; AVX-LABEL: test_load_nt4xi32:<br>
>  ; AVX:       # %bb.0: # %entry<br>
> @@ -360,10 +390,20 @@ entry:<br>
>  }<br>
>  <br>
>  define <2 x i64> @test_load_nt2xi64(<2 x i64>* nocapture %ptr) {<br>
> -; SSE-LABEL: test_load_nt2xi64:<br>
> -; SSE:       # %bb.0: # %entry<br>
> -; SSE-NEXT:    movntdqa (%rdi), %xmm0<br>
> -; SSE-NEXT:    retq<br>
> +; SSE2-LABEL: test_load_nt2xi64:<br>
> +; SSE2:       # %bb.0: # %entry<br>
> +; SSE2-NEXT:    movdqa (%rdi), %xmm0<br>
> +; SSE2-NEXT:    retq<br>
> +;<br>
> +; SSE4A-LABEL: test_load_nt2xi64:<br>
> +; SSE4A:       # %bb.0: # %entry<br>
> +; SSE4A-NEXT:    movdqa (%rdi), %xmm0<br>
> +; SSE4A-NEXT:    retq<br>
> +;<br>
> +; SSE41-LABEL: test_load_nt2xi64:<br>
> +; SSE41:       # %bb.0: # %entry<br>
> +; SSE41-NEXT:    movntdqa (%rdi), %xmm0<br>
> +; SSE41-NEXT:    retq<br>
>  ;<br>
>  ; AVX-LABEL: test_load_nt2xi64:<br>
>  ; AVX:       # %bb.0: # %entry<br>
> <br>
> <br>
> _______________________________________________<br>
> llvm-commits mailing list<br>
> <a href="mailto:llvm-commits@lists.llvm.org" target="_blank">llvm-commits@lists.llvm.org</a><br>
> <a href="https://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-commits" rel="noreferrer" target="_blank">https://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-commits</a><br>
> <br>
<br>
_______________________________________________<br>
llvm-commits mailing list<br>
<a href="mailto:llvm-commits@lists.llvm.org" target="_blank">llvm-commits@lists.llvm.org</a><br>
<a href="https://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-commits" rel="noreferrer" target="_blank">https://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-commits</a><br>
</blockquote></div></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature">~Craig</div>