<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Wingdings;
        panose-1:5 0 0 0 0 0 0 0 0 0;}
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:72.0pt 72.0pt 72.0pt 72.0pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal">As Sanjay noted in <a href="https://reviews.llvm.org/D31426#712701">
D31426</a>, InstructionSimplify is missing the following simplification:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">This function:<o:p></o:p></p>
<p class="MsoNormal">define <4 x i32> @splat_operand(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">   %splat = shufflevector <4 x i32> %x, <4 x i32> undef, <4 x i32> zeroinitializer<o:p></o:p></p>
<p class="MsoNormal">   %shuf = shufflevector <4 x i32> %splat, <4 x i32> undef, <4 x i32> <i32 0, i32 3, i32 2, i32 1><o:p></o:p></p>
<p class="MsoNormal">   ret <4 x i32> %shuf<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">can be simplified to:<o:p></o:p></p>
<p class="MsoNormal">define <4 x i32> @splat_operand(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">  %shuf = shufflevector <4 x i32> %x, <4 x i32> undef, <4 x i32> zeroinitializer<o:p></o:p></p>
<p class="MsoNormal">  ret <4 x i32> %shuf<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">InstCombine covers this case inefficiently.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">I noticed that InstructionSimplify does not do any simplifications for shufflevector’s other than constant folding. I just wanted to be sure there is no compelling reason for this before I start streaming patches. I assume that this is
 not related to our conservative approach of refraining from creation of new shuffle masks that may hurt some target.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Here are some more opportunities that can be added to InstructionSimplify, all of which are covered by InstCombine:<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">define <4 x i32> @undef_mask(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">   %shuf = shufflevector <4 x i32> %x, <4 x i32> undef, <4 x i32> undef<o:p></o:p></p>
<p class="MsoNormal">   ret <4 x i32> %shuf<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><span style="font-family:Wingdings">à</span><o:p></o:p></p>
<p class="MsoNormal">define <4 x i32> @undef_mask(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">  ret <4 x i32> undef<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">define <4 x i32> @identity_mask_0(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">   %shuf = shufflevector <4 x i32> %x, <4 x i32> undef, <4 x i32> <i32 0, i32 1, i32 2, i32 3><o:p></o:p></p>
<p class="MsoNormal">   ret <4 x i32> %shuf<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><span style="font-family:Wingdings">à</span><o:p></o:p></p>
<p class="MsoNormal">define <4 x i32> @identity_mask_0(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">  ret <4 x i32> %x<o:p></o:p></p>
<p class="MsoNormal">} <o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">define <4 x i32> @identity_mask_1(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">   %shuf = shufflevector <4 x i32> undef, <4 x i32> %x, <4 x i32> <i32 4, i32 5, i32 6, i32 7><o:p></o:p></p>
<p class="MsoNormal">   ret <4 x i32> %shuf<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><span style="font-family:Wingdings">à</span><o:p></o:p></p>
<p class="MsoNormal">define <4 x i32> @identity_mask_1(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">  ret <4 x i32> %x<o:p></o:p></p>
<p class="MsoNormal">} <o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">define <4 x i32> @pseudo_identity_mask(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">   %shuf = shufflevector <4 x i32> %x, <4 x i32> %x, <4 x i32> <i32 0, i32 1, i32 2, i32 7><o:p></o:p></p>
<p class="MsoNormal">   ret <4 x i32> %shuf<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><span style="font-family:Wingdings">à</span> <o:p></o:p></p>
<p class="MsoNormal">define <4 x i32> @pseudo_identity_mask(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">  ret <4 x i32> %x<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">define <4 x i32> @const_operand(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">   %shuf = shufflevector <4 x i32> <i32 42, i32 43, i32 44, i32 45>, <4 x i32> %x, <4 x i32> <i32 0, i32 3, i32 2, i32 1><o:p></o:p></p>
<p class="MsoNormal">   ret <4 x i32> %shuf<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><span style="font-family:Wingdings">à</span><o:p></o:p></p>
<p class="MsoNormal">define <4 x i32> @const_operand(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">  ret <4 x i32> <i32 42, i32 45, i32 44, i32 43><o:p></o:p></p>
<p class="MsoNormal">} <o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">define <4 x i32> @merge(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">   %lower = shufflevector <4 x i32> %x, <4 x i32> undef, <2 x i32> <i32 1, i32 0><o:p></o:p></p>
<p class="MsoNormal">   %upper = shufflevector <4 x i32> %x, <4 x i32> undef, <2 x i32> <i32 2, i32 3><o:p></o:p></p>
<p class="MsoNormal">   %merged = shufflevector <2 x i32> %upper, <2 x i32> %lower, <4 x i32> <i32 3, i32 2, i32 0, i32 1><o:p></o:p></p>
<p class="MsoNormal">   ret <4 x i32> %merged<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><span style="font-family:Wingdings">à</span><o:p></o:p></p>
<p class="MsoNormal">define <4 x i32> @merge(<4 x i32> %x) {<o:p></o:p></p>
<p class="MsoNormal">  ret <4 x i32> %x<o:p></o:p></p>
<p class="MsoNormal">}<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Would appreciate your comments and feedback.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Thanks, Zvi<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<p>---------------------------------------------------------------------<br>
Intel Israel (74) Limited</p>

<p>This e-mail and any attachments may contain confidential material for<br>
the sole use of the intended recipient(s). Any review or distribution<br>
by others is strictly prohibited. If you are not the intended<br>
recipient, please contact the sender and delete all copies.</p></body>
</html>