<table border="1" cellspacing="0" cellpadding="8">
    <tr>
        <th>Issue</th>
        <td>
            <a href=https://github.com/llvm/llvm-project/issues/63854>63854</a>
        </td>
    </tr>

    <tr>
        <th>Summary</th>
        <td>
            [SLP][RISCV] Odd reordering of gather operands breaks stride load matching
        </td>
    </tr>

    <tr>
      <th>Labels</th>
      <td>
            llvm:SLPVectorizer
      </td>
    </tr>

    <tr>
      <th>Assignees</th>
      <td>
      </td>
    </tr>

    <tr>
      <th>Reporter</th>
      <td>
          preames
      </td>
    </tr>
</table>

<pre>
    Noticed some odd SLP behavior which is inhibiting strided load matching on RISCV. 

`clang -march=rv64gcv -target riscv64-unknown-linux-gnu -S -O3 example.c`
`cat example.c`

```
typedef signed char int8_t;

// Signed subtract which is not UB on overflow
inline int8_t sub(int8_t a, int8_t b) {
  return (int8_t)((int)a - (int)b);
}

inline int8_t myabs(int8_t c) {
  // Note: Assumes C != INT_MIN
  return (c < 0) ? sub(0,c) : c;
}

int sum_of_abs(int8_t* restrict a, int8_t* restrict b) { 
  int sum = 0; 
 for (unsigned i = 0; i < 8; i++) 
    sum += myabs(a[i*64]); 
  return sum; 
}
```
Looking at the output of `-mllvm -print-after=slp-vectorizer` here, we see something odd.  The indices of the gather have been reordered in the emitted gep.  (Looking at the output before SLP shows this reordering is definitely being done by SLP.)  The reordering is legal (as the reduction is associative), but unlikely to be profitable. 
```
  %0 = insertelement <8 x ptr> poison, ptr %a, i32 0
  %1 = shufflevector <8 x ptr> %0, <8 x ptr> poison, <8 x i32> zeroinitializer
 %2 = getelementptr i8, <8 x ptr> %1, <8 x i64> <i64 64, i64 0, i64 128, i64 192, i64 256, i64 320, i64 384, i64 448>
  %3 = call <8 x i8> @llvm.masked.gather.v8i8.v8p0(<8 x ptr> %2, i32 1, <8 x i1> <i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true, i1 true>, <8 x i8> poison), !tbaa !7
```
This has the look of a sort in place of a stable sort, or something analogous.  I did a bit of digging through SLP, but didn't find anything obvious.  
</pre>
<img width="1px" height="1px" alt="" src="http://email.email.llvm.org/o/eJysVk1v2zgQ_TX0ZSBDJiVZOviQ2A0QoJsWm26vASWOJG4oUiApp-mvX5CW_JG2twWMiB_DN2-GbybkzslOI-5Ifk_yw4pPvjd2N1rkA7pVbcT77sl42aAAZwYEIwQ8f_4KNfb8KI2Ft142PUgHUveyll7qDpy3UqAAZbiAgfumD6tGw9-Pz_vvayDpgaR3898ibRTXHSQDt01P2MEei6xrjpB4bjv0YKVrjkWWTPpVmzedKKmnH0mnJ0ieIfnCAH_wYVS4bkiRXkC5_93Gsj3_4tS_jyiwhZgKAU3PLUjtyxdP2P3NOfpA6AM8n-zcVHvLG39JgTYe_rkPgZoj2laZt9M5qZXUOGOGc4SW84QTul82akIrINvZJYBFP1kNZ2NCK0LL05TQikMC50k4e2G7PVzTvnU_vPPaXQg0H5zOMT4Zj4TdwZ1z04AO9kDohrADPD59e_nr8elXjg0Qtoc0wrGHOcqU0P3JA7uD5s8EQ1aGF9O-XHMj9A4sBjE1N4m6WV-SBgujGQwC2ZSw80ZrbKA56fma5cVCRuplHBJ6H3_VGRBOcPQ-2C_Z4yS_l4TeFRnJD6fcw4ecuGm4rF4ivtXeZ2NeQ3FwD75HMJMfJw-mBVKkyaDUcYBktFL7hLceLWEHp8bkiI03Vv5ES4oUerQYsvOG4BBjnfpTxQmxBvjWh7sXskEXgIObjvseLfT8iFAjarBorEAb0qKjBQ7SexTQ4bgOoih_T7TG1liMHcH15s2B76Vb0IK5dCCwlVp6VO9QY1gTRiPU7-HUOiQ6Mrw9o7DjKrjlLrqzKKbGS6PDJnfONJJ7ecRYEnuoJw-TVvI1OPEGaoTRmlZ6Xis895vbzIeo8jSKQGqH1qPCAbUPWijhB4zeEvYJRiOd0cHJ6IOA8pMQGYVrnE3Ecf3UtgpPt_MBJzgLJ_-EPq9LRsP6T7QmJE1yFW_55InQnEZHHS5sAylZ_gocOF3DFllcZXtZZFBkMYYig3QZbGh5HlZ0GdK8WIaMnm1ZeT6fZSVhn64SwSK_hit1dl1Gz1kaxLweuHtFsT4JcH0sZbk-lmMa-tpH_nRJ9E0gmyWODXg7Rd3_f0P26dpVeX1DUWeEbnzNefhufyuqb0H-_SxaZcxrqDgOzlgfKmtUvMF5KWoz7gRkY6_qlmuuTGcmtwZ4BCEFcKhlbAtCdl0w8b01U9eHGloKQEihCd16aKUWwPX73ATqozxBrcSOiYpVfIW7TVFWtNxmNF_1u6riDU2rkm3LlBasEdUmx01a5UVbiYZVK7mjKWXpdsMoZSnN1lua0k29aVtaZpymW5KlOHCp1vGSje1W0rkJdwUr82yleI3KxTcGpcGCsLvnz1-_X7oYpeH1YXdhM6mnzgW9SOfdBdBLr-I7JYScH0h-H18TJD_AFyGu-4dplwZnRrRcCwe1Rf7q5ofJ7btkNVm1670fHWHzf_hO-n6q140ZCH2IfE-fZLTmX2w8oQ8xPEfoQ4zwvwAAAP__CjrF7w">