<table border="1" cellspacing="0" cellpadding="8">

    <tr>

        <th>Issue</th>

        <td>

            <a href=https://github.com/llvm/llvm-project/issues/115697>115697</a>

        </td>

    </tr>

    <tr>

        <th>Summary</th>

        <td>

            Missed optimisation to take advantage of commutative SVE fmul instruction

        </td>

    </tr>

    <tr>

      <th>Labels</th>

      <td>

            new issue

      </td>

    </tr>

    <tr>

      <th>Assignees</th>

      <td>

      </td>

    </tr>

    <tr>

      <th>Reporter</th>

      <td>

          ktkachov

      </td>

    </tr>

</table>

<pre>

    Example AArch64 SVE intrinsics code:

```

#include <arm_sve.h>

svfloat64_t svmul_x_2(svfloat64_t x, svfloat64_t y, svbool_t pg)

{

    return svmul_x(pg, svdup_f64(2), x);

}

```

This can generate just a singly FMUL instruction but LLVM moves the immediate 2 into a register first.

https://godbolt.org/z/11aEEGoce

</pre>

<img width="1px" height="1px" alt="" src="http://email.email.llvm.org/o/eJxsUsFunDAQ_RpzGWWFx8CyBw6bZOklObXNdWVgACcGr-wxTfr1FexGjapKCNszfu95np4OwQwzUSXye5E_Jjry6Hz1xm-6Hd2SNK77qE7verpYguPRt2ORwfeXE5iZvZmDaQO0riOhjiJ9FOlRFOntux5Rmbm1sSMQ6kH76RwW2o1CnW797R-W3jrNRXZmCMsU7fn9jALLr_V3gQ_wtfBxLTTO2TPDZRB4uHHu768bAABPHP38ySqwXC-uuC5ezn2RCSxxReLDqnAQ6v6T5PG_A_0YTYBWzzDQTF4zwWsMDBqCmQf7AfXzzycwc2AfWzZuhiYyPD29PMPkFgrAI4GZJurMisXVRwcaPA0mMHnojQ-8u2qNzJewOou1wHpwXeMs75wfBNa_BdZS6tPpm2sp6SrVHdRBJ1TJvZJK5rkqk7GSeq_6Pi9KxLJX-0bmWYEl5VQeOtofVGIqTDGTUsq0zMu83JHKZNGnMu1b1ehUiiylSRu7s3aZVu3EhBCpkjIvDvvE6oZs2NKDONMv2LoCcQ2Tr1bQXROHILLUmsDhLw0btlQ9mxCoA3dhM5mgN8fYAes3At0temY9ELgeWjdNkTWbhbb89VO0X31OorfVP4YZHmOza90ksF51b8vdxbtXallgvb02bFZu4ywV_gkAAP__thf3Tg">