<html>
    <head>
      <base href="https://bugs.llvm.org/">
    </head>
    <body><table border="1" cellspacing="0" cellpadding="8">
        <tr>
          <th>Bug ID</th>
          <td><a class="bz_bug_link 
          bz_status_NEW "
   title="NEW - Unaligned read followed by bswap generates suboptimal code"
   href="https://bugs.llvm.org/show_bug.cgi?id=48970">48970</a>
          </td>
        </tr>

        <tr>
          <th>Summary</th>
          <td>Unaligned read followed by bswap generates suboptimal code
          </td>
        </tr>

        <tr>
          <th>Product</th>
          <td>libraries
          </td>
        </tr>

        <tr>
          <th>Version</th>
          <td>11.0
          </td>
        </tr>

        <tr>
          <th>Hardware</th>
          <td>PC
          </td>
        </tr>

        <tr>
          <th>OS</th>
          <td>Linux
          </td>
        </tr>

        <tr>
          <th>Status</th>
          <td>NEW
          </td>
        </tr>

        <tr>
          <th>Severity</th>
          <td>enhancement
          </td>
        </tr>

        <tr>
          <th>Priority</th>
          <td>P
          </td>
        </tr>

        <tr>
          <th>Component</th>
          <td>Backend: RISC-V
          </td>
        </tr>

        <tr>
          <th>Assignee</th>
          <td>unassignedbugs@nondot.org
          </td>
        </tr>

        <tr>
          <th>Reporter</th>
          <td>eduardosanchezmunoz@gmail.com
          </td>
        </tr>

        <tr>
          <th>CC</th>
          <td>asb@lowrisc.org, llvm-bugs@lists.llvm.org
          </td>
        </tr></table>
      <p>
        <div>
        <pre>On RISC-V, an unaligned read followed by a bswap produces suboptimal code.

Given the following IR:

declare i16 @llvm.bswap.i16(i16)
define i16 @read(i16* %p) {
start:
  %v = load i16, i16* %p, align 1
  ret i16 %v
}
define i16 @read_swap(i16* %p) {
start:
  %v = load i16, i16* %p, align 1
  %v2 = tail call i16 @llvm.bswap.i16(i16 %v)
  ret i16 %v2
}

compiled with llc -mtriple=riscv64-unknown-linux-gnu -O3

it produces the following assembly:

read:
        lb      a1, 1(a0)
        lbu     a0, 0(a0)
        slli    a1, a1, 8
        or      a0, a0, a1
        ret
read_swap:
        lb      a1, 1(a0)
        lbu     a0, 0(a0)
        slli    a1, a1, 8
        or      a0, a0, a1
        slli    a1, a0, 40
        addi    a2, zero, 255
        slli    a2, a2, 48
        and     a1, a1, a2
        slli    a0, a0, 56
        or      a0, a0, a1
        srli    a0, a0, 48
        ret

The code for read is generated as expected. However, the code for read_swap can
be simplified to:

read_swap:
        lb      a1, 0(a0)
        lbu     a0, 1(a0)
        slli    a1, a1, 8
        or      a0, a0, a1
        ret</pre>
        </div>
      </p>


      <hr>
      <span>You are receiving this mail because:</span>

      <ul>
          <li>You are on the CC list for the bug.</li>
      </ul>
    </body>
</html>