[all-commits] [llvm/llvm-project] 0ea4fb: [AMD][ROCDL] Add packed conversions fp8/bf8->bf16 ...

Fri Mar 21 07:50:12 PDT 2025

  Branch: refs/heads/main
  Home:   https://github.com/llvm/llvm-project
  Commit: 0ea4fb92648b2aa7cbab486bb493e122b4dcc062
      https://github.com/llvm/llvm-project/commit/0ea4fb92648b2aa7cbab486bb493e122b4dcc062
  Author: Yi Qian <68618497+yiqian1 at users.noreply.github.com>
  Date:   2025-03-21 (Fri, 21 Mar 2025)

  Changed paths:
    M mlir/include/mlir/Dialect/AMDGPU/IR/AMDGPU.td
    M mlir/include/mlir/Dialect/LLVMIR/ROCDLOps.td
    M mlir/lib/Conversion/AMDGPUToROCDL/AMDGPUToROCDL.cpp
    M mlir/lib/Conversion/ArithToAMDGPU/ArithToAMDGPU.cpp
    M mlir/test/Conversion/AMDGPUToROCDL/8-bit-floats-ocp.mlir
    M mlir/test/Conversion/AMDGPUToROCDL/8-bit-floats.mlir
    M mlir/test/Conversion/ArithToAMDGPU/8-bit-floats-ocp.mlir
    M mlir/test/Conversion/ArithToAMDGPU/8-bit-floats.mlir
    M mlir/test/Dialect/AMDGPU/ops.mlir
    M mlir/test/Dialect/LLVMIR/rocdl.mlir
    M mlir/test/Target/LLVMIR/rocdl.mlir

  Log Message:
  -----------
  [AMD][ROCDL] Add packed conversions fp8/bf8->bf16 and fp8/bf8->fp32 in ROCDL dialect (#131850)

- Add packed conversions fp8/bf8->bf16 for gfx950 and fp8/bf8->fp32 for
gfx942 in ROCDL dialect
- Update amdgpu.ext_packed_fp8 lowering to use ROCDL packed fp8/bf8->f32
conversions for vector target types and ROCDL scalar fp8/bf8->fp32 for
scalar target type.

---------

Co-authored-by: Jungwook Park <jungwook.park at amd.com>


To unsubscribe from these emails, change your notification settings at https://github.com/llvm/llvm-project/settings/notifications