[llvm] [CodeGen][Float8] Add float8 MVT type (PR #89901)

Wed Apr 24 02:38:00 PDT 2024

https://github.com/JinjinLi868 created https://github.com/llvm/llvm-project/pull/89901

This patch adds float8(e4m3fn and e5m2) MVT support. It also adds
fixed and scalable vector MVT types for float8.


>From 0ea96860a079b4dafe691723dfe8b4220ce1ef2d Mon Sep 17 00:00:00 2001
From: Jinjin Li <lijinjin.868 at bytedance.com>
Date: Wed, 24 Apr 2024 10:59:55 +0800
Subject: [PATCH] [CodeGen][Float8] Add float8 MVT type

This patch adds float8(e4m3fn and e5m2) MVT support. It also adds
fixed and scalable vector MVT types for float8.
---
 llvm/include/llvm/CodeGen/SelectionDAG.h      |   2 +
 llvm/include/llvm/CodeGen/ValueTypes.td       | 464 ++++++++++--------
 .../llvm/CodeGenTypes/MachineValueType.h      |   2 +-
 llvm/include/llvm/IR/Intrinsics.td            |   2 +
 llvm/lib/CodeGen/ValueTypes.cpp               |  86 +++-
 llvm/utils/TableGen/Common/CodeGenTarget.cpp  |  36 ++
 llvm/utils/TableGen/VTEmitter.cpp             |   2 +-
 7 files changed, 374 insertions(+), 220 deletions(-)

diff --git a/llvm/include/llvm/CodeGen/SelectionDAG.h b/llvm/include/llvm/CodeGen/SelectionDAG.h
index f347131be080f6..77d177e4462661 100644
--- a/llvm/include/llvm/CodeGen/SelectionDAG.h
+++ b/llvm/include/llvm/CodeGen/SelectionDAG.h
@@ -1798,6 +1798,8 @@ class SelectionDAG {
   static const fltSemantics &EVTToAPFloatSemantics(EVT VT) {
     switch (VT.getScalarType().getSimpleVT().SimpleTy) {
     default: llvm_unreachable("Unknown FP format");
+    case MVT::f8e4m3fn:  return APFloat::Float8E4M3FN();
+    case MVT::f8e5m2:  return APFloat::Float8E5M2();
     case MVT::f16:     return APFloat::IEEEhalf();
     case MVT::bf16:    return APFloat::BFloat();
     case MVT::f32:     return APFloat::IEEEsingle();
diff --git a/llvm/include/llvm/CodeGen/ValueTypes.td b/llvm/include/llvm/CodeGen/ValueTypes.td
index 900b30d9b02492..ae1eb7e99ad23f 100644
--- a/llvm/include/llvm/CodeGen/ValueTypes.td
+++ b/llvm/include/llvm/CodeGen/ValueTypes.td
@@ -68,223 +68,263 @@ def i32     : VTInt<32,  7>;  // 32-bit integer value
 def i64     : VTInt<64,  8>;  // 64-bit integer value
 def i128    : VTInt<128, 9>;  // 128-bit integer value
 
-def bf16    : VTFP<16,  10>;  // 16-bit brain floating point value
-def f16     : VTFP<16,  11>;  // 16-bit floating point value
-def f32     : VTFP<32,  12>;  // 32-bit floating point value
-def f64     : VTFP<64,  13>;  // 64-bit floating point value
-def f80     : VTFP<80,  14>;  // 80-bit floating point value
-def f128    : VTFP<128, 15>;  // 128-bit floating point value
-def ppcf128 : VTFP<128, 16>;  // PPC 128-bit floating point value
-
-def v1i1    : VTVec<1,    i1, 17>;  //    1 x i1 vector value
-def v2i1    : VTVec<2,    i1, 18>;  //    2 x i1 vector value
-def v3i1    : VTVec<3,    i1, 19>;  //    3 x i1 vector value
-def v4i1    : VTVec<4,    i1, 20>;  //    4 x i1 vector value
-def v8i1    : VTVec<8,    i1, 21>;  //    8 x i1 vector value
-def v16i1   : VTVec<16,   i1, 22>;  //   16 x i1 vector value
-def v32i1   : VTVec<32,   i1, 23>;  //   32 x i1 vector value
-def v64i1   : VTVec<64,   i1, 24>;  //   64 x i1 vector value
-def v128i1  : VTVec<128,  i1, 25>;  //  128 x i1 vector value
-def v256i1  : VTVec<256,  i1, 26>;  //  256 x i1 vector value
-def v512i1  : VTVec<512,  i1, 27>;  //  512 x i1 vector value
-def v1024i1 : VTVec<1024, i1, 28>;  // 1024 x i1 vector value
-def v2048i1 : VTVec<2048, i1, 29>;  // 2048 x i1 vector value
-
-def v128i2  : VTVec<128,  i2, 30>;   //  128 x i2 vector value
-def v256i2  : VTVec<256,  i2, 31>;   //  256 x i2 vector value
-
-def v64i4   : VTVec<64,   i4, 32>;   //   64 x i4 vector value
-def v128i4  : VTVec<128,  i4, 33>;   //  128 x i4 vector value
-
-def v1i8    : VTVec<1,    i8, 34>;  //    1 x i8 vector value
-def v2i8    : VTVec<2,    i8, 35>;  //    2 x i8 vector value
-def v3i8    : VTVec<3,    i8, 36>;  //    3 x i8 vector value
-def v4i8    : VTVec<4,    i8, 37>;  //    4 x i8 vector value
-def v8i8    : VTVec<8,    i8, 38>;  //    8 x i8 vector value
-def v16i8   : VTVec<16,   i8, 39>;  //   16 x i8 vector value
-def v32i8   : VTVec<32,   i8, 40>;  //   32 x i8 vector value
-def v64i8   : VTVec<64,   i8, 41>;  //   64 x i8 vector value
-def v128i8  : VTVec<128,  i8, 42>;  //  128 x i8 vector value
-def v256i8  : VTVec<256,  i8, 43>;  //  256 x i8 vector value
-def v512i8  : VTVec<512,  i8, 44>;  //  512 x i8 vector value
-def v1024i8 : VTVec<1024, i8, 45>;  // 1024 x i8 vector value
-
-def v1i16   : VTVec<1,   i16, 46>;  //   1 x i16 vector value
-def v2i16   : VTVec<2,   i16, 47>;  //   2 x i16 vector value
-def v3i16   : VTVec<3,   i16, 48>;  //   3 x i16 vector value
-def v4i16   : VTVec<4,   i16, 49>;  //   4 x i16 vector value
-def v8i16   : VTVec<8,   i16, 50>;  //   8 x i16 vector value
-def v16i16  : VTVec<16,  i16, 51>;  //  16 x i16 vector value
-def v32i16  : VTVec<32,  i16, 52>;  //  32 x i16 vector value
-def v64i16  : VTVec<64,  i16, 53>;  //  64 x i16 vector value
-def v128i16 : VTVec<128, i16, 54>;  // 128 x i16 vector value
-def v256i16 : VTVec<256, i16, 55>;  // 256 x i16 vector value
-def v512i16 : VTVec<512, i16, 56>;  // 512 x i16 vector value
-
-def v1i32    : VTVec<1,    i32, 57>;  //    1 x i32 vector value
-def v2i32    : VTVec<2,    i32, 58>;  //    2 x i32 vector value
-def v3i32    : VTVec<3,    i32, 59>;  //    3 x i32 vector value
-def v4i32    : VTVec<4,    i32, 60>;  //    4 x i32 vector value
-def v5i32    : VTVec<5,    i32, 61>;  //    5 x i32 vector value
-def v6i32    : VTVec<6,    i32, 62>;  //    6 x f32 vector value
-def v7i32    : VTVec<7,    i32, 63>;  //    7 x f32 vector value
-def v8i32    : VTVec<8,    i32, 64>;  //    8 x i32 vector value
-def v9i32    : VTVec<9,    i32, 65>;  //    9 x i32 vector value
-def v10i32   : VTVec<10,   i32, 66>;  //   10 x i32 vector value
-def v11i32   : VTVec<11,   i32, 67>;  //   11 x i32 vector value
-def v12i32   : VTVec<12,   i32, 68>;  //   12 x i32 vector value
-def v16i32   : VTVec<16,   i32, 69>;  //   16 x i32 vector value
-def v32i32   : VTVec<32,   i32, 70>;  //   32 x i32 vector value
-def v64i32   : VTVec<64,   i32, 71>;  //   64 x i32 vector value
-def v128i32  : VTVec<128,  i32, 72>;  //  128 x i32 vector value
-def v256i32  : VTVec<256,  i32, 73>;  //  256 x i32 vector value
-def v512i32  : VTVec<512,  i32, 74>;  //  512 x i32 vector value
-def v1024i32 : VTVec<1024, i32, 75>;  // 1024 x i32 vector value
-def v2048i32 : VTVec<2048, i32, 76>;  // 2048 x i32 vector value
-
-def v1i64   : VTVec<1,   i64, 77>;  //   1 x i64 vector value
-def v2i64   : VTVec<2,   i64, 78>;  //   2 x i64 vector value
-def v3i64   : VTVec<3,   i64, 79>;  //   3 x i64 vector value
-def v4i64   : VTVec<4,   i64, 80>;  //   4 x i64 vector value
-def v8i64   : VTVec<8,   i64, 81>;  //   8 x i64 vector value
-def v16i64  : VTVec<16,  i64, 82>;  //  16 x i64 vector value
-def v32i64  : VTVec<32,  i64, 83>;  //  32 x i64 vector value
-def v64i64  : VTVec<64,  i64, 84>;  //  64 x i64 vector value
-def v128i64 : VTVec<128, i64, 85>;  // 128 x i64 vector value
-def v256i64 : VTVec<256, i64, 86>;  // 256 x i64 vector value
-
-def v1i128  : VTVec<1,  i128, 87>;  //  1 x i128 vector value
-
-def v1f16    : VTVec<1,    f16,  88>;  //    1 x f16 vector value
-def v2f16    : VTVec<2,    f16,  89>;  //    2 x f16 vector value
-def v3f16    : VTVec<3,    f16,  90>;  //    3 x f16 vector value
-def v4f16    : VTVec<4,    f16,  91>;  //    4 x f16 vector value
-def v8f16    : VTVec<8,    f16,  92>;  //    8 x f16 vector value
-def v16f16   : VTVec<16,   f16,  93>;  //   16 x f16 vector value
-def v32f16   : VTVec<32,   f16,  94>;  //   32 x f16 vector value
-def v64f16   : VTVec<64,   f16,  95>;  //   64 x f16 vector value
-def v128f16  : VTVec<128,  f16,  96>;  //  128 x f16 vector value
-def v256f16  : VTVec<256,  f16,  97>;  //  256 x f16 vector value
-def v512f16  : VTVec<512,  f16,  98>;  //  512 x f16 vector value
-
-def v2bf16   : VTVec<2,   bf16,  99>;  //    2 x bf16 vector value
-def v3bf16   : VTVec<3,   bf16, 100>;  //    3 x bf16 vector value
-def v4bf16   : VTVec<4,   bf16, 101>;  //    4 x bf16 vector value
-def v8bf16   : VTVec<8,   bf16, 102>;  //    8 x bf16 vector value
-def v16bf16  : VTVec<16,  bf16, 103>;  //   16 x bf16 vector value
-def v32bf16  : VTVec<32,  bf16, 104>;  //   32 x bf16 vector value
-def v64bf16  : VTVec<64,  bf16, 105>;  //   64 x bf16 vector value
-def v128bf16 : VTVec<128, bf16, 106>;  //  128 x bf16 vector value
-
-def v1f32    : VTVec<1,    f32, 107>;  //    1 x f32 vector value
-def v2f32    : VTVec<2,    f32, 108>;  //    2 x f32 vector value
-def v3f32    : VTVec<3,    f32, 109>;  //    3 x f32 vector value
-def v4f32    : VTVec<4,    f32, 110>;  //    4 x f32 vector value
-def v5f32    : VTVec<5,    f32, 111>;  //    5 x f32 vector value
-def v6f32    : VTVec<6,    f32, 112>;  //    6 x f32 vector value
-def v7f32    : VTVec<7,    f32, 113>;  //    7 x f32 vector value
-def v8f32    : VTVec<8,    f32, 114>;  //    8 x f32 vector value
-def v9f32    : VTVec<9,    f32, 115>;  //    9 x f32 vector value
-def v10f32   : VTVec<10,   f32, 116>;  //   10 x f32 vector value
-def v11f32   : VTVec<11,   f32, 117>;  //   11 x f32 vector value
-def v12f32   : VTVec<12,   f32, 118>;  //   12 x f32 vector value
-def v16f32   : VTVec<16,   f32, 119>;  //   16 x f32 vector value
-def v32f32   : VTVec<32,   f32, 120>;  //   32 x f32 vector value
-def v64f32   : VTVec<64,   f32, 121>;  //   64 x f32 vector value
-def v128f32  : VTVec<128,  f32, 122>;  //  128 x f32 vector value
-def v256f32  : VTVec<256,  f32, 123>;  //  256 x f32 vector value
-def v512f32  : VTVec<512,  f32, 124>;  //  512 x f32 vector value
-def v1024f32 : VTVec<1024, f32, 125>;  // 1024 x f32 vector value
-def v2048f32 : VTVec<2048, f32, 126>;  // 2048 x f32 vector value
-
-def v1f64    : VTVec<1,    f64, 127>;  //    1 x f64 vector value
-def v2f64    : VTVec<2,    f64, 128>;  //    2 x f64 vector value
-def v3f64    : VTVec<3,    f64, 129>;  //    3 x f64 vector value
-def v4f64    : VTVec<4,    f64, 130>;  //    4 x f64 vector value
-def v8f64    : VTVec<8,    f64, 131>;  //    8 x f64 vector value
-def v16f64   : VTVec<16,   f64, 132>;  //   16 x f64 vector value
-def v32f64   : VTVec<32,   f64, 133>;  //   32 x f64 vector value
-def v64f64   : VTVec<64,   f64, 134>;  //   64 x f64 vector value
-def v128f64  : VTVec<128,  f64, 135>;  //  128 x f64 vector value
-def v256f64  : VTVec<256,  f64, 136>;  //  256 x f64 vector value
-
-def nxv1i1  : VTScalableVec<1,  i1, 137>;  // n x  1 x i1  vector value
-def nxv2i1  : VTScalableVec<2,  i1, 138>;  // n x  2 x i1  vector value
-def nxv4i1  : VTScalableVec<4,  i1, 139>;  // n x  4 x i1  vector value
-def nxv8i1  : VTScalableVec<8,  i1, 140>;  // n x  8 x i1  vector value
-def nxv16i1 : VTScalableVec<16, i1, 141>;  // n x 16 x i1  vector value
-def nxv32i1 : VTScalableVec<32, i1, 142>;  // n x 32 x i1  vector value
-def nxv64i1 : VTScalableVec<64, i1, 143>;  // n x 64 x i1  vector value
-
-def nxv1i8  : VTScalableVec<1,  i8, 144>;  // n x  1 x i8  vector value
-def nxv2i8  : VTScalableVec<2,  i8, 145>;  // n x  2 x i8  vector value
-def nxv4i8  : VTScalableVec<4,  i8, 146>;  // n x  4 x i8  vector value
-def nxv8i8  : VTScalableVec<8,  i8, 147>;  // n x  8 x i8  vector value
-def nxv16i8 : VTScalableVec<16, i8, 148>;  // n x 16 x i8  vector value
-def nxv32i8 : VTScalableVec<32, i8, 149>;  // n x 32 x i8  vector value
-def nxv64i8 : VTScalableVec<64, i8, 150>;  // n x 64 x i8  vector value
-
-def nxv1i16  : VTScalableVec<1,  i16, 151>;  // n x  1 x i16 vector value
-def nxv2i16  : VTScalableVec<2,  i16, 152>;  // n x  2 x i16 vector value
-def nxv4i16  : VTScalableVec<4,  i16, 153>;  // n x  4 x i16 vector value
-def nxv8i16  : VTScalableVec<8,  i16, 154>;  // n x  8 x i16 vector value
-def nxv16i16 : VTScalableVec<16, i16, 155>;  // n x 16 x i16 vector value
-def nxv32i16 : VTScalableVec<32, i16, 156>;  // n x 32 x i16 vector value
-
-def nxv1i32  : VTScalableVec<1,  i32, 157>;  // n x  1 x i32 vector value
-def nxv2i32  : VTScalableVec<2,  i32, 158>;  // n x  2 x i32 vector value
-def nxv4i32  : VTScalableVec<4,  i32, 159>;  // n x  4 x i32 vector value
-def nxv8i32  : VTScalableVec<8,  i32, 160>;  // n x  8 x i32 vector value
-def nxv16i32 : VTScalableVec<16, i32, 161>;  // n x 16 x i32 vector value
-def nxv32i32 : VTScalableVec<32, i32, 162>;  // n x 32 x i32 vector value
-
-def nxv1i64  : VTScalableVec<1,  i64, 163>;  // n x  1 x i64 vector value
-def nxv2i64  : VTScalableVec<2,  i64, 164>;  // n x  2 x i64 vector value
-def nxv4i64  : VTScalableVec<4,  i64, 165>;  // n x  4 x i64 vector value
-def nxv8i64  : VTScalableVec<8,  i64, 166>;  // n x  8 x i64 vector value
-def nxv16i64 : VTScalableVec<16, i64, 167>;  // n x 16 x i64 vector value
-def nxv32i64 : VTScalableVec<32, i64, 168>;  // n x 32 x i64 vector value
-
-def nxv1f16  : VTScalableVec<1,  f16, 169>;  // n x  1 x  f16 vector value
-def nxv2f16  : VTScalableVec<2,  f16, 170>;  // n x  2 x  f16 vector value
-def nxv4f16  : VTScalableVec<4,  f16, 171>;  // n x  4 x  f16 vector value
-def nxv8f16  : VTScalableVec<8,  f16, 172>;  // n x  8 x  f16 vector value
-def nxv16f16 : VTScalableVec<16, f16, 173>;  // n x 16 x  f16 vector value
-def nxv32f16 : VTScalableVec<32, f16, 174>;  // n x 32 x  f16 vector value
-
-def nxv1bf16  : VTScalableVec<1,  bf16, 175>;  // n x  1 x bf16 vector value
-def nxv2bf16  : VTScalableVec<2,  bf16, 176>;  // n x  2 x bf16 vector value
-def nxv4bf16  : VTScalableVec<4,  bf16, 177>;  // n x  4 x bf16 vector value
-def nxv8bf16  : VTScalableVec<8,  bf16, 178>;  // n x  8 x bf16 vector value
-def nxv16bf16 : VTScalableVec<16, bf16, 179>;  // n x 16 x bf16 vector value
-def nxv32bf16 : VTScalableVec<32, bf16, 180>;  // n x 32 x bf16 vector value
-
-def nxv1f32  : VTScalableVec<1,  f32, 181>;  // n x  1 x  f32 vector value
-def nxv2f32  : VTScalableVec<2,  f32, 182>;  // n x  2 x  f32 vector value
-def nxv4f32  : VTScalableVec<4,  f32, 183>;  // n x  4 x  f32 vector value
-def nxv8f32  : VTScalableVec<8,  f32, 184>;  // n x  8 x  f32 vector value
-def nxv16f32 : VTScalableVec<16, f32, 185>;  // n x 16 x  f32 vector value
-
-def nxv1f64  : VTScalableVec<1,  f64, 186>;  // n x  1 x  f64 vector value
-def nxv2f64  : VTScalableVec<2,  f64, 187>;  // n x  2 x  f64 vector value
-def nxv4f64  : VTScalableVec<4,  f64, 188>;  // n x  4 x  f64 vector value
-def nxv8f64  : VTScalableVec<8,  f64, 189>;  // n x  8 x  f64 vector value
-
-def x86mmx    : ValueType<64,   190>;  // X86 MMX value
-def FlagVT    : ValueType<0,    191> { // Pre-RA sched glue
+def f8e4m3fn: VTFP<8,   10>;  // 8-bit floating point value
+def f8e5m2  : VTFP<8,   11>;  // 8-bit floating point value
+def bf16    : VTFP<16,  12>;  // 16-bit brain floating point value
+def f16     : VTFP<16,  13>;  // 16-bit floating point value
+def f32     : VTFP<32,  14>;  // 32-bit floating point value
+def f64     : VTFP<64,  15>;  // 64-bit floating point value
+def f80     : VTFP<80,  16>;  // 80-bit floating point value
+def f128    : VTFP<128, 17>;  // 128-bit floating point value
+def ppcf128 : VTFP<128, 18>;  // PPC 128-bit floating point value
+
+def v1i1    : VTVec<1,    i1, 19>;  //    1 x i1 vector value
+def v2i1    : VTVec<2,    i1, 20>;  //    2 x i1 vector value
+def v3i1    : VTVec<3,    i1, 21>;  //    3 x i1 vector value
+def v4i1    : VTVec<4,    i1, 22>;  //    4 x i1 vector value
+def v8i1    : VTVec<8,    i1, 23>;  //    8 x i1 vector value
+def v16i1   : VTVec<16,   i1, 24>;  //   16 x i1 vector value
+def v32i1   : VTVec<32,   i1, 25>;  //   32 x i1 vector value
+def v64i1   : VTVec<64,   i1, 26>;  //   64 x i1 vector value
+def v128i1  : VTVec<128,  i1, 27>;  //  128 x i1 vector value
+def v256i1  : VTVec<256,  i1, 28>;  //  256 x i1 vector value
+def v512i1  : VTVec<512,  i1, 29>;  //  512 x i1 vector value
+def v1024i1 : VTVec<1024, i1, 30>;  // 1024 x i1 vector value
+def v2048i1 : VTVec<2048, i1, 31>;  // 2048 x i1 vector value
+
+def v128i2  : VTVec<128,  i2, 32>;   //  128 x i2 vector value
+def v256i2  : VTVec<256,  i2, 33>;   //  256 x i2 vector value
+
+def v64i4   : VTVec<64,   i4, 34>;   //   64 x i4 vector value
+def v128i4  : VTVec<128,  i4, 35>;   //  128 x i4 vector value
+
+def v1i8    : VTVec<1,    i8, 36>;  //    1 x i8 vector value
+def v2i8    : VTVec<2,    i8, 37>;  //    2 x i8 vector value
+def v3i8    : VTVec<3,    i8, 38>;  //    3 x i8 vector value
+def v4i8    : VTVec<4,    i8, 39>;  //    4 x i8 vector value
+def v8i8    : VTVec<8,    i8, 40>;  //    8 x i8 vector value
+def v16i8   : VTVec<16,   i8, 41>;  //   16 x i8 vector value
+def v32i8   : VTVec<32,   i8, 42>;  //   32 x i8 vector value
+def v64i8   : VTVec<64,   i8, 43>;  //   64 x i8 vector value
+def v128i8  : VTVec<128,  i8, 44>;  //  128 x i8 vector value
+def v256i8  : VTVec<256,  i8, 45>;  //  256 x i8 vector value
+def v512i8  : VTVec<512,  i8, 46>;  //  512 x i8 vector value
+def v1024i8 : VTVec<1024, i8, 47>;  // 1024 x i8 vector value
+
+def v1i16   : VTVec<1,   i16, 48>;  //   1 x i16 vector value
+def v2i16   : VTVec<2,   i16, 49>;  //   2 x i16 vector value
+def v3i16   : VTVec<3,   i16, 50>;  //   3 x i16 vector value
+def v4i16   : VTVec<4,   i16, 51>;  //   4 x i16 vector value
+def v8i16   : VTVec<8,   i16, 52>;  //   8 x i16 vector value
+def v16i16  : VTVec<16,  i16, 53>;  //  16 x i16 vector value
+def v32i16  : VTVec<32,  i16, 54>;  //  32 x i16 vector value
+def v64i16  : VTVec<64,  i16, 55>;  //  64 x i16 vector value
+def v128i16 : VTVec<128, i16, 56>;  // 128 x i16 vector value
+def v256i16 : VTVec<256, i16, 57>;  // 256 x i16 vector value
+def v512i16 : VTVec<512, i16, 58>;  // 512 x i16 vector value
+
+def v1i32    : VTVec<1,    i32, 59>;  //    1 x i32 vector value
+def v2i32    : VTVec<2,    i32, 60>;  //    2 x i32 vector value
+def v3i32    : VTVec<3,    i32, 61>;  //    3 x i32 vector value
+def v4i32    : VTVec<4,    i32, 62>;  //    4 x i32 vector value
+def v5i32    : VTVec<5,    i32, 63>;  //    5 x i32 vector value
+def v6i32    : VTVec<6,    i32, 64>;  //    6 x f32 vector value
+def v7i32    : VTVec<7,    i32, 65>;  //    7 x f32 vector value
+def v8i32    : VTVec<8,    i32, 66>;  //    8 x i32 vector value
+def v9i32    : VTVec<9,    i32, 67>;  //    9 x i32 vector value
+def v10i32   : VTVec<10,   i32, 68>;  //   10 x i32 vector value
+def v11i32   : VTVec<11,   i32, 69>;  //   11 x i32 vector value
+def v12i32   : VTVec<12,   i32, 70>;  //   12 x i32 vector value
+def v16i32   : VTVec<16,   i32, 71>;  //   16 x i32 vector value
+def v32i32   : VTVec<32,   i32, 72>;  //   32 x i32 vector value
+def v64i32   : VTVec<64,   i32, 73>;  //   64 x i32 vector value
+def v128i32  : VTVec<128,  i32, 74>;  //  128 x i32 vector value
+def v256i32  : VTVec<256,  i32, 75>;  //  256 x i32 vector value
+def v512i32  : VTVec<512,  i32, 76>;  //  512 x i32 vector value
+def v1024i32 : VTVec<1024, i32, 77>;  // 1024 x i32 vector value
+def v2048i32 : VTVec<2048, i32, 78>;  // 2048 x i32 vector value
+
+def v1i64   : VTVec<1,   i64, 79>;  //   1 x i64 vector value
+def v2i64   : VTVec<2,   i64, 80>;  //   2 x i64 vector value
+def v3i64   : VTVec<3,   i64, 81>;  //   3 x i64 vector value
+def v4i64   : VTVec<4,   i64, 82>;  //   4 x i64 vector value
+def v8i64   : VTVec<8,   i64, 83>;  //   8 x i64 vector value
+def v16i64  : VTVec<16,  i64, 84>;  //  16 x i64 vector value
+def v32i64  : VTVec<32,  i64, 85>;  //  32 x i64 vector value
+def v64i64  : VTVec<64,  i64, 86>;  //  64 x i64 vector value
+def v128i64 : VTVec<128, i64, 87>;  // 128 x i64 vector value
+def v256i64 : VTVec<256, i64, 88>;  // 256 x i64 vector value
+
+def v1i128  : VTVec<1,  i128, 89>;  //  1 x i128 vector value
+
+def v1f8e4m3fn    : VTVec<1,    f8e4m3fn,  90>;  //    1 x f8e4m3fn vector value
+def v2f8e4m3fn    : VTVec<2,    f8e4m3fn,  91>;  //    2 x f8e4m3fn vector value
+def v3f8e4m3fn    : VTVec<3,    f8e4m3fn,  92>;  //    3 x f8e4m3fn vector value
+def v4f8e4m3fn    : VTVec<4,    f8e4m3fn,  93>;  //    4 x f8e4m3fn vector value
+def v8f8e4m3fn    : VTVec<8,    f8e4m3fn,  94>;  //    8 x f8e4m3fn vector value
+def v16f8e4m3fn   : VTVec<16,   f8e4m3fn,  95>;  //   16 x f8e4m3fn vector value
+def v32f8e4m3fn   : VTVec<32,   f8e4m3fn,  96>;  //   32 x f8e4m3fn vector value
+def v64f8e4m3fn   : VTVec<64,   f8e4m3fn,  97>;  //   64 x f8e4m3fn vector value
+def v128f8e4m3fn  : VTVec<128,  f8e4m3fn,  98>;  //  128 x f8e4m3fn vector value
+def v256f8e4m3fn  : VTVec<256,  f8e4m3fn,  99>;  //  256 x f8e4m3fn vector value
+def v512f8e4m3fn  : VTVec<512,  f8e4m3fn,  100>;  //  512 x f8e4m3fn vector value
+
+def v1f8e5m2    : VTVec<1,    f8e5m2,  101>;  //    1 x f8e5m2 vector value
+def v2f8e5m2    : VTVec<2,    f8e5m2,  102>;  //    2 x f8e5m2 vector value
+def v3f8e5m2    : VTVec<3,    f8e5m2,  103>;  //    3 x f8e5m2 vector value
+def v4f8e5m2    : VTVec<4,    f8e5m2,  104>;  //    4 x f8e5m2 vector value
+def v8f8e5m2    : VTVec<8,    f8e5m2,  105>;  //    8 x f8e5m2 vector value
+def v16f8e5m2   : VTVec<16,   f8e5m2,  106>;  //   16 x f8e5m2 vector value
+def v32f8e5m2   : VTVec<32,   f8e5m2,  107>;  //   32 x f8e5m2 vector value
+def v64f8e5m2   : VTVec<64,   f8e5m2,  108>;  //   64 x f8e5m2 vector value
+def v128f8e5m2  : VTVec<128,  f8e5m2,  109>;  //  128 x f8e5m2 vector value
+def v256f8e5m2  : VTVec<256,  f8e5m2,  110>;  //  256 x f8e5m2 vector value
+def v512f8e5m2  : VTVec<512,  f8e5m2,  111>;  //  512 x f8e5m2 vector value
+
+def v1f16    : VTVec<1,    f16,  112>;  //    1 x f16 vector value
+def v2f16    : VTVec<2,    f16,  113>;  //    2 x f16 vector value
+def v3f16    : VTVec<3,    f16,  114>;  //    3 x f16 vector value
+def v4f16    : VTVec<4,    f16,  115>;  //    4 x f16 vector value
+def v8f16    : VTVec<8,    f16,  116>;  //    8 x f16 vector value
+def v16f16   : VTVec<16,   f16,  117>;  //   16 x f16 vector value
+def v32f16   : VTVec<32,   f16,  118>;  //   32 x f16 vector value
+def v64f16   : VTVec<64,   f16,  119>;  //   64 x f16 vector value
+def v128f16  : VTVec<128,  f16,  120>;  //  128 x f16 vector value
+def v256f16  : VTVec<256,  f16,  121>;  //  256 x f16 vector value
+def v512f16  : VTVec<512,  f16,  122>;  //  512 x f16 vector value
+
+def v2bf16   : VTVec<2,   bf16,  123>;  //    2 x bf16 vector value
+def v3bf16   : VTVec<3,   bf16, 124>;  //    3 x bf16 vector value
+def v4bf16   : VTVec<4,   bf16, 125>;  //    4 x bf16 vector value
+def v8bf16   : VTVec<8,   bf16, 126>;  //    8 x bf16 vector value
+def v16bf16  : VTVec<16,  bf16, 127>;  //   16 x bf16 vector value
+def v32bf16  : VTVec<32,  bf16, 128>;  //   32 x bf16 vector value
+def v64bf16  : VTVec<64,  bf16, 129>;  //   64 x bf16 vector value
+def v128bf16 : VTVec<128, bf16, 130>;  //  128 x bf16 vector value
+
+def v1f32    : VTVec<1,    f32, 131>;  //    1 x f32 vector value
+def v2f32    : VTVec<2,    f32, 132>;  //    2 x f32 vector value
+def v3f32    : VTVec<3,    f32, 133>;  //    3 x f32 vector value
+def v4f32    : VTVec<4,    f32, 134>;  //    4 x f32 vector value
+def v5f32    : VTVec<5,    f32, 135>;  //    5 x f32 vector value
+def v6f32    : VTVec<6,    f32, 136>;  //    6 x f32 vector value
+def v7f32    : VTVec<7,    f32, 137>;  //    7 x f32 vector value
+def v8f32    : VTVec<8,    f32, 138>;  //    8 x f32 vector value
+def v9f32    : VTVec<9,    f32, 139>;  //    9 x f32 vector value
+def v10f32   : VTVec<10,   f32, 140>;  //   10 x f32 vector value
+def v11f32   : VTVec<11,   f32, 141>;  //   11 x f32 vector value
+def v12f32   : VTVec<12,   f32, 142>;  //   12 x f32 vector value
+def v16f32   : VTVec<16,   f32, 143>;  //   16 x f32 vector value
+def v32f32   : VTVec<32,   f32, 144>;  //   32 x f32 vector value
+def v64f32   : VTVec<64,   f32, 145>;  //   64 x f32 vector value
+def v128f32  : VTVec<128,  f32, 146>;  //  128 x f32 vector value
+def v256f32  : VTVec<256,  f32, 147>;  //  256 x f32 vector value
+def v512f32  : VTVec<512,  f32, 148>;  //  512 x f32 vector value
+def v1024f32 : VTVec<1024, f32, 149>;  // 1024 x f32 vector value
+def v2048f32 : VTVec<2048, f32, 150>;  // 2048 x f32 vector value
+
+def v1f64    : VTVec<1,    f64, 151>;  //    1 x f64 vector value
+def v2f64    : VTVec<2,    f64, 152>;  //    2 x f64 vector value
+def v3f64    : VTVec<3,    f64, 153>;  //    3 x f64 vector value
+def v4f64    : VTVec<4,    f64, 154>;  //    4 x f64 vector value
+def v8f64    : VTVec<8,    f64, 155>;  //    8 x f64 vector value
+def v16f64   : VTVec<16,   f64, 156>;  //   16 x f64 vector value
+def v32f64   : VTVec<32,   f64, 157>;  //   32 x f64 vector value
+def v64f64   : VTVec<64,   f64, 158>;  //   64 x f64 vector value
+def v128f64  : VTVec<128,  f64, 159>;  //  128 x f64 vector value
+def v256f64  : VTVec<256,  f64, 160>;  //  256 x f64 vector value
+
+def nxv1i1  : VTScalableVec<1,  i1, 161>;  // n x  1 x i1  vector value
+def nxv2i1  : VTScalableVec<2,  i1, 162>;  // n x  2 x i1  vector value
+def nxv4i1  : VTScalableVec<4,  i1, 163>;  // n x  4 x i1  vector value
+def nxv8i1  : VTScalableVec<8,  i1, 164>;  // n x  8 x i1  vector value
+def nxv16i1 : VTScalableVec<16, i1, 165>;  // n x 16 x i1  vector value
+def nxv32i1 : VTScalableVec<32, i1, 166>;  // n x 32 x i1  vector value
+def nxv64i1 : VTScalableVec<64, i1, 167>;  // n x 64 x i1  vector value
+
+def nxv1i8  : VTScalableVec<1,  i8, 168>;  // n x  1 x i8  vector value
+def nxv2i8  : VTScalableVec<2,  i8, 169>;  // n x  2 x i8  vector value
+def nxv4i8  : VTScalableVec<4,  i8, 170>;  // n x  4 x i8  vector value
+def nxv8i8  : VTScalableVec<8,  i8, 171>;  // n x  8 x i8  vector value
+def nxv16i8 : VTScalableVec<16, i8, 172>;  // n x 16 x i8  vector value
+def nxv32i8 : VTScalableVec<32, i8, 173>;  // n x 32 x i8  vector value
+def nxv64i8 : VTScalableVec<64, i8, 174>;  // n x 64 x i8  vector value
+
+def nxv1i16  : VTScalableVec<1,  i16, 175>;  // n x  1 x i16 vector value
+def nxv2i16  : VTScalableVec<2,  i16, 176>;  // n x  2 x i16 vector value
+def nxv4i16  : VTScalableVec<4,  i16, 177>;  // n x  4 x i16 vector value
+def nxv8i16  : VTScalableVec<8,  i16, 178>;  // n x  8 x i16 vector value
+def nxv16i16 : VTScalableVec<16, i16, 179>;  // n x 16 x i16 vector value
+def nxv32i16 : VTScalableVec<32, i16, 180>;  // n x 32 x i16 vector value
+
+def nxv1i32  : VTScalableVec<1,  i32, 181>;  // n x  1 x i32 vector value
+def nxv2i32  : VTScalableVec<2,  i32, 182>;  // n x  2 x i32 vector value
+def nxv4i32  : VTScalableVec<4,  i32, 183>;  // n x  4 x i32 vector value
+def nxv8i32  : VTScalableVec<8,  i32, 184>;  // n x  8 x i32 vector value
+def nxv16i32 : VTScalableVec<16, i32, 185>;  // n x 16 x i32 vector value
+def nxv32i32 : VTScalableVec<32, i32, 186>;  // n x 32 x i32 vector value
+
+def nxv1i64  : VTScalableVec<1,  i64, 187>;  // n x  1 x i64 vector value
+def nxv2i64  : VTScalableVec<2,  i64, 188>;  // n x  2 x i64 vector value
+def nxv4i64  : VTScalableVec<4,  i64, 189>;  // n x  4 x i64 vector value
+def nxv8i64  : VTScalableVec<8,  i64, 190>;  // n x  8 x i64 vector value
+def nxv16i64 : VTScalableVec<16, i64, 191>;  // n x 16 x i64 vector value
+def nxv32i64 : VTScalableVec<32, i64, 192>;  // n x 32 x i64 vector value
+
+def nxv1f8e4m3fn  : VTScalableVec<1,  f8e4m3fn, 193>;  // n x  1 x  f8e4m3fn vector value
+def nxv2f8e4m3fn  : VTScalableVec<2,  f8e4m3fn, 194>;  // n x  2 x  f8e4m3fn vector value
+def nxv4f8e4m3fn  : VTScalableVec<4,  f8e4m3fn, 195>;  // n x  4 x  f8e4m3fn vector value
+def nxv8f8e4m3fn  : VTScalableVec<8,  f8e4m3fn, 196>;  // n x  8 x  f8e4m3fn vector value
+def nxv16f8e4m3fn : VTScalableVec<16, f8e4m3fn, 197>;  // n x 16 x  f8e4m3fn vector value
+def nxv32f8e4m3fn : VTScalableVec<32, f8e4m3fn, 198>;  // n x 32 x  f8e4m3fn vector value
+
+def nxv1f8e5m2  : VTScalableVec<1,  f8e5m2, 199>;  // n x  1 x  f8e5m2 vector value
+def nxv2f8e5m2  : VTScalableVec<2,  f8e5m2, 200>;  // n x  2 x  f8e5m2 vector value
+def nxv4f8e5m2  : VTScalableVec<4,  f8e5m2, 201>;  // n x  4 x  f8e5m2 vector value
+def nxv8f8e5m2  : VTScalableVec<8,  f8e5m2, 202>;  // n x  8 x  f8e5m2 vector value
+def nxv16f8e5m2 : VTScalableVec<16, f8e5m2, 203>;  // n x 16 x  f8e5m2 vector value
+def nxv32f8e5m2 : VTScalableVec<32, f8e5m2, 204>;  // n x 32 x  f8e5m2 vector value
+
+def nxv1f16  : VTScalableVec<1,  f16, 205>;  // n x  1 x  f16 vector value
+def nxv2f16  : VTScalableVec<2,  f16, 206>;  // n x  2 x  f16 vector value
+def nxv4f16  : VTScalableVec<4,  f16, 207>;  // n x  4 x  f16 vector value
+def nxv8f16  : VTScalableVec<8,  f16, 208>;  // n x  8 x  f16 vector value
+def nxv16f16 : VTScalableVec<16, f16, 209>;  // n x 16 x  f16 vector value
+def nxv32f16 : VTScalableVec<32, f16, 210>;  // n x 32 x  f16 vector value
+
+def nxv1bf16  : VTScalableVec<1,  bf16, 211>;  // n x  1 x bf16 vector value
+def nxv2bf16  : VTScalableVec<2,  bf16, 212>;  // n x  2 x bf16 vector value
+def nxv4bf16  : VTScalableVec<4,  bf16, 213>;  // n x  4 x bf16 vector value
+def nxv8bf16  : VTScalableVec<8,  bf16, 214>;  // n x  8 x bf16 vector value
+def nxv16bf16 : VTScalableVec<16, bf16, 215>;  // n x 16 x bf16 vector value
+def nxv32bf16 : VTScalableVec<32, bf16, 216>;  // n x 32 x bf16 vector value
+
+def nxv1f32  : VTScalableVec<1,  f32, 217>;  // n x  1 x  f32 vector value
+def nxv2f32  : VTScalableVec<2,  f32, 218>;  // n x  2 x  f32 vector value
+def nxv4f32  : VTScalableVec<4,  f32, 219>;  // n x  4 x  f32 vector value
+def nxv8f32  : VTScalableVec<8,  f32, 220>;  // n x  8 x  f32 vector value
+def nxv16f32 : VTScalableVec<16, f32, 221>;  // n x 16 x  f32 vector value
+
+def nxv1f64  : VTScalableVec<1,  f64, 222>;  // n x  1 x  f64 vector value
+def nxv2f64  : VTScalableVec<2,  f64, 223>;  // n x  2 x  f64 vector value
+def nxv4f64  : VTScalableVec<4,  f64, 224>;  // n x  4 x  f64 vector value
+def nxv8f64  : VTScalableVec<8,  f64, 225>;  // n x  8 x  f64 vector value
+
+def x86mmx    : ValueType<64,   226>;  // X86 MMX value
+def FlagVT    : ValueType<0,    227> { // Pre-RA sched glue
   let LLVMName = "Glue";
 }
-def isVoid    : ValueType<0,    192>;  // Produces no value
-def untyped   : ValueType<8,    193> { // Produces an untyped value
+def isVoid    : ValueType<0,    228>;  // Produces no value
+def untyped   : ValueType<8,    229> { // Produces an untyped value
   let LLVMName = "Untyped";
 }
-def funcref   : ValueType<0,    194>;  // WebAssembly's funcref type
-def externref : ValueType<0,    195>;  // WebAssembly's externref type
-def x86amx    : ValueType<8192, 196>;  // X86 AMX value
-def i64x8     : ValueType<512,  197>;  // 8 Consecutive GPRs (AArch64)
+def funcref   : ValueType<0,    230>;  // WebAssembly's funcref type
+def externref : ValueType<0,    231>;  // WebAssembly's externref type
+def x86amx    : ValueType<8192, 232>;  // X86 AMX value
+def i64x8     : ValueType<512,  233>;  // 8 Consecutive GPRs (AArch64)
 def aarch64svcount
-              : ValueType<16,  198>;  // AArch64 predicate-as-counter
-def spirvbuiltin : ValueType<0, 199>; // SPIR-V's builtin type
+              : ValueType<16,  234>;  // AArch64 predicate-as-counter
+def spirvbuiltin : ValueType<0, 235>; // SPIR-V's builtin type
 
 def token      : ValueType<0, 248>;  // TokenTy
 def MetadataVT : ValueType<0, 249> { // Metadata
diff --git a/llvm/include/llvm/CodeGenTypes/MachineValueType.h b/llvm/include/llvm/CodeGenTypes/MachineValueType.h
index 9aceb9896021c5..d801fb00a9587e 100644
--- a/llvm/include/llvm/CodeGenTypes/MachineValueType.h
+++ b/llvm/include/llvm/CodeGenTypes/MachineValueType.h
@@ -49,7 +49,7 @@ namespace llvm {
       // This is the current maximum for LAST_VALUETYPE.
       // MVT::MAX_ALLOWED_VALUETYPE is used for asserts and to size bit vectors
       // This value must be a multiple of 32.
-      MAX_ALLOWED_VALUETYPE = 224,
+      MAX_ALLOWED_VALUETYPE = 255,
     };
 
     static_assert(FIRST_VALUETYPE > 0);
diff --git a/llvm/include/llvm/IR/Intrinsics.td b/llvm/include/llvm/IR/Intrinsics.td
index bdd8465883fcff..8692f8d4140944 100644
--- a/llvm/include/llvm/IR/Intrinsics.td
+++ b/llvm/include/llvm/IR/Intrinsics.td
@@ -482,6 +482,8 @@ def llvm_i16_ty        : LLVMType<i16>;
 def llvm_i32_ty        : LLVMType<i32>;
 def llvm_i64_ty        : LLVMType<i64>;
 def llvm_i128_ty       : LLVMType<i128>;
+def llvm_f8e4m3fn_ty   : LLVMType<f8e4m3fn>;
+def llvm_f8e5m2_ty     : LLVMType<f8e5m2>;
 def llvm_half_ty       : LLVMType<f16>;
 def llvm_bfloat_ty     : LLVMType<bf16>;
 def llvm_float_ty      : LLVMType<f32>;
diff --git a/llvm/lib/CodeGen/ValueTypes.cpp b/llvm/lib/CodeGen/ValueTypes.cpp
index 58db686ec7d578..5ba94ac7588aa5 100644
--- a/llvm/lib/CodeGen/ValueTypes.cpp
+++ b/llvm/lib/CodeGen/ValueTypes.cpp
@@ -170,6 +170,8 @@ std::string EVT::getEVTString() const {
     if (isFloatingPoint())
       return "f" + utostr(getSizeInBits());
     llvm_unreachable("Invalid EVT!");
+  case MVT::f8e4m3fn:  return "f8e4m3fn";
+  case MVT::f8e5m2:    return "f8e5m2";
   case MVT::bf16:      return "bf16";
   case MVT::ppcf128:   return "ppcf128";
   case MVT::isVoid:    return "isVoid";
@@ -214,6 +216,8 @@ Type *EVT::getTypeForEVT(LLVMContext &Context) const {
   case MVT::i32:     return Type::getInt32Ty(Context);
   case MVT::i64:     return Type::getInt64Ty(Context);
   case MVT::i128:    return IntegerType::get(Context, 128);
+  case MVT::f8e4m3fn:return Type::getFloat8E4M3FNTy(Context);
+  case MVT::f8e5m2: return Type::getFloat8E5M2Ty(Context);
   case MVT::f16:     return Type::getHalfTy(Context);
   case MVT::bf16:    return Type::getBFloatTy(Context);
   case MVT::f32:     return Type::getFloatTy(Context);
@@ -370,6 +374,50 @@ Type *EVT::getTypeForEVT(LLVMContext &Context) const {
     return FixedVectorType::get(Type::getInt64Ty(Context), 256);
   case MVT::v1i128:
     return FixedVectorType::get(Type::getInt128Ty(Context), 1);
+  case MVT::v1f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 1);
+  case MVT::v2f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 2);
+  case MVT::v3f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 3);
+  case MVT::v4f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 4);
+  case MVT::v8f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 8);
+  case MVT::v16f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 16);
+  case MVT::v32f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 32);
+  case MVT::v64f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 64);
+  case MVT::v128f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 128);
+  case MVT::v256f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 256);
+  case MVT::v512f8e4m3fn :
+    return FixedVectorType::get(Type::getFloat8E4M3FNTy(Context), 512);
+  case MVT::v1f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 1);
+  case MVT::v2f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 2);
+  case MVT::v3f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 3);
+  case MVT::v4f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 4);
+  case MVT::v8f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 8);
+  case MVT::v16f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 16);
+  case MVT::v32f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 32);
+  case MVT::v64f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 64);
+  case MVT::v128f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 128);
+  case MVT::v256f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 256);
+  case MVT::v512f8e5m2 :
+    return FixedVectorType::get(Type::getFloat8E5M2Ty(Context), 512);
   case MVT::v1f16:
     return FixedVectorType::get(Type::getHalfTy(Context), 1);
   case MVT::v2f16:
@@ -532,6 +580,30 @@ Type *EVT::getTypeForEVT(LLVMContext &Context) const {
     return ScalableVectorType::get(Type::getInt64Ty(Context), 16);
   case MVT::nxv32i64:
     return ScalableVectorType::get(Type::getInt64Ty(Context), 32);
+  case MVT::nxv1f8e4m3fn:
+    return ScalableVectorType::get(Type::getFloat8E4M3FNTy(Context), 1);
+  case MVT::nxv2f8e4m3fn:
+    return ScalableVectorType::get(Type::getFloat8E4M3FNTy(Context), 2);
+  case MVT::nxv4f8e4m3fn:
+    return ScalableVectorType::get(Type::getFloat8E4M3FNTy(Context), 4);
+  case MVT::nxv8f8e4m3fn:
+    return ScalableVectorType::get(Type::getFloat8E4M3FNTy(Context), 8);
+  case MVT::nxv16f8e4m3fn:
+    return ScalableVectorType::get(Type::getFloat8E4M3FNTy(Context), 16);
+  case MVT::nxv32f8e4m3fn:
+    return ScalableVectorType::get(Type::getFloat8E4M3FNTy(Context), 32);
+  case MVT::nxv1f8e5m2:
+    return ScalableVectorType::get(Type::getFloat8E5M2Ty(Context), 1);
+  case MVT::nxv2f8e5m2:
+    return ScalableVectorType::get(Type::getFloat8E5M2Ty(Context), 2);
+  case MVT::nxv4f8e5m2:
+    return ScalableVectorType::get(Type::getFloat8E5M2Ty(Context), 4);
+  case MVT::nxv8f8e5m2:
+    return ScalableVectorType::get(Type::getFloat8E5M2Ty(Context), 8);
+  case MVT::nxv16f8e5m2:
+    return ScalableVectorType::get(Type::getFloat8E5M2Ty(Context), 16);
+  case MVT::nxv32f8e5m2:
+    return ScalableVectorType::get(Type::getFloat8E5M2Ty(Context), 32);
   case MVT::nxv1f16:
     return ScalableVectorType::get(Type::getHalfTy(Context), 1);
   case MVT::nxv2f16:
@@ -592,12 +664,14 @@ MVT MVT::getVT(Type *Ty, bool HandleUnknown){
     return MVT::isVoid;
   case Type::IntegerTyID:
     return getIntegerVT(cast<IntegerType>(Ty)->getBitWidth());
-  case Type::HalfTyID:      return MVT(MVT::f16);
-  case Type::BFloatTyID:    return MVT(MVT::bf16);
-  case Type::FloatTyID:     return MVT(MVT::f32);
-  case Type::DoubleTyID:    return MVT(MVT::f64);
-  case Type::X86_FP80TyID:  return MVT(MVT::f80);
-  case Type::X86_MMXTyID:   return MVT(MVT::x86mmx);
+  case Type::Float8E4M3FNTyID:  return MVT(MVT::f8e4m3fn);
+  case Type::Float8E5M2TyID:    return MVT(MVT::f8e5m2);
+  case Type::HalfTyID:          return MVT(MVT::f16);
+  case Type::BFloatTyID:        return MVT(MVT::bf16);
+  case Type::FloatTyID:         return MVT(MVT::f32);
+  case Type::DoubleTyID:        return MVT(MVT::f64);
+  case Type::X86_FP80TyID:      return MVT(MVT::f80);
+  case Type::X86_MMXTyID:       return MVT(MVT::x86mmx);
   case Type::TargetExtTyID: {
     TargetExtType *TargetExtTy = cast<TargetExtType>(Ty);
     if (TargetExtTy->getName() == "aarch64.svcount")
diff --git a/llvm/utils/TableGen/Common/CodeGenTarget.cpp b/llvm/utils/TableGen/Common/CodeGenTarget.cpp
index e1cf33e7f62ffc..0d64698eca57bd 100644
--- a/llvm/utils/TableGen/Common/CodeGenTarget.cpp
+++ b/llvm/utils/TableGen/Common/CodeGenTarget.cpp
@@ -76,6 +76,8 @@ StringRef llvm::getEnumName(MVT::SimpleValueType T) {
   case MVT::iAny:     return "MVT::iAny";
   case MVT::fAny:     return "MVT::fAny";
   case MVT::vAny:     return "MVT::vAny";
+  case MVT::f8e4m3fn: return "MVT::f8e4m3fn";
+  case MVT::f8e5m2:   return "MVT::f8e5m2";
   case MVT::f16:      return "MVT::f16";
   case MVT::bf16:     return "MVT::bf16";
   case MVT::f32:      return "MVT::f32";
@@ -160,6 +162,28 @@ StringRef llvm::getEnumName(MVT::SimpleValueType T) {
   case MVT::v128i64:  return "MVT::v128i64";
   case MVT::v256i64:  return "MVT::v256i64";
   case MVT::v1i128:   return "MVT::v1i128";
+  case MVT::v1f8e4m3fn:    return "MVT::v1f8e4m3fn";
+  case MVT::v2f8e4m3fn:    return "MVT::v2f8e4m3fn";
+  case MVT::v3f8e4m3fn:    return "MVT::v3f8e4m3fn";
+  case MVT::v4f8e4m3fn:    return "MVT::v4f8e4m3fn";
+  case MVT::v8f8e4m3fn:    return "MVT::v8f8e4m3fn";
+  case MVT::v16f8e4m3fn:   return "MVT::v16f8e4m3fn";
+  case MVT::v32f8e4m3fn:   return "MVT::v32f8e4m3fn";
+  case MVT::v64f8e4m3fn:   return "MVT::v64f8e4m3fn";
+  case MVT::v128f8e4m3fn:  return "MVT::v128f8e4m3fn";
+  case MVT::v256f8e4m3fn:  return "MVT::v256f8e4m3fn";
+  case MVT::v512f8e4m3fn:  return "MVT::v512f8e4m3fn";
+  case MVT::v1f8e5m2:      return "MVT::v1f8e5m2";
+  case MVT::v2f8e5m2:      return "MVT::v2f8e5m2";
+  case MVT::v3f8e5m2:      return "MVT::v3f8e5m2";
+  case MVT::v4f8e5m2:      return "MVT::v4f8e5m2";
+  case MVT::v8f8e5m2:      return "MVT::v8f8e5m2";
+  case MVT::v16f8e5m2:     return "MVT::v16f8e5m2";
+  case MVT::v32f8e5m2:     return "MVT::v32f8e5m2";
+  case MVT::v64f8e5m2:     return "MVT::v64f8e5m2";
+  case MVT::v128f8e5m2:    return "MVT::v128f8e5m2";
+  case MVT::v256f8e5m2:    return "MVT::v256f8e5m2";
+  case MVT::v512f8e5m2:    return "MVT::v512f8e5m2";
   case MVT::v1f16:    return "MVT::v1f16";
   case MVT::v2f16:    return "MVT::v2f16";
   case MVT::v3f16:    return "MVT::v3f16";
@@ -241,6 +265,18 @@ StringRef llvm::getEnumName(MVT::SimpleValueType T) {
   case MVT::nxv8i64:  return "MVT::nxv8i64";
   case MVT::nxv16i64: return "MVT::nxv16i64";
   case MVT::nxv32i64: return "MVT::nxv32i64";
+  case MVT::nxv1f8e4m3fn:  return "MVT::nxv1f8e4m3fn";
+  case MVT::nxv2f8e4m3fn:  return "MVT::nxv2f8e4m3fn";
+  case MVT::nxv4f8e4m3fn:  return "MVT::nxv4f8e4m3fn";
+  case MVT::nxv8f8e4m3fn:  return "MVT::nxv8f8e4m3fn";
+  case MVT::nxv16f8e4m3fn: return "MVT::nxv16f8e4m3fn";
+  case MVT::nxv32f8e4m3fn: return "MVT::nxv32f8e4m3fn";
+  case MVT::nxv1f8e5m2:    return "MVT::nxv1f8e5m2";
+  case MVT::nxv2f8e5m2:    return "MVT::nxv2f8e5m2";
+  case MVT::nxv4f8e5m2:    return "MVT::nxv4f8e5m2";
+  case MVT::nxv8f8e5m2:    return "MVT::nxv8f8e5m2";
+  case MVT::nxv16f8e5m2:   return "MVT::nxv16f8e5m2";
+  case MVT::nxv32f8e5m2:   return "MVT::nxv32f8e5m2";
   case MVT::nxv1f16:  return "MVT::nxv1f16";
   case MVT::nxv2f16:  return "MVT::nxv2f16";
   case MVT::nxv4f16:  return "MVT::nxv4f16";
diff --git a/llvm/utils/TableGen/VTEmitter.cpp b/llvm/utils/TableGen/VTEmitter.cpp
index 5ec1f59318f784..479d6192932529 100644
--- a/llvm/utils/TableGen/VTEmitter.cpp
+++ b/llvm/utils/TableGen/VTEmitter.cpp
@@ -85,7 +85,7 @@ void VTEmitter::run(raw_ostream &OS) {
     UpdateVTRange("VECTOR_VALUETYPE", Name, IsVector);
     UpdateVTRange("INTEGER_VALUETYPE", Name, IsInteger && !IsVector);
     UpdateVTRange("FP_VALUETYPE", Name, IsFP && !IsVector);
-    UpdateVTRange("VALUETYPE", Name, Value < 224);
+    UpdateVTRange("VALUETYPE", Name, Value < 255);
 
     // clang-format off
     OS << "  GET_VT_ATTR("