<div dir="ltr">Getting close now, I think there's just one more problem:<div><br></div><div>vmaxv_f16, vmaxq_f16, vminv_f16, vminq_f16, vmaxnmv_f16, vmaxnmvq_f16, vminnmv_f16, and vminnmvq_f16 all have the wrong parameter type, requiring a lax conversion from vector of signed char to vector of float16_t.</div><div><br></div><div>You can reproduce that by running test/CodeGen/aarch64-v8.2a-neon-intrinsics.c with -flax-vector-conversions=integer.</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, 10 Oct 2019 at 11:43, Eli Friedman via cfe-commits <<a href="mailto:cfe-commits@lists.llvm.org">cfe-commits@lists.llvm.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Author: efriedma<br>

Date: Thu Oct 10 11:45:34 2019<br>

New Revision: 374419<br>

<br>

URL: <a href="http://llvm.org/viewvc/llvm-project?rev=374419&view=rev" rel="noreferrer" target="_blank">http://llvm.org/viewvc/llvm-project?rev=374419&view=rev</a><br>

Log:<br>

[ARM] Fix arm_neon.h with -flax-vector-conversions=none, part 2.<br>

<br>

Just running -fsyntax-only over arm_neon.h doesn't cover some intrinsics<br>

which are defined using macros.  Add more test coverage for that.<br>

<br>

arm-neon-header.c wasn't checking the full set of available NEON target<br>

features; change the target architecture of the test to account for<br>

that.<br>

<br>

Fix the generator for arm_neon.h to generate casts in more cases where<br>

they are necessary.<br>

<br>

Fix VFMLAL_LOW etc. to express their signatures differently, so the<br>

builtins have the expected type. Maybe the TableGen backend should<br>

detect intrinsics that are defined the wrong way, and produce an error.<br>

The rules here are sort of strange.<br>

<br>

Differential Revision: <a href="https://reviews.llvm.org/D68743" rel="noreferrer" target="_blank">https://reviews.llvm.org/D68743</a><br>

<br>

<br>

Modified:<br>

    cfe/trunk/include/clang/Basic/<a href="http://arm_neon.td" rel="noreferrer" target="_blank">arm_neon.td</a><br>

    cfe/trunk/test/CodeGen/aarch64-neon-intrinsics.c<br>

    cfe/trunk/test/CodeGen/arm_neon_intrinsics.c<br>

    cfe/trunk/test/Headers/arm-neon-header.c<br>

    cfe/trunk/utils/TableGen/NeonEmitter.cpp<br>

<br>

Modified: cfe/trunk/include/clang/Basic/<a href="http://arm_neon.td" rel="noreferrer" target="_blank">arm_neon.td</a><br>

URL: <a href="http://llvm.org/viewvc/llvm-project/cfe/trunk/include/clang/Basic/arm_neon.td?rev=374419&r1=374418&r2=374419&view=diff" rel="noreferrer" target="_blank">http://llvm.org/viewvc/llvm-project/cfe/trunk/include/clang/Basic/arm_neon.td?rev=374419&r1=374418&r2=374419&view=diff</a><br>

==============================================================================<br>

--- cfe/trunk/include/clang/Basic/<a href="http://arm_neon.td" rel="noreferrer" target="_blank">arm_neon.td</a> (original)<br>

+++ cfe/trunk/include/clang/Basic/<a href="http://arm_neon.td" rel="noreferrer" target="_blank">arm_neon.td</a> Thu Oct 10 11:45:34 2019<br>

@@ -1651,10 +1651,10 @@ let ArchGuard = "defined(__ARM_FEATURE_D<br>

<br>

 // v8.2-A FP16 fused multiply-add long instructions.<br>

 let ArchGuard = "defined(__ARM_FEATURE_FP16FML) && defined(__aarch64__)" in {<br>

-  def VFMLAL_LOW  : SInst<"vfmlal_low",  "ffHH", "hQh">;<br>

-  def VFMLSL_LOW  : SInst<"vfmlsl_low",  "ffHH", "hQh">;<br>

-  def VFMLAL_HIGH : SInst<"vfmlal_high", "ffHH", "hQh">;<br>

-  def VFMLSL_HIGH : SInst<"vfmlsl_high", "ffHH", "hQh">;<br>

+  def VFMLAL_LOW  : SInst<"vfmlal_low",  "nndd", "hQh">;<br>

+  def VFMLSL_LOW  : SInst<"vfmlsl_low",  "nndd", "hQh">;<br>

+  def VFMLAL_HIGH : SInst<"vfmlal_high", "nndd", "hQh">;<br>

+  def VFMLSL_HIGH : SInst<"vfmlsl_high", "nndd", "hQh">;<br>

<br>

   def VFMLAL_LANE_LOW  : SOpInst<"vfmlal_lane_low",  "ffH0i", "hQh", OP_FMLAL_LN>;<br>

   def VFMLSL_LANE_LOW  : SOpInst<"vfmlsl_lane_low",  "ffH0i", "hQh", OP_FMLSL_LN>;<br>

<br>

Modified: cfe/trunk/test/CodeGen/aarch64-neon-intrinsics.c<br>

URL: <a href="http://llvm.org/viewvc/llvm-project/cfe/trunk/test/CodeGen/aarch64-neon-intrinsics.c?rev=374419&r1=374418&r2=374419&view=diff" rel="noreferrer" target="_blank">http://llvm.org/viewvc/llvm-project/cfe/trunk/test/CodeGen/aarch64-neon-intrinsics.c?rev=374419&r1=374418&r2=374419&view=diff</a><br>

==============================================================================<br>

--- cfe/trunk/test/CodeGen/aarch64-neon-intrinsics.c (original)<br>

+++ cfe/trunk/test/CodeGen/aarch64-neon-intrinsics.c Thu Oct 10 11:45:34 2019<br>

@@ -1,5 +1,6 @@<br>

 // RUN: %clang_cc1 -triple arm64-none-linux-gnu -target-feature +neon \<br>

-// RUN:     -fallow-half-arguments-and-returns -S -disable-O0-optnone -emit-llvm -o - %s \<br>

+// RUN:     -fallow-half-arguments-and-returns -S -disable-O0-optnone \<br>

+// RUN:  -flax-vector-conversions=none -emit-llvm -o - %s \<br>

 // RUN: | opt -S -mem2reg \<br>

 // RUN: | FileCheck %s<br>

<br>

@@ -406,7 +407,7 @@ int8x8_t test_vmla_s8(int8x8_t v1, int8x<br>

 // CHECK:   [[TMP0:%.*]] = bitcast <4 x i16> [[ADD_I]] to <8 x i8><br>

 // CHECK:   ret <8 x i8> [[TMP0]]<br>

 int8x8_t test_vmla_s16(int16x4_t v1, int16x4_t v2, int16x4_t v3) {<br>

-  return vmla_s16(v1, v2, v3);<br>

+  return (int8x8_t)vmla_s16(v1, v2, v3);<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vmla_s32(<br>

@@ -527,7 +528,7 @@ int8x8_t test_vmls_s8(int8x8_t v1, int8x<br>

 // CHECK:   [[TMP0:%.*]] = bitcast <4 x i16> [[SUB_I]] to <8 x i8><br>

 // CHECK:   ret <8 x i8> [[TMP0]]<br>

 int8x8_t test_vmls_s16(int16x4_t v1, int16x4_t v2, int16x4_t v3) {<br>

-  return vmls_s16(v1, v2, v3);<br>

+  return (int8x8_t)vmls_s16(v1, v2, v3);<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vmls_s32(<br>

@@ -978,7 +979,7 @@ int8x8_t test_vbsl_s8(uint8x8_t v1, int8<br>

 // CHECK:   [[TMP4:%.*]] = bitcast <4 x i16> [[VBSL5_I]] to <8 x i8><br>

 // CHECK:   ret <8 x i8> [[TMP4]]<br>

 int8x8_t test_vbsl_s16(uint16x4_t v1, int16x4_t v2, int16x4_t v3) {<br>

-  return vbsl_s16(v1, v2, v3);<br>

+  return (int8x8_t)vbsl_s16(v1, v2, v3);<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vbsl_s32(<br>

@@ -1003,7 +1004,7 @@ int32x2_t test_vbsl_s32(uint32x2_t v1, i<br>

 // CHECK:   [[VBSL4_I:%.*]] = and <1 x i64> [[TMP3]], %v3<br>

 // CHECK:   [[VBSL5_I:%.*]] = or <1 x i64> [[VBSL3_I]], [[VBSL4_I]]<br>

 // CHECK:   ret <1 x i64> [[VBSL5_I]]<br>

-uint64x1_t test_vbsl_s64(uint64x1_t v1, uint64x1_t v2, uint64x1_t v3) {<br>

+int64x1_t test_vbsl_s64(uint64x1_t v1, int64x1_t v2, int64x1_t v3) {<br>

   return vbsl_s64(v1, v2, v3);<br>

 }<br>

<br>

@@ -1057,19 +1058,18 @@ uint64x1_t test_vbsl_u64(uint64x1_t v1,<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vbsl_f32(<br>

-// CHECK:   [[TMP0:%.*]] = bitcast <2 x float> %v1 to <2 x i32><br>

-// CHECK:   [[TMP1:%.*]] = bitcast <2 x i32> [[TMP0]] to <8 x i8><br>

+// CHECK:   [[TMP1:%.*]] = bitcast <2 x i32> %v1 to <8 x i8><br>

 // CHECK:   [[TMP2:%.*]] = bitcast <2 x float> %v2 to <8 x i8><br>

 // CHECK:   [[TMP3:%.*]] = bitcast <2 x float> %v3 to <8 x i8><br>

 // CHECK:   [[VBSL1_I:%.*]] = bitcast <8 x i8> [[TMP2]] to <2 x i32><br>

 // CHECK:   [[VBSL2_I:%.*]] = bitcast <8 x i8> [[TMP3]] to <2 x i32><br>

-// CHECK:   [[VBSL3_I:%.*]] = and <2 x i32> [[TMP0]], [[VBSL1_I]]<br>

-// CHECK:   [[TMP4:%.*]] = xor <2 x i32> [[TMP0]], <i32 -1, i32 -1><br>

+// CHECK:   [[VBSL3_I:%.*]] = and <2 x i32> %v1, [[VBSL1_I]]<br>

+// CHECK:   [[TMP4:%.*]] = xor <2 x i32> %v1, <i32 -1, i32 -1><br>

 // CHECK:   [[VBSL4_I:%.*]] = and <2 x i32> [[TMP4]], [[VBSL2_I]]<br>

 // CHECK:   [[VBSL5_I:%.*]] = or <2 x i32> [[VBSL3_I]], [[VBSL4_I]]<br>

 // CHECK:   [[TMP5:%.*]] = bitcast <2 x i32> [[VBSL5_I]] to <2 x float><br>

 // CHECK:   ret <2 x float> [[TMP5]]<br>

-float32x2_t test_vbsl_f32(float32x2_t v1, float32x2_t v2, float32x2_t v3) {<br>

+float32x2_t test_vbsl_f32(uint32x2_t v1, float32x2_t v2, float32x2_t v3) {<br>

   return vbsl_f32(v1, v2, v3);<br>

 }<br>

<br>

@@ -4661,7 +4661,7 @@ int64x2_t test_vshlq_n_s64(int64x2_t a)<br>

 // CHECK-LABEL: @test_vshl_n_u8(<br>

 // CHECK:   [[VSHL_N:%.*]] = shl <8 x i8> %a, <i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3><br>

 // CHECK:   ret <8 x i8> [[VSHL_N]]<br>

-int8x8_t test_vshl_n_u8(int8x8_t a) {<br>

+uint8x8_t test_vshl_n_u8(uint8x8_t a) {<br>

   return vshl_n_u8(a, 3);<br>

 }<br>

<br>

@@ -4670,7 +4670,7 @@ int8x8_t test_vshl_n_u8(int8x8_t a) {<br>

 // CHECK:   [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16><br>

 // CHECK:   [[VSHL_N:%.*]] = shl <4 x i16> [[TMP1]], <i16 3, i16 3, i16 3, i16 3><br>

 // CHECK:   ret <4 x i16> [[VSHL_N]]<br>

-int16x4_t test_vshl_n_u16(int16x4_t a) {<br>

+uint16x4_t test_vshl_n_u16(uint16x4_t a) {<br>

   return vshl_n_u16(a, 3);<br>

 }<br>

<br>

@@ -4679,14 +4679,14 @@ int16x4_t test_vshl_n_u16(int16x4_t a) {<br>

 // CHECK:   [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32><br>

 // CHECK:   [[VSHL_N:%.*]] = shl <2 x i32> [[TMP1]], <i32 3, i32 3><br>

 // CHECK:   ret <2 x i32> [[VSHL_N]]<br>

-int32x2_t test_vshl_n_u32(int32x2_t a) {<br>

+uint32x2_t test_vshl_n_u32(uint32x2_t a) {<br>

   return vshl_n_u32(a, 3);<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vshlq_n_u8(<br>

 // CHECK:   [[VSHL_N:%.*]] = shl <16 x i8> %a, <i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3><br>

 // CHECK:   ret <16 x i8> [[VSHL_N]]<br>

-int8x16_t test_vshlq_n_u8(int8x16_t a) {<br>

+uint8x16_t test_vshlq_n_u8(uint8x16_t a) {<br>

   return vshlq_n_u8(a, 3);<br>

 }<br>

<br>

@@ -4695,7 +4695,7 @@ int8x16_t test_vshlq_n_u8(int8x16_t a) {<br>

 // CHECK:   [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16><br>

 // CHECK:   [[VSHL_N:%.*]] = shl <8 x i16> [[TMP1]], <i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3><br>

 // CHECK:   ret <8 x i16> [[VSHL_N]]<br>

-int16x8_t test_vshlq_n_u16(int16x8_t a) {<br>

+uint16x8_t test_vshlq_n_u16(uint16x8_t a) {<br>

   return vshlq_n_u16(a, 3);<br>

 }<br>

<br>

@@ -4704,7 +4704,7 @@ int16x8_t test_vshlq_n_u16(int16x8_t a)<br>

 // CHECK:   [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32><br>

 // CHECK:   [[VSHL_N:%.*]] = shl <4 x i32> [[TMP1]], <i32 3, i32 3, i32 3, i32 3><br>

 // CHECK:   ret <4 x i32> [[VSHL_N]]<br>

-int32x4_t test_vshlq_n_u32(int32x4_t a) {<br>

+uint32x4_t test_vshlq_n_u32(uint32x4_t a) {<br>

   return vshlq_n_u32(a, 3);<br>

 }<br>

<br>

@@ -4713,7 +4713,7 @@ int32x4_t test_vshlq_n_u32(int32x4_t a)<br>

 // CHECK:   [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <2 x i64><br>

 // CHECK:   [[VSHL_N:%.*]] = shl <2 x i64> [[TMP1]], <i64 3, i64 3><br>

 // CHECK:   ret <2 x i64> [[VSHL_N]]<br>

-int64x2_t test_vshlq_n_u64(int64x2_t a) {<br>

+uint64x2_t test_vshlq_n_u64(uint64x2_t a) {<br>

   return vshlq_n_u64(a, 3);<br>

 }<br>

<br>

@@ -4779,7 +4779,7 @@ int64x2_t test_vshrq_n_s64(int64x2_t a)<br>

 // CHECK-LABEL: @test_vshr_n_u8(<br>

 // CHECK:   [[VSHR_N:%.*]] = lshr <8 x i8> %a, <i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3><br>

 // CHECK:   ret <8 x i8> [[VSHR_N]]<br>

-int8x8_t test_vshr_n_u8(int8x8_t a) {<br>

+uint8x8_t test_vshr_n_u8(uint8x8_t a) {<br>

   return vshr_n_u8(a, 3);<br>

 }<br>

<br>

@@ -4788,7 +4788,7 @@ int8x8_t test_vshr_n_u8(int8x8_t a) {<br>

 // CHECK:   [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16><br>

 // CHECK:   [[VSHR_N:%.*]] = lshr <4 x i16> [[TMP1]], <i16 3, i16 3, i16 3, i16 3><br>

 // CHECK:   ret <4 x i16> [[VSHR_N]]<br>

-int16x4_t test_vshr_n_u16(int16x4_t a) {<br>

+uint16x4_t test_vshr_n_u16(uint16x4_t a) {<br>

   return vshr_n_u16(a, 3);<br>

 }<br>

<br>

@@ -4797,14 +4797,14 @@ int16x4_t test_vshr_n_u16(int16x4_t a) {<br>

 // CHECK:   [[TMP1:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32><br>

 // CHECK:   [[VSHR_N:%.*]] = lshr <2 x i32> [[TMP1]], <i32 3, i32 3><br>

 // CHECK:   ret <2 x i32> [[VSHR_N]]<br>

-int32x2_t test_vshr_n_u32(int32x2_t a) {<br>

+uint32x2_t test_vshr_n_u32(uint32x2_t a) {<br>

   return vshr_n_u32(a, 3);<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vshrq_n_u8(<br>

 // CHECK:   [[VSHR_N:%.*]] = lshr <16 x i8> %a, <i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3><br>

 // CHECK:   ret <16 x i8> [[VSHR_N]]<br>

-int8x16_t test_vshrq_n_u8(int8x16_t a) {<br>

+uint8x16_t test_vshrq_n_u8(uint8x16_t a) {<br>

   return vshrq_n_u8(a, 3);<br>

 }<br>

<br>

@@ -4813,7 +4813,7 @@ int8x16_t test_vshrq_n_u8(int8x16_t a) {<br>

 // CHECK:   [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16><br>

 // CHECK:   [[VSHR_N:%.*]] = lshr <8 x i16> [[TMP1]], <i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3><br>

 // CHECK:   ret <8 x i16> [[VSHR_N]]<br>

-int16x8_t test_vshrq_n_u16(int16x8_t a) {<br>

+uint16x8_t test_vshrq_n_u16(uint16x8_t a) {<br>

   return vshrq_n_u16(a, 3);<br>

 }<br>

<br>

@@ -4822,7 +4822,7 @@ int16x8_t test_vshrq_n_u16(int16x8_t a)<br>

 // CHECK:   [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32><br>

 // CHECK:   [[VSHR_N:%.*]] = lshr <4 x i32> [[TMP1]], <i32 3, i32 3, i32 3, i32 3><br>

 // CHECK:   ret <4 x i32> [[VSHR_N]]<br>

-int32x4_t test_vshrq_n_u32(int32x4_t a) {<br>

+uint32x4_t test_vshrq_n_u32(uint32x4_t a) {<br>

   return vshrq_n_u32(a, 3);<br>

 }<br>

<br>

@@ -4831,7 +4831,7 @@ int32x4_t test_vshrq_n_u32(int32x4_t a)<br>

 // CHECK:   [[TMP1:%.*]] = bitcast <16 x i8> [[TMP0]] to <2 x i64><br>

 // CHECK:   [[VSHR_N:%.*]] = lshr <2 x i64> [[TMP1]], <i64 3, i64 3><br>

 // CHECK:   ret <2 x i64> [[VSHR_N]]<br>

-int64x2_t test_vshrq_n_u64(int64x2_t a) {<br>

+uint64x2_t test_vshrq_n_u64(uint64x2_t a) {<br>

   return vshrq_n_u64(a, 3);<br>

 }<br>

<br>

@@ -4915,7 +4915,7 @@ int64x2_t test_vsraq_n_s64(int64x2_t a,<br>

 // CHECK:   [[VSRA_N:%.*]] = lshr <8 x i8> %b, <i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3><br>

 // CHECK:   [[TMP0:%.*]] = add <8 x i8> %a, [[VSRA_N]]<br>

 // CHECK:   ret <8 x i8> [[TMP0]]<br>

-int8x8_t test_vsra_n_u8(int8x8_t a, int8x8_t b) {<br>

+uint8x8_t test_vsra_n_u8(uint8x8_t a, uint8x8_t b) {<br>

   return vsra_n_u8(a, b, 3);<br>

 }<br>

<br>

@@ -4927,7 +4927,7 @@ int8x8_t test_vsra_n_u8(int8x8_t a, int8<br>

 // CHECK:   [[VSRA_N:%.*]] = lshr <4 x i16> [[TMP3]], <i16 3, i16 3, i16 3, i16 3><br>

 // CHECK:   [[TMP4:%.*]] = add <4 x i16> [[TMP2]], [[VSRA_N]]<br>

 // CHECK:   ret <4 x i16> [[TMP4]]<br>

-int16x4_t test_vsra_n_u16(int16x4_t a, int16x4_t b) {<br>

+uint16x4_t test_vsra_n_u16(uint16x4_t a, uint16x4_t b) {<br>

   return vsra_n_u16(a, b, 3);<br>

 }<br>

<br>

@@ -4939,7 +4939,7 @@ int16x4_t test_vsra_n_u16(int16x4_t a, i<br>

 // CHECK:   [[VSRA_N:%.*]] = lshr <2 x i32> [[TMP3]], <i32 3, i32 3><br>

 // CHECK:   [[TMP4:%.*]] = add <2 x i32> [[TMP2]], [[VSRA_N]]<br>

 // CHECK:   ret <2 x i32> [[TMP4]]<br>

-int32x2_t test_vsra_n_u32(int32x2_t a, int32x2_t b) {<br>

+uint32x2_t test_vsra_n_u32(uint32x2_t a, uint32x2_t b) {<br>

   return vsra_n_u32(a, b, 3);<br>

 }<br>

<br>

@@ -4947,7 +4947,7 @@ int32x2_t test_vsra_n_u32(int32x2_t a, i<br>

 // CHECK:   [[VSRA_N:%.*]] = lshr <16 x i8> %b, <i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3><br>

 // CHECK:   [[TMP0:%.*]] = add <16 x i8> %a, [[VSRA_N]]<br>

 // CHECK:   ret <16 x i8> [[TMP0]]<br>

-int8x16_t test_vsraq_n_u8(int8x16_t a, int8x16_t b) {<br>

+uint8x16_t test_vsraq_n_u8(uint8x16_t a, uint8x16_t b) {<br>

   return vsraq_n_u8(a, b, 3);<br>

 }<br>

<br>

@@ -4959,7 +4959,7 @@ int8x16_t test_vsraq_n_u8(int8x16_t a, i<br>

 // CHECK:   [[VSRA_N:%.*]] = lshr <8 x i16> [[TMP3]], <i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3><br>

 // CHECK:   [[TMP4:%.*]] = add <8 x i16> [[TMP2]], [[VSRA_N]]<br>

 // CHECK:   ret <8 x i16> [[TMP4]]<br>

-int16x8_t test_vsraq_n_u16(int16x8_t a, int16x8_t b) {<br>

+uint16x8_t test_vsraq_n_u16(uint16x8_t a, uint16x8_t b) {<br>

   return vsraq_n_u16(a, b, 3);<br>

 }<br>

<br>

@@ -4971,7 +4971,7 @@ int16x8_t test_vsraq_n_u16(int16x8_t a,<br>

 // CHECK:   [[VSRA_N:%.*]] = lshr <4 x i32> [[TMP3]], <i32 3, i32 3, i32 3, i32 3><br>

 // CHECK:   [[TMP4:%.*]] = add <4 x i32> [[TMP2]], [[VSRA_N]]<br>

 // CHECK:   ret <4 x i32> [[TMP4]]<br>

-int32x4_t test_vsraq_n_u32(int32x4_t a, int32x4_t b) {<br>

+uint32x4_t test_vsraq_n_u32(uint32x4_t a, uint32x4_t b) {<br>

   return vsraq_n_u32(a, b, 3);<br>

 }<br>

<br>

@@ -4983,7 +4983,7 @@ int32x4_t test_vsraq_n_u32(int32x4_t a,<br>

 // CHECK:   [[VSRA_N:%.*]] = lshr <2 x i64> [[TMP3]], <i64 3, i64 3><br>

 // CHECK:   [[TMP4:%.*]] = add <2 x i64> [[TMP2]], [[VSRA_N]]<br>

 // CHECK:   ret <2 x i64> [[TMP4]]<br>

-int64x2_t test_vsraq_n_u64(int64x2_t a, int64x2_t b) {<br>

+uint64x2_t test_vsraq_n_u64(uint64x2_t a, uint64x2_t b) {<br>

   return vsraq_n_u64(a, b, 3);<br>

 }<br>

<br>

@@ -5049,7 +5049,7 @@ int64x2_t test_vrshrq_n_s64(int64x2_t a)<br>

 // CHECK-LABEL: @test_vrshr_n_u8(<br>

 // CHECK:   [[VRSHR_N:%.*]] = call <8 x i8> @llvm.aarch64.neon.urshl.v8i8(<8 x i8> %a, <8 x i8> <i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3>)<br>

 // CHECK:   ret <8 x i8> [[VRSHR_N]]<br>

-int8x8_t test_vrshr_n_u8(int8x8_t a) {<br>

+uint8x8_t test_vrshr_n_u8(uint8x8_t a) {<br>

   return vrshr_n_u8(a, 3);<br>

 }<br>

<br>

@@ -5058,7 +5058,7 @@ int8x8_t test_vrshr_n_u8(int8x8_t a) {<br>

 // CHECK:   [[VRSHR_N:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16><br>

 // CHECK:   [[VRSHR_N1:%.*]] = call <4 x i16> @llvm.aarch64.neon.urshl.v4i16(<4 x i16> [[VRSHR_N]], <4 x i16> <i16 -3, i16 -3, i16 -3, i16 -3>)<br>

 // CHECK:   ret <4 x i16> [[VRSHR_N1]]<br>

-int16x4_t test_vrshr_n_u16(int16x4_t a) {<br>

+uint16x4_t test_vrshr_n_u16(uint16x4_t a) {<br>

   return vrshr_n_u16(a, 3);<br>

 }<br>

<br>

@@ -5067,14 +5067,14 @@ int16x4_t test_vrshr_n_u16(int16x4_t a)<br>

 // CHECK:   [[VRSHR_N:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32><br>

 // CHECK:   [[VRSHR_N1:%.*]] = call <2 x i32> @llvm.aarch64.neon.urshl.v2i32(<2 x i32> [[VRSHR_N]], <2 x i32> <i32 -3, i32 -3>)<br>

 // CHECK:   ret <2 x i32> [[VRSHR_N1]]<br>

-int32x2_t test_vrshr_n_u32(int32x2_t a) {<br>

+uint32x2_t test_vrshr_n_u32(uint32x2_t a) {<br>

   return vrshr_n_u32(a, 3);<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vrshrq_n_u8(<br>

 // CHECK:   [[VRSHR_N:%.*]] = call <16 x i8> @llvm.aarch64.neon.urshl.v16i8(<16 x i8> %a, <16 x i8> <i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3>)<br>

 // CHECK:   ret <16 x i8> [[VRSHR_N]]<br>

-int8x16_t test_vrshrq_n_u8(int8x16_t a) {<br>

+uint8x16_t test_vrshrq_n_u8(uint8x16_t a) {<br>

   return vrshrq_n_u8(a, 3);<br>

 }<br>

<br>

@@ -5083,7 +5083,7 @@ int8x16_t test_vrshrq_n_u8(int8x16_t a)<br>

 // CHECK:   [[VRSHR_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16><br>

 // CHECK:   [[VRSHR_N1:%.*]] = call <8 x i16> @llvm.aarch64.neon.urshl.v8i16(<8 x i16> [[VRSHR_N]], <8 x i16> <i16 -3, i16 -3, i16 -3, i16 -3, i16 -3, i16 -3, i16 -3, i16 -3>)<br>

 // CHECK:   ret <8 x i16> [[VRSHR_N1]]<br>

-int16x8_t test_vrshrq_n_u16(int16x8_t a) {<br>

+uint16x8_t test_vrshrq_n_u16(uint16x8_t a) {<br>

   return vrshrq_n_u16(a, 3);<br>

 }<br>

<br>

@@ -5092,7 +5092,7 @@ int16x8_t test_vrshrq_n_u16(int16x8_t a)<br>

 // CHECK:   [[VRSHR_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32><br>

 // CHECK:   [[VRSHR_N1:%.*]] = call <4 x i32> @llvm.aarch64.neon.urshl.v4i32(<4 x i32> [[VRSHR_N]], <4 x i32> <i32 -3, i32 -3, i32 -3, i32 -3>)<br>

 // CHECK:   ret <4 x i32> [[VRSHR_N1]]<br>

-int32x4_t test_vrshrq_n_u32(int32x4_t a) {<br>

+uint32x4_t test_vrshrq_n_u32(uint32x4_t a) {<br>

   return vrshrq_n_u32(a, 3);<br>

 }<br>

<br>

@@ -5101,7 +5101,7 @@ int32x4_t test_vrshrq_n_u32(int32x4_t a)<br>

 // CHECK:   [[VRSHR_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <2 x i64><br>

 // CHECK:   [[VRSHR_N1:%.*]] = call <2 x i64> @llvm.aarch64.neon.urshl.v2i64(<2 x i64> [[VRSHR_N]], <2 x i64> <i64 -3, i64 -3>)<br>

 // CHECK:   ret <2 x i64> [[VRSHR_N1]]<br>

-int64x2_t test_vrshrq_n_u64(int64x2_t a) {<br>

+uint64x2_t test_vrshrq_n_u64(uint64x2_t a) {<br>

   return vrshrq_n_u64(a, 3);<br>

 }<br>

<br>

@@ -5185,7 +5185,7 @@ int64x2_t test_vrsraq_n_s64(int64x2_t a,<br>

 // CHECK:   [[VRSHR_N:%.*]] = call <8 x i8> @llvm.aarch64.neon.urshl.v8i8(<8 x i8> %b, <8 x i8> <i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3>)<br>

 // CHECK:   [[TMP0:%.*]] = add <8 x i8> %a, [[VRSHR_N]]<br>

 // CHECK:   ret <8 x i8> [[TMP0]]<br>

-int8x8_t test_vrsra_n_u8(int8x8_t a, int8x8_t b) {<br>

+uint8x8_t test_vrsra_n_u8(uint8x8_t a, uint8x8_t b) {<br>

   return vrsra_n_u8(a, b, 3);<br>

 }<br>

<br>

@@ -5197,7 +5197,7 @@ int8x8_t test_vrsra_n_u8(int8x8_t a, int<br>

 // CHECK:   [[TMP2:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16><br>

 // CHECK:   [[TMP3:%.*]] = add <4 x i16> [[TMP2]], [[VRSHR_N1]]<br>

 // CHECK:   ret <4 x i16> [[TMP3]]<br>

-int16x4_t test_vrsra_n_u16(int16x4_t a, int16x4_t b) {<br>

+uint16x4_t test_vrsra_n_u16(uint16x4_t a, uint16x4_t b) {<br>

   return vrsra_n_u16(a, b, 3);<br>

 }<br>

<br>

@@ -5209,7 +5209,7 @@ int16x4_t test_vrsra_n_u16(int16x4_t a,<br>

 // CHECK:   [[TMP2:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32><br>

 // CHECK:   [[TMP3:%.*]] = add <2 x i32> [[TMP2]], [[VRSHR_N1]]<br>

 // CHECK:   ret <2 x i32> [[TMP3]]<br>

-int32x2_t test_vrsra_n_u32(int32x2_t a, int32x2_t b) {<br>

+uint32x2_t test_vrsra_n_u32(uint32x2_t a, uint32x2_t b) {<br>

   return vrsra_n_u32(a, b, 3);<br>

 }<br>

<br>

@@ -5217,7 +5217,7 @@ int32x2_t test_vrsra_n_u32(int32x2_t a,<br>

 // CHECK:   [[VRSHR_N:%.*]] = call <16 x i8> @llvm.aarch64.neon.urshl.v16i8(<16 x i8> %b, <16 x i8> <i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3, i8 -3>)<br>

 // CHECK:   [[TMP0:%.*]] = add <16 x i8> %a, [[VRSHR_N]]<br>

 // CHECK:   ret <16 x i8> [[TMP0]]<br>

-int8x16_t test_vrsraq_n_u8(int8x16_t a, int8x16_t b) {<br>

+uint8x16_t test_vrsraq_n_u8(uint8x16_t a, uint8x16_t b) {<br>

   return vrsraq_n_u8(a, b, 3);<br>

 }<br>

<br>

@@ -5229,7 +5229,7 @@ int8x16_t test_vrsraq_n_u8(int8x16_t a,<br>

 // CHECK:   [[TMP2:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16><br>

 // CHECK:   [[TMP3:%.*]] = add <8 x i16> [[TMP2]], [[VRSHR_N1]]<br>

 // CHECK:   ret <8 x i16> [[TMP3]]<br>

-int16x8_t test_vrsraq_n_u16(int16x8_t a, int16x8_t b) {<br>

+uint16x8_t test_vrsraq_n_u16(uint16x8_t a, uint16x8_t b) {<br>

   return vrsraq_n_u16(a, b, 3);<br>

 }<br>

<br>

@@ -5241,7 +5241,7 @@ int16x8_t test_vrsraq_n_u16(int16x8_t a,<br>

 // CHECK:   [[TMP2:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32><br>

 // CHECK:   [[TMP3:%.*]] = add <4 x i32> [[TMP2]], [[VRSHR_N1]]<br>

 // CHECK:   ret <4 x i32> [[TMP3]]<br>

-int32x4_t test_vrsraq_n_u32(int32x4_t a, int32x4_t b) {<br>

+uint32x4_t test_vrsraq_n_u32(uint32x4_t a, uint32x4_t b) {<br>

   return vrsraq_n_u32(a, b, 3);<br>

 }<br>

<br>

@@ -5253,7 +5253,7 @@ int32x4_t test_vrsraq_n_u32(int32x4_t a,<br>

 // CHECK:   [[TMP2:%.*]] = bitcast <16 x i8> [[TMP0]] to <2 x i64><br>

 // CHECK:   [[TMP3:%.*]] = add <2 x i64> [[TMP2]], [[VRSHR_N1]]<br>

 // CHECK:   ret <2 x i64> [[TMP3]]<br>

-int64x2_t test_vrsraq_n_u64(int64x2_t a, int64x2_t b) {<br>

+uint64x2_t test_vrsraq_n_u64(uint64x2_t a, uint64x2_t b) {<br>

   return vrsraq_n_u64(a, b, 3);<br>

 }<br>

<br>

@@ -5329,7 +5329,7 @@ int64x2_t test_vsriq_n_s64(int64x2_t a,<br>

 // CHECK-LABEL: @test_vsri_n_u8(<br>

 // CHECK:   [[VSRI_N:%.*]] = call <8 x i8> @llvm.aarch64.neon.vsri.v8i8(<8 x i8> %a, <8 x i8> %b, i32 3)<br>

 // CHECK:   ret <8 x i8> [[VSRI_N]]<br>

-int8x8_t test_vsri_n_u8(int8x8_t a, int8x8_t b) {<br>

+uint8x8_t test_vsri_n_u8(uint8x8_t a, uint8x8_t b) {<br>

   return vsri_n_u8(a, b, 3);<br>

 }<br>

<br>

@@ -5340,7 +5340,7 @@ int8x8_t test_vsri_n_u8(int8x8_t a, int8<br>

 // CHECK:   [[VSRI_N1:%.*]] = bitcast <8 x i8> [[TMP1]] to <4 x i16><br>

 // CHECK:   [[VSRI_N2:%.*]] = call <4 x i16> @llvm.aarch64.neon.vsri.v4i16(<4 x i16> [[VSRI_N]], <4 x i16> [[VSRI_N1]], i32 3)<br>

 // CHECK:   ret <4 x i16> [[VSRI_N2]]<br>

-int16x4_t test_vsri_n_u16(int16x4_t a, int16x4_t b) {<br>

+uint16x4_t test_vsri_n_u16(uint16x4_t a, uint16x4_t b) {<br>

   return vsri_n_u16(a, b, 3);<br>

 }<br>

<br>

@@ -5351,14 +5351,14 @@ int16x4_t test_vsri_n_u16(int16x4_t a, i<br>

 // CHECK:   [[VSRI_N1:%.*]] = bitcast <8 x i8> [[TMP1]] to <2 x i32><br>

 // CHECK:   [[VSRI_N2:%.*]] = call <2 x i32> @llvm.aarch64.neon.vsri.v2i32(<2 x i32> [[VSRI_N]], <2 x i32> [[VSRI_N1]], i32 3)<br>

 // CHECK:   ret <2 x i32> [[VSRI_N2]]<br>

-int32x2_t test_vsri_n_u32(int32x2_t a, int32x2_t b) {<br>

+uint32x2_t test_vsri_n_u32(uint32x2_t a, uint32x2_t b) {<br>

   return vsri_n_u32(a, b, 3);<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vsriq_n_u8(<br>

 // CHECK:   [[VSRI_N:%.*]] = call <16 x i8> @llvm.aarch64.neon.vsri.v16i8(<16 x i8> %a, <16 x i8> %b, i32 3)<br>

 // CHECK:   ret <16 x i8> [[VSRI_N]]<br>

-int8x16_t test_vsriq_n_u8(int8x16_t a, int8x16_t b) {<br>

+uint8x16_t test_vsriq_n_u8(uint8x16_t a, uint8x16_t b) {<br>

   return vsriq_n_u8(a, b, 3);<br>

 }<br>

<br>

@@ -5369,7 +5369,7 @@ int8x16_t test_vsriq_n_u8(int8x16_t a, i<br>

 // CHECK:   [[VSRI_N1:%.*]] = bitcast <16 x i8> [[TMP1]] to <8 x i16><br>

 // CHECK:   [[VSRI_N2:%.*]] = call <8 x i16> @llvm.aarch64.neon.vsri.v8i16(<8 x i16> [[VSRI_N]], <8 x i16> [[VSRI_N1]], i32 3)<br>

 // CHECK:   ret <8 x i16> [[VSRI_N2]]<br>

-int16x8_t test_vsriq_n_u16(int16x8_t a, int16x8_t b) {<br>

+uint16x8_t test_vsriq_n_u16(uint16x8_t a, uint16x8_t b) {<br>

   return vsriq_n_u16(a, b, 3);<br>

 }<br>

<br>

@@ -5380,7 +5380,7 @@ int16x8_t test_vsriq_n_u16(int16x8_t a,<br>

 // CHECK:   [[VSRI_N1:%.*]] = bitcast <16 x i8> [[TMP1]] to <4 x i32><br>

 // CHECK:   [[VSRI_N2:%.*]] = call <4 x i32> @llvm.aarch64.neon.vsri.v4i32(<4 x i32> [[VSRI_N]], <4 x i32> [[VSRI_N1]], i32 3)<br>

 // CHECK:   ret <4 x i32> [[VSRI_N2]]<br>

-int32x4_t test_vsriq_n_u32(int32x4_t a, int32x4_t b) {<br>

+uint32x4_t test_vsriq_n_u32(uint32x4_t a, uint32x4_t b) {<br>

   return vsriq_n_u32(a, b, 3);<br>

 }<br>

<br>

@@ -5391,7 +5391,7 @@ int32x4_t test_vsriq_n_u32(int32x4_t a,<br>

 // CHECK:   [[VSRI_N1:%.*]] = bitcast <16 x i8> [[TMP1]] to <2 x i64><br>

 // CHECK:   [[VSRI_N2:%.*]] = call <2 x i64> @llvm.aarch64.neon.vsri.v2i64(<2 x i64> [[VSRI_N]], <2 x i64> [[VSRI_N1]], i32 3)<br>

 // CHECK:   ret <2 x i64> [[VSRI_N2]]<br>

-int64x2_t test_vsriq_n_u64(int64x2_t a, int64x2_t b) {<br>

+uint64x2_t test_vsriq_n_u64(uint64x2_t a, uint64x2_t b) {<br>

   return vsriq_n_u64(a, b, 3);<br>

 }<br>

<br>

@@ -5608,7 +5608,7 @@ poly16x8_t test_vsliq_n_p16(poly16x8_t a<br>

 // CHECK-LABEL: @test_vqshlu_n_s8(<br>

 // CHECK:   [[VQSHLU_N:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshlu.v8i8(<8 x i8> %a, <8 x i8> <i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3>)<br>

 // CHECK:   ret <8 x i8> [[VQSHLU_N]]<br>

-int8x8_t test_vqshlu_n_s8(int8x8_t a) {<br>

+uint8x8_t test_vqshlu_n_s8(int8x8_t a) {<br>

   return vqshlu_n_s8(a, 3);<br>

 }<br>

<br>

@@ -5617,7 +5617,7 @@ int8x8_t test_vqshlu_n_s8(int8x8_t a) {<br>

 // CHECK:   [[VQSHLU_N:%.*]] = bitcast <8 x i8> [[TMP0]] to <4 x i16><br>

 // CHECK:   [[VQSHLU_N1:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshlu.v4i16(<4 x i16> [[VQSHLU_N]], <4 x i16> <i16 3, i16 3, i16 3, i16 3>)<br>

 // CHECK:   ret <4 x i16> [[VQSHLU_N1]]<br>

-int16x4_t test_vqshlu_n_s16(int16x4_t a) {<br>

+uint16x4_t test_vqshlu_n_s16(int16x4_t a) {<br>

   return vqshlu_n_s16(a, 3);<br>

 }<br>

<br>

@@ -5626,14 +5626,14 @@ int16x4_t test_vqshlu_n_s16(int16x4_t a)<br>

 // CHECK:   [[VQSHLU_N:%.*]] = bitcast <8 x i8> [[TMP0]] to <2 x i32><br>

 // CHECK:   [[VQSHLU_N1:%.*]] = call <2 x i32> @llvm.aarch64.neon.sqshlu.v2i32(<2 x i32> [[VQSHLU_N]], <2 x i32> <i32 3, i32 3>)<br>

 // CHECK:   ret <2 x i32> [[VQSHLU_N1]]<br>

-int32x2_t test_vqshlu_n_s32(int32x2_t a) {<br>

+uint32x2_t test_vqshlu_n_s32(int32x2_t a) {<br>

   return vqshlu_n_s32(a, 3);<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vqshluq_n_s8(<br>

 // CHECK:   [[VQSHLU_N:%.*]] = call <16 x i8> @llvm.aarch64.neon.sqshlu.v16i8(<16 x i8> %a, <16 x i8> <i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3, i8 3>)<br>

 // CHECK:   ret <16 x i8> [[VQSHLU_N]]<br>

-int8x16_t test_vqshluq_n_s8(int8x16_t a) {<br>

+uint8x16_t test_vqshluq_n_s8(int8x16_t a) {<br>

   return vqshluq_n_s8(a, 3);<br>

 }<br>

<br>

@@ -5642,7 +5642,7 @@ int8x16_t test_vqshluq_n_s8(int8x16_t a)<br>

 // CHECK:   [[VQSHLU_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16><br>

 // CHECK:   [[VQSHLU_N1:%.*]] = call <8 x i16> @llvm.aarch64.neon.sqshlu.v8i16(<8 x i16> [[VQSHLU_N]], <8 x i16> <i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3, i16 3>)<br>

 // CHECK:   ret <8 x i16> [[VQSHLU_N1]]<br>

-int16x8_t test_vqshluq_n_s16(int16x8_t a) {<br>

+uint16x8_t test_vqshluq_n_s16(int16x8_t a) {<br>

   return vqshluq_n_s16(a, 3);<br>

 }<br>

<br>

@@ -5651,7 +5651,7 @@ int16x8_t test_vqshluq_n_s16(int16x8_t a<br>

 // CHECK:   [[VQSHLU_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32><br>

 // CHECK:   [[VQSHLU_N1:%.*]] = call <4 x i32> @llvm.aarch64.neon.sqshlu.v4i32(<4 x i32> [[VQSHLU_N]], <4 x i32> <i32 3, i32 3, i32 3, i32 3>)<br>

 // CHECK:   ret <4 x i32> [[VQSHLU_N1]]<br>

-int32x4_t test_vqshluq_n_s32(int32x4_t a) {<br>

+uint32x4_t test_vqshluq_n_s32(int32x4_t a) {<br>

   return vqshluq_n_s32(a, 3);<br>

 }<br>

<br>

@@ -5660,7 +5660,7 @@ int32x4_t test_vqshluq_n_s32(int32x4_t a<br>

 // CHECK:   [[VQSHLU_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <2 x i64><br>

 // CHECK:   [[VQSHLU_N1:%.*]] = call <2 x i64> @llvm.aarch64.neon.sqshlu.v2i64(<2 x i64> [[VQSHLU_N]], <2 x i64> <i64 3, i64 3>)<br>

 // CHECK:   ret <2 x i64> [[VQSHLU_N1]]<br>

-int64x2_t test_vqshluq_n_s64(int64x2_t a) {<br>

+uint64x2_t test_vqshluq_n_s64(int64x2_t a) {<br>

   return vqshluq_n_s64(a, 3);<br>

 }<br>

<br>

@@ -5795,7 +5795,7 @@ uint32x4_t test_vshrn_high_n_u64(uint32x<br>

 // CHECK:   [[VQSHRUN_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16><br>

 // CHECK:   [[VQSHRUN_N1:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqshrun.v8i8(<8 x i16> [[VQSHRUN_N]], i32 3)<br>

 // CHECK:   ret <8 x i8> [[VQSHRUN_N1]]<br>

-int8x8_t test_vqshrun_n_s16(int16x8_t a) {<br>

+uint8x8_t test_vqshrun_n_s16(int16x8_t a) {<br>

   return vqshrun_n_s16(a, 3);<br>

 }<br>

<br>

@@ -5804,7 +5804,7 @@ int8x8_t test_vqshrun_n_s16(int16x8_t a)<br>

 // CHECK:   [[VQSHRUN_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32><br>

 // CHECK:   [[VQSHRUN_N1:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqshrun.v4i16(<4 x i32> [[VQSHRUN_N]], i32 9)<br>

 // CHECK:   ret <4 x i16> [[VQSHRUN_N1]]<br>

-int16x4_t test_vqshrun_n_s32(int32x4_t a) {<br>

+uint16x4_t test_vqshrun_n_s32(int32x4_t a) {<br>

   return vqshrun_n_s32(a, 9);<br>

 }<br>

<br>

@@ -5813,7 +5813,7 @@ int16x4_t test_vqshrun_n_s32(int32x4_t a<br>

 // CHECK:   [[VQSHRUN_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <2 x i64><br>

 // CHECK:   [[VQSHRUN_N1:%.*]] = call <2 x i32> @llvm.aarch64.neon.sqshrun.v2i32(<2 x i64> [[VQSHRUN_N]], i32 19)<br>

 // CHECK:   ret <2 x i32> [[VQSHRUN_N1]]<br>

-int32x2_t test_vqshrun_n_s64(int64x2_t a) {<br>

+uint32x2_t test_vqshrun_n_s64(int64x2_t a) {<br>

   return vqshrun_n_s64(a, 19);<br>

 }<br>

<br>

@@ -5966,7 +5966,7 @@ uint32x4_t test_vrshrn_high_n_u64(uint32<br>

 // CHECK:   [[VQRSHRUN_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <8 x i16><br>

 // CHECK:   [[VQRSHRUN_N1:%.*]] = call <8 x i8> @llvm.aarch64.neon.sqrshrun.v8i8(<8 x i16> [[VQRSHRUN_N]], i32 3)<br>

 // CHECK:   ret <8 x i8> [[VQRSHRUN_N1]]<br>

-int8x8_t test_vqrshrun_n_s16(int16x8_t a) {<br>

+uint8x8_t test_vqrshrun_n_s16(int16x8_t a) {<br>

   return vqrshrun_n_s16(a, 3);<br>

 }<br>

<br>

@@ -5975,7 +5975,7 @@ int8x8_t test_vqrshrun_n_s16(int16x8_t a<br>

 // CHECK:   [[VQRSHRUN_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <4 x i32><br>

 // CHECK:   [[VQRSHRUN_N1:%.*]] = call <4 x i16> @llvm.aarch64.neon.sqrshrun.v4i16(<4 x i32> [[VQRSHRUN_N]], i32 9)<br>

 // CHECK:   ret <4 x i16> [[VQRSHRUN_N1]]<br>

-int16x4_t test_vqrshrun_n_s32(int32x4_t a) {<br>

+uint16x4_t test_vqrshrun_n_s32(int32x4_t a) {<br>

   return vqrshrun_n_s32(a, 9);<br>

 }<br>

<br>

@@ -5984,7 +5984,7 @@ int16x4_t test_vqrshrun_n_s32(int32x4_t<br>

 // CHECK:   [[VQRSHRUN_N:%.*]] = bitcast <16 x i8> [[TMP0]] to <2 x i64><br>

 // CHECK:   [[VQRSHRUN_N1:%.*]] = call <2 x i32> @llvm.aarch64.neon.sqrshrun.v2i32(<2 x i64> [[VQRSHRUN_N]], i32 19)<br>

 // CHECK:   ret <2 x i32> [[VQRSHRUN_N1]]<br>

-int32x2_t test_vqrshrun_n_s64(int64x2_t a) {<br>

+uint32x2_t test_vqrshrun_n_s64(int64x2_t a) {<br>

   return vqrshrun_n_s64(a, 19);<br>

 }<br>

<br>

<br>

Modified: cfe/trunk/test/CodeGen/arm_neon_intrinsics.c<br>

URL: <a href="http://llvm.org/viewvc/llvm-project/cfe/trunk/test/CodeGen/arm_neon_intrinsics.c?rev=374419&r1=374418&r2=374419&view=diff" rel="noreferrer" target="_blank">http://llvm.org/viewvc/llvm-project/cfe/trunk/test/CodeGen/arm_neon_intrinsics.c?rev=374419&r1=374418&r2=374419&view=diff</a><br>

==============================================================================<br>

--- cfe/trunk/test/CodeGen/arm_neon_intrinsics.c (original)<br>

+++ cfe/trunk/test/CodeGen/arm_neon_intrinsics.c Thu Oct 10 11:45:34 2019<br>

@@ -1,6 +1,7 @@<br>

 // RUN: %clang_cc1 -triple thumbv7s-apple-darwin -target-abi apcs-gnu\<br>

 // RUN:  -target-cpu swift -fallow-half-arguments-and-returns \<br>

 // RUN:  -target-feature +fullfp16 -ffreestanding \<br>

+// RUN:  -flax-vector-conversions=none \<br>

 // RUN:  -disable-O0-optnone -emit-llvm -o - %s \<br>

 // RUN:  | opt -S -mem2reg | FileCheck %s<br>

<br>

@@ -2184,8 +2185,8 @@ float32x2_t test_vcreate_f32(uint64_t a)<br>

 // CHECK:   [[TMP0:%.*]] = bitcast i64 %a to <8 x i8><br>

 // CHECK:   [[VCLZ_V_I:%.*]] = call <8 x i8> @llvm.ctlz.v8i8(<8 x i8> [[TMP0]], i1 false)<br>

 // CHECK:   ret <8 x i8> [[VCLZ_V_I]]<br>

-uint8x8_t test_vcreate_u8(uint64_t a) {<br>

-  return vclz_s8(vcreate_u8(a));<br>

+int8x8_t test_vcreate_u8(uint64_t a) {<br>

+  return vclz_s8((int8x8_t)vcreate_u8(a));<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vcreate_u16(<br>

@@ -2194,8 +2195,8 @@ uint8x8_t test_vcreate_u8(uint64_t a) {<br>

 // CHECK:   [[VCLZ_V1_I:%.*]] = call <4 x i16> @llvm.ctlz.v4i16(<4 x i16> [[TMP0]], i1 false)<br>

 // CHECK:   [[VCLZ_V2_I:%.*]] = bitcast <4 x i16> [[VCLZ_V1_I]] to <8 x i8><br>

 // CHECK:   ret <4 x i16> [[VCLZ_V1_I]]<br>

-uint16x4_t test_vcreate_u16(uint64_t a) {<br>

-  return vclz_s16(vcreate_u16(a));<br>

+int16x4_t test_vcreate_u16(uint64_t a) {<br>

+  return vclz_s16((int16x4_t)vcreate_u16(a));<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vcreate_u32(<br>

@@ -2204,8 +2205,8 @@ uint16x4_t test_vcreate_u16(uint64_t a)<br>

 // CHECK:   [[VCLZ_V1_I:%.*]] = call <2 x i32> @llvm.ctlz.v2i32(<2 x i32> [[TMP0]], i1 false)<br>

 // CHECK:   [[VCLZ_V2_I:%.*]] = bitcast <2 x i32> [[VCLZ_V1_I]] to <8 x i8><br>

 // CHECK:   ret <2 x i32> [[VCLZ_V1_I]]<br>

-uint32x2_t test_vcreate_u32(uint64_t a) {<br>

-  return vclz_s32(vcreate_u32(a));<br>

+int32x2_t test_vcreate_u32(uint64_t a) {<br>

+  return vclz_s32((int32x2_t)vcreate_u32(a));<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vcreate_u64(<br>

@@ -2235,7 +2236,7 @@ poly8x8_t test_vcreate_p8(uint64_t a) {<br>

 // CHECK:   ret <4 x i16> [[TMP4]]<br>

 poly16x4_t test_vcreate_p16(uint64_t a) {<br>

   poly16x4_t tmp = vcreate_p16(a);<br>

-  return vbsl_p16(tmp, tmp, tmp);<br>

+  return vbsl_p16((uint16x4_t)tmp, tmp, tmp);<br>

 }<br>

<br>

 // CHECK-LABEL: @test_vcreate_s64(<br>

@@ -2830,8 +2831,8 @@ int64x1_t test_vdup_n_s64(int64_t a) {<br>

 // CHECK:   [[VECINIT_I:%.*]] = insertelement <1 x i64> undef, i64 %a, i32 0<br>

 // CHECK:   [[ADD_I:%.*]] = add <1 x i64> [[VECINIT_I]], [[VECINIT_I]]<br>

 // CHECK:   ret <1 x i64> [[ADD_I]]<br>

-uint64x1_t test_vdup_n_u64(uint64_t a) {<br>

-  int64x1_t tmp = vdup_n_u64(a);<br>

+int64x1_t test_vdup_n_u64(uint64_t a) {<br>

+  int64x1_t tmp = (int64x1_t)vdup_n_u64(a);<br>

   return vadd_s64(tmp, tmp);<br>

 }<br>

<br>

@@ -2851,7 +2852,7 @@ int64x2_t test_vdupq_n_s64(int64_t a) {<br>

 // CHECK:   [[ADD_I:%.*]] = add <2 x i64> [[VECINIT1_I]], [[VECINIT1_I]]<br>

 // CHECK:   ret <2 x i64> [[ADD_I]]<br>

 uint64x2_t test_vdupq_n_u64(uint64_t a) {<br>

-  int64x2_t tmp = vdupq_n_u64(a);<br>

+  uint64x2_t tmp = vdupq_n_u64(a);<br>

   return vaddq_u64(tmp, tmp);<br>

 }<br>

<br>

<br>

Modified: cfe/trunk/test/Headers/arm-neon-header.c<br>

URL: <a href="http://llvm.org/viewvc/llvm-project/cfe/trunk/test/Headers/arm-neon-header.c?rev=374419&r1=374418&r2=374419&view=diff" rel="noreferrer" target="_blank">http://llvm.org/viewvc/llvm-project/cfe/trunk/test/Headers/arm-neon-header.c?rev=374419&r1=374418&r2=374419&view=diff</a><br>

==============================================================================<br>

--- cfe/trunk/test/Headers/arm-neon-header.c (original)<br>

+++ cfe/trunk/test/Headers/arm-neon-header.c Thu Oct 10 11:45:34 2019<br>

@@ -20,7 +20,7 @@<br>

 // RUN: %clang -fsyntax-only -Wall -Werror -ffreestanding -nostdinc++ --target=aarch64_be-none-eabi -march=armv8.2-a+fp16 -std=c++14 -xc++ %s<br>

 // RUN: %clang -fsyntax-only -Wall -Werror -ffreestanding -nostdinc++ --target=aarch64_be-none-eabi -march=armv8.2-a+fp16 -std=c++17 -xc++ %s<br>

<br>

-// RUN: %clang -fsyntax-only -Wall -Werror -ffreestanding --target=aarch64-none-eabi -march=armv8.2-a+fp16 -std=c11 -xc -flax-vector-conversions=none %s<br>

-// RUN: %clang -fsyntax-only -Wall -Werror -ffreestanding --target=aarch64_be-none-eabi -march=armv8.2-a+fp16 -std=c11 -xc -flax-vector-conversions=none %s<br>

+// RUN: %clang -fsyntax-only -Wall -Werror -ffreestanding --target=aarch64-none-eabi -march=armv8.2-a+fp16fml+crypto+dotprod -std=c11 -xc -flax-vector-conversions=none %s<br>

+// RUN: %clang -fsyntax-only -Wall -Werror -ffreestanding --target=aarch64_be-none-eabi -march=armv8.2-a+fp16fml+crypto+dotprod -std=c11 -xc -flax-vector-conversions=none %s<br>

<br>

 #include <arm_neon.h><br>

<br>

Modified: cfe/trunk/utils/TableGen/NeonEmitter.cpp<br>

URL: <a href="http://llvm.org/viewvc/llvm-project/cfe/trunk/utils/TableGen/NeonEmitter.cpp?rev=374419&r1=374418&r2=374419&view=diff" rel="noreferrer" target="_blank">http://llvm.org/viewvc/llvm-project/cfe/trunk/utils/TableGen/NeonEmitter.cpp?rev=374419&r1=374418&r2=374419&view=diff</a><br>

==============================================================================<br>

--- cfe/trunk/utils/TableGen/NeonEmitter.cpp (original)<br>

+++ cfe/trunk/utils/TableGen/NeonEmitter.cpp Thu Oct 10 11:45:34 2019<br>

@@ -1413,7 +1413,7 @@ void Intrinsic::emitBodyAsBuiltinCall()<br>

     if (T.getNumVectors() > 1) {<br>

       // Check if an explicit cast is needed.<br>

       std::string Cast;<br>

-      if (T.isChar() || T.isPoly() || !T.isSigned()) {<br>

+      if (LocalCK == ClassB) {<br>

         Type T2 = T;<br>

         T2.makeOneVector();<br>

         T2.makeInteger(8, /*Signed=*/true);<br>

@@ -1445,6 +1445,9 @@ void Intrinsic::emitBodyAsBuiltinCall()<br>

     if (CastToType.isVector() && LocalCK == ClassB) {<br>

       CastToType.makeInteger(8, true);<br>

       Arg = "(" + CastToType.str() + ")" + Arg;<br>

+    } else if (CastToType.isVector() && LocalCK == ClassI) {<br>

+      CastToType.makeSigned();<br>

+      Arg = "(" + CastToType.str() + ")" + Arg;<br>

     }<br>

<br>

     S += Arg + ", ";<br>

<br>

<br>

_______________________________________________<br>

cfe-commits mailing list<br>

<a href="mailto:cfe-commits@lists.llvm.org" target="_blank">cfe-commits@lists.llvm.org</a><br>

<a href="https://lists.llvm.org/cgi-bin/mailman/listinfo/cfe-commits" rel="noreferrer" target="_blank">https://lists.llvm.org/cgi-bin/mailman/listinfo/cfe-commits</a><br>

</blockquote></div>