<div dir="ltr"><div>Would it be possible to support generating CPU-specific SVE code?</div><div>This could be useful for JIT, e.g. Julia.</div><div><br></div><div>Currently, when using `-mcpu=a64fx`, `<8 x double>` gets split into 4 NEON instructions:</div><div><a href="https://godbolt.org/z/cEf1Pfvx8">https://godbolt.org/z/cEf1Pfvx8</a></div><div>If I understand correctly, I'd need to use `<vscale x 2 x double>` to actually generate SVE code. However, Julia currently has no way of representing such variable sized types without allocating to the heap -- awkward for a variable that's supposed to live in the registers! -- for writing intrinsics. Some libraries make extensive use of intrinsics operating on vector types like (`<8 x double>`) for defining compute kernels, and as is they are incompatible with SVE.</div><div><br></div><div><br></div></div>