Hello,<br><br>The population count intrinsic (ctpop) is supported on ARM/NEON for v8i8 and v16i8 types via NEON's vcnt instruction.<br>This patch leverages vcnt and other NEON instructions to custom lower ctpop for v2i32/v4i32 and v4i16/v8i16 types.<br>
As you'll see, a fair chunk of this patch is comments describing the lowering, which I am happy to adjust to people's liking.<br>Please review!<br>Thanks!<br><br>Pete<br><br>