<div dir="ltr">Hello everyone<div><br></div><div>I was wondering, what the correct way of using an AMDGPU generated kernel code for OpenCL was. I am trying to provide Polly's GPGPU Code generation with the ability to run on different GPU devices, such as AMD GPUs.</div><div><br></div><div>For NVIDIA, I simply retrieve a pre-compiled PTX string from the NVPTX backend and pass that to OpenCL's 'clCreateProgramWithBinary' function. However, when doing the same with the AMDGPU backend and its returned kernel string, OpenCL complains about an invalid binary.</div><div>This has been tried with a number of different target triples (eg. 'amdgcn--', 'amdgcn-amd-amdhsa' etc), and my assumption so far is, that I am not trying the correct Triple. </div><div>Or am I missing something entirely, and there have to be additional steps, to get the correct ELF binary?</div><div><br></div><div>Thank you in advance for any help and pointers!</div><div><br></div><div>Best,</div><div>Philipp</div></div>