<div dir="ltr"><div><div><div>Hi,<br><br></div>Using the flow described here: <a href="https://parallel-computing.pro/index.php/9-cuda/43-openmp-4-0-on-nvidia-cuda-gpus">https://parallel-computing.pro/index.php/9-cuda/43-openmp-4-0-on-nvidia-cuda-gpus</a>, I can compile and run OpenMP code on GPUs when the parallel region is self-contained (i.e., does not include calls to functions).<br><br><br></div>When the parallel region includes a call to a function (e.g., foo()), I get this error.<br><br>nvlink error   : Undefined reference to 'foo' in '/tmp/test.o-e8741d.cubin'<br><br><br></div><div>"foo" is indeed declared and defined in the same file before the main function, but clang driver does not include it in the final PTX file (test.s.tgt-nvptx64sm_30-nvidia-linux). <br><br></div><div><br><br>Using CUDA terminology, Is having "device functions" not supported yet in OpenMP ?<br><br><br></div><div>Thanks.<br></div><div><div><br><br></div></div></div>