<div dir="ltr">Hi,<div>I can not get a simple loop like below:</div><div><br></div><div>#pragma omp target parallel for map(to: nranks)<br>  for ( thread rank = 0; rank < nranks;<br>        ++rank )<br>  {<br></div><div>  }</div><div><br></div><div>offload to the device at run time; I am getting these:</div><div>Libomptarget --> Entering target region with entry point 0x000010000191abd6 and device Id -1<br>Libomptarget --> Checking whether device 0 is ready.<br>Libomptarget --> Is the device 0 (local ID 0) initialized? 0<br>Target CUDA RTL --> Init requires flags to 1<br>Target CUDA RTL --> Getting device 0<br>Target CUDA RTL --> Max CUDA blocks per grid 2147483647 exceeds the hard team limit 65536, capping at the hard limit<br>Target CUDA RTL --> Using 1024 CUDA threads per block<br>Target CUDA RTL --> Max number of CUDA blocks 65536, threads 1024 & warp size 32<br>Target CUDA RTL --> Default number of teams set according to library's default 128<br>Target CUDA RTL --> Default number of threads set according to library's default 128<br>Libomptarget --> Device 0 is ready to use.<br>Target CUDA RTL --> Load data from image 0x000000001006bc00<br>Target CUDA RTL --> CUDA module successfully loaded!<br>Target CUDA RTL --> Sending global device environment data 4 bytes<br>Libomptarget --> Unable to generate entries table for device id 0.<br>Libomptarget --> Failed to init globals on device 0<br>Libomptarget --> Failed to get device 0 ready<br>Libomptarget fatal error 1: failure of target construct while offloading is mandatory<br></div><div><br></div><div>In a simple test code the above works as expected, so I am stuck at this </div><div>moment. Any help would be appreciated.</div></div>