Dear all,<br><br>Is anybody working on CUDA launch bounds support?<br><br>On PTX level, __attribute__((launch_bounds(MAX_THREADS_PER_BLOCK, MIN_BLOCKS_PER_MP))) should be emitted into .maxntid / .minnctapersm specification.<br>
<br>Thanks,<br>- D.<br>