Hi Justin,<br><br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">the non-translatable IR with GPU code replaced by appropriate CUDA Driver API calls. </blockquote>
</div><br><div>One of CUDA driver apis  (cuLaunch) need a ptx asm string as its input. So if I want to provide a one-touch solution and don't introduce any changes to tools outside polly, I must prepare the ptx string before I can generate the correct non-translatable IR part.</div>
<div><br></div><div>As your suggestion, It may be implemented as leaving an input parameter slot for ptx string in the main method of the non-translatable IR part.  Maybe I can implement both versions of this. Let Tobi judge which one is better to be integrated into polly.</div>
<div><br></div><div>best regards,</div><div>Yabin</div>