<div dir="ltr">Follow-up: Or should it be SASS code that should be instrumented?!!<div><br></div><div>See: <a href="https://github.com/NVlabs/SASSI">https://github.com/NVlabs/SASSI</a></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Nov 18, 2016 at 1:55 PM, Gurunath Kadam <span dir="ltr"><<a href="mailto:gurunath.kadam@gmail.com" target="_blank">gurunath.kadam@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi,<div><br></div><div>I am not sure if there is any CUDA/PTX instrumenting feature in LLVM.</div><div><br></div><div>I want to generated a simple memory trace and I know GPGPU Ocelot does that. But I was thinking why not LLVM.</div><div><br></div><div>So I am looking at two optimizations implemented in LLVM for CUDA for some inspiration.</div><div><br></div><div>1. Address inference: Does this use PTX IR or LLVM IR? I would say LLVM IR based on some code keywords like PHI nodes etc.</div><div><br></div><div>2. Bypass slow div: This is a generic optimization done adopted for CUDA. I think it uses LLVM IR.</div><div><br></div><div>So my question is, to instrument PTX code, shall I focus on LLVM IR or PTX?</div><div><br></div><div>Some definite guidance on these lines will be very helpful. Thank you.</div><div><br></div><div>Sincerely,</div><div>Gurunath</div></div>
</blockquote></div><br></div>