<div dir="ltr"><div>That's what I figured. Hopefully, I can generate some PTX with register allocation and instruction scheduling similar to the SASS. That would really help with the correlation number of the simulator to hardware. Thanks for the help, Dmitry!<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Dec 16, 2019 at 12:01 PM Dmitry Mikushin <<a href="mailto:dmitry@kernelgen.org">dmitry@kernelgen.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Well, beyond the NVPTX user guide [1], information has to be retrieved directly from the Targets/nvptx code. There you will see the register numbering pretty much follows the SSA numbering. This would have to be coupled with the real register allocation code from any other backend.<div><br></div><div>Please note SASS also does scheduling, meaning that the register allocation alone might not serve the proper instruction placement for the real hardware.<br><div><br></div><div>[1] <a href="https://llvm.org/docs/NVPTXUsage.html" target="_blank">https://llvm.org/docs/NVPTXUsage.html</a></div></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">пн, 16 дек. 2019 г. в 17:58, CoffeeBeforeArch via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><br><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">---------- Forwarded message ---------<br>From: <b class="gmail_sendername" dir="auto">CoffeeBeforeArch</b> <span dir="auto"><<a href="mailto:coffeebeforearch@gmail.com" target="_blank">coffeebeforearch@gmail.com</a>></span><br>Date: Mon, Dec 16, 2019 at 11:49 AM<br>Subject: Re: [llvm-dev] Guidance on working with the NVIDIA GPU back-end<br>To: Dmitry Mikushin <<a href="mailto:dmitry@kernelgen.org" target="_blank">dmitry@kernelgen.org</a>><br></div><br><br><div dir="ltr"><div>Hi Dmitry,</div><div><br></div><div>Thanks for the response. I understand how the flow of PTX->SASS works, but what I'm looking for guidance on is any references/insights on what would be required to register-allocate PTX.</div><div><br></div><div>While this seems odd (and is for running on real hardware), simulators like GPGPU-Sim functionally execute PTX because it is fully documented, while the machine ISA, SASS, is not. This means that the code being used to evaluate new architectures by researchers lacks register allocation and even basic optimizations like hoisting loads.<br></div><div><br></div><div>Hopefully, that clears things up. Any thoughts on the best place to look to get started with that? <br></div><div><br></div><div>All the best,</div><div><br></div><div>--Nick<br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Dec 16, 2019 at 11:38 AM Dmitry Mikushin <<a href="mailto:dmitry@kernelgen.org" target="_blank">dmitry@kernelgen.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Unlimited number of registers in PTX ISA means there is no any meaningful register allocation at all. That is, it makes no sense trying to limit something, which does not exist. NVPTX is lowered further by ptxas into physical registers, but it is out of the scope of LLVM.<div><br></div><div>Kind regards,</div><div>- Dmitry.</div><div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">пн, 16 дек. 2019 г. в 17:29, CoffeeBeforeArch via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><div>Hi all,</div><div><br></div><div>I'm primarily a hardware person but would like to do some compiler-architecture co-design research. Are there any good references for the NVPTX backend? I'd like to change that backend to have a limited number of physical registers rather than an unlimited number of virtual ones (for more realistic modeling in a uarch simulator).</div><div><br></div><div>Being able to do register allocation and other optimizations on the virtual ISA (PTX) would be incredibly useful to the research community.<br></div><div><br></div><div>Thanks in advance,</div><div><br></div><div>--Nick<br></div></div>
_______________________________________________<br>
LLVM Developers mailing list<br>
<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a><br>
<a href="https://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">https://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev</a><br>
</blockquote></div>
</blockquote></div>
</div></div>
_______________________________________________<br>
LLVM Developers mailing list<br>
<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a><br>
<a href="https://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">https://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev</a><br>
</blockquote></div>
</blockquote></div>