<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri","sans-serif";}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">Gopal,
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"> I gave a presentation on how AMD compiles here:<o:p></o:p></span></p>
<p class="MsoNormal"><a href="http://llvm.org/devmtg/2010-11/Villmow-OpenCL.pdf">http://llvm.org/devmtg/2010-11/Villmow-OpenCL.pdf</a><o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Micah<span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"><o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D"><o:p> </o:p></span></p>
<div style="border:none;border-left:solid blue 1.5pt;padding:0in 0in 0in 4.0pt">
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in">
<p class="MsoNormal"><b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif"">From:</span></b><span style="font-size:10.0pt;font-family:"Tahoma","sans-serif""> llvmdev-bounces@cs.uiuc.edu [mailto:llvmdev-bounces@cs.uiuc.edu]
<b>On Behalf Of </b>Gopal Rastogi<br>
<b>Sent:</b> Wednesday, October 09, 2013 8:13 AM<br>
<b>To:</b> llvmdev@cs.uiuc.edu<br>
<b>Subject:</b> [LLVMdev] Backend vs JIT : GPU<o:p></o:p></span></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<div>
<p class="MsoNormal">Hi guys,<br>
<br>
I am understanding OpenCL compilation flow on GPU in order to develop OpenCL runtime for a new hardware.<o:p></o:p></p>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<p class="MsoNormal">I understood that OpenCL compiler is part of a vendor's runtime library which is the heart of OpenCL. Since OpenCL kernel is compiled at runtime, hence at high level its compilation takes place in two steps:
<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">i.  source code is first converted to intermediate code.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">ii. intermediate code is then translated to targeted binary code.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">let say for example, we have a OpenCL kernel source code vectorAdd_kernel.cl :<o:p></o:p></p>
</div>
<p class="MsoNormal">1. OpenCL compilation flow on Nvidia GPUs<o:p></o:p></p>
</div>
<p class="MsoNormal">   a. vectorAdd_kernel.cl is first translated to LLVM IR using clang and
<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">   b. LLVM IR is converted into optimized LLVM IR using LLVM optimizer.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal">   b. optimized LLVM IR is then translated to vectorAdd_kernel.ptx using Back-end<o:p></o:p></p>
</div>
<p class="MsoNormal" style="margin-bottom:12.0pt">   c. vectorAdd_kernel.ptx is then translated to vectorAdd_kernel.bin file using JIT. Nvidia uses JIT to get benefit in-case when next-generation GPUs are encounterd.<o:p></o:p></p>
</div>
<p class="MsoNormal">2. OpenCL compilation on AMD GPUs<o:p></o:p></p>
</div>
<p class="MsoNormal">  a. vectorAdd_kernel.cl is first translated to LLVM IR using gcc/clang<o:p></o:p></p>
</div>
<p class="MsoNormal">  b. LLVM IR is then converted into optimzed LLVM IR using LLVM optimizer.<o:p></o:p></p>
</div>
<p class="MsoNormal">  c. optimized LLVM IR is then converted into AMD IL.<o:p></o:p></p>
</div>
<p class="MsoNormal" style="margin-bottom:12.0pt">  d. AMD IL is then converted into AMD ISA using shader compiler (GPU JIT). 
<o:p></o:p></p>
</div>
<p class="MsoNormal" style="margin-bottom:12.0pt">I understand that AMD uses back-end compilation as part of JIT, instead Nvidia which uses back-end separate from JIT.
<o:p></o:p></p>
</div>
<p class="MsoNormal">Is that correct? If it is so then what are the advantages of using JIT separate from back-end?<br>
<br>
Thanks for your comments/opinions, <o:p></o:p></p>
</div>
<p class="MsoNormal">-Gopal<o:p></o:p></p>
</div>
</div>
</div>
</body>
</html>