<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Apr 6, 2015 at 3:22 PM, C Bergström <span dir="ltr"><<a href="mailto:cbergstrom@pathscale.com" target="_blank">cbergstrom@pathscale.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><span class="">On Tue, Apr 7, 2015 at 4:47 AM, Eli Bendersky <<a href="mailto:eliben@google.com">eliben@google.com</a>> wrote:<br>
><br>
><br>
> On Mon, Apr 6, 2015 at 11:48 AM, Régis Portalez<br>
> <<a href="mailto:regis.portalez@altimesh.com">regis.portalez@altimesh.com</a>> wrote:<br>
>><br>
>> Hi.<br>
>><br>
>> Sorry to interrupt, but I understood there is way to emit llvm ir from<br>
>> cuda code?<br>
>><br>
><br>
> In general, the Clang frontend (-cc1) can generate LLVM IR for the nvptx<br>
> triples/targets, when passed -fcuda-is-device. To use this in practice,<br>
> you'll need to supply a bunch of things in headers (definitions of builtins,<br>
> CUDA types and such), and no such headers exist in the open yet. Clang won't<br>
> be able to parse the NVIDIA headers as these collide with the standard C++<br>
> headers in some ways.<br>
<br>
</span>The old cuda headers used to be permissively licensed. (below)<br>
<br>
Those headers are probably sufficient to get things "rolling", but I<br>
don't know if they are really a good start. (Not to mention you'd be<br>
missing a runtime)<br>
<br>
The problem is that you'd have to do 2 passes with different<br>
(conflicting) defines. Once for host and once for device. To get<br>
host+device to play nice together is a b*. We have this resolved in<br>
our clang, but it's really specific to our compilation flow. A general<br>
solution would most likely involve extensive changes to the headers or<br>
a rewrite. :/<br></blockquote><div><br></div><div>Yep, this (2 passes with different defines) is the path taken in our approach, and the one we're pushing in <a href="http://reviews.llvm.org/D8463">http://reviews.llvm.org/D8463</a></div><div><br></div><div>Note that, headers notwithstanding, the 2 pass compilation flow is enforced by the definition of the CUDA language, because __CUDA_ARCH__ is defined only for device code, and undefined for host code, even though these two can live in the same TU. So you *have* to compile the code twice.</div><div><br></div><div>Back to the headers - these will remain a problem. We're now looking at different options.</div><div><br></div><div><br></div><div>Eli</div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<br>
I've fought with this for the past 5 years. I'll try to help in a<br>
general way if/where I can.<br>
<br>
Old CUDA header license<br>
----------<br>
/*<br>
 * Copyright 1993-2010 NVIDIA Corporation.  All rights reserved.<br>
 *<br>
 * NOTICE TO USER:<br>
 *<br>
 * This source code is subject to NVIDIA ownership rights under U.S. and<br>
 * international Copyright laws.  Users and possessors of this source code<br>
 * are hereby granted a nonexclusive, royalty-free license to use this code<br>
 * in individual and commercial software.<br>
 *<br>
 * NVIDIA MAKES NO REPRESENTATION ABOUT THE SUITABILITY OF THIS SOURCE<br>
 * CODE FOR ANY PURPOSE.  IT IS PROVIDED "AS IS" WITHOUT EXPRESS OR<br>
 * IMPLIED WARRANTY OF ANY KIND.  NVIDIA DISCLAIMS ALL WARRANTIES WITH<br>
 * REGARD TO THIS SOURCE CODE, INCLUDING ALL IMPLIED WARRANTIES OF<br>
 * MERCHANTABILITY, NONINFRINGEMENT, AND FITNESS FOR A PARTICULAR PURPOSE.<br>
 * IN NO EVENT SHALL NVIDIA BE LIABLE FOR ANY SPECIAL, INDIRECT, INCIDENTAL,<br>
 * OR CONSEQUENTIAL DAMAGES, OR ANY DAMAGES WHATSOEVER RESULTING FROM LOSS<br>
 * OF USE, DATA OR PROFITS,  WHETHER IN AN ACTION OF CONTRACT, NEGLIGENCE<br>
 * OR OTHER TORTIOUS ACTION,  ARISING OUT OF OR IN CONNECTION WITH THE USE<br>
 * OR PERFORMANCE OF THIS SOURCE CODE.<br>
 *<br>
 * U.S. Government End Users.   This source code is a "commercial item" as<br>
 * that term is defined at  48 C.F.R. 2.101 (OCT 1995), consisting  of<br>
 * "commercial computer  software"  and "commercial computer software<br>
 * documentation" as such terms are  used in 48 C.F.R. 12.212 (SEPT 1995)<br>
 * and is provided to the U.S. Government only as a commercial end item.<br>
 * Consistent with 48 C.F.R.12.212 and 48 C.F.R. 227.7202-1 through<br>
 * 227.7202-4 (JUNE 1995), all U.S. Government End Users acquire the<br>
 * source code with only those rights set forth herein.<br>
 *<br>
 * Any use of this source code in individual and commercial software must<br>
 * include, in the user documentation and internal comments to the code,<br>
 * the above Disclaimer and U.S. Government End Users Notice.<br>
 */<br>
</blockquote></div><br></div></div>