<div dir="ltr">Just as an update, I figured out that Clang was not properly linked to the libclc library and I used a slightly modified version of the script in libclc/compile-test.sh, <br><br>" clang  -target nvptx-unknown-nvcl -S -emit-llvm -O4 -Iptx-nvidiacl/include -Igeneric/include   -include clc/clc.h  -Xclang -mlink-bitcode-file -Xclang nvptx--nvidiacl/lib/builtins.opt.bc -Dcl_clang_storage_class_specifiers -Dcl_khr_fp64 "$@" "<br><br><br>which works but it produces LLVM IR code for all OpenCL intrinsics implemented by libclc along with the kernel I am interested in, is their a possibility to avoid this ? and only produce the llvm code for the kernel required ?<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Tue, Feb 3, 2015 at 3:35 PM, Ahmed ElTantawy <span dir="ltr"><<a href="mailto:ahmede@ece.ubc.ca" target="_blank">ahmede@ece.ubc.ca</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><div><div><div>Hi,<br><br></div>My goal is to use Clang/LLVM/libclc to compile an OpenCL kernel and eventually generate a PTX code. I already did this but I am not sure if the PTX code I am generating is correct (is the one that is supposed to be generated).<br><br></div>For example, currently, <br><br></div>In OpenCL : get_global_id(0)   translates to <br></div><div>In LLVM    :  %call = tail call i32 @get_global_id(i32 0)  which translates to<br></div><div>In PTX:<br><br>        // .globl       blur2d<br>.func  (.param .b32 func_retval0) get_global_id<br>(<br>        .param .b32 get_global_id_param_0<br>)<br>;<br><br>         mov.u32         %r2, 0;<br>        .param .b32 param0;<br>        st.param.b32    [param0+0], %r2;<br>        .param .b32 retval0;<br>        call.uni (retval0),<br>        get_global_id,<br>        (<br>        param0<br>        );<br><br><br><br><br></div><div>Is this what is supposed to happen ? or there is something wrong ?  I am saying this because the get_global_id implementation does not make much sense to me and I am not sure if it used the libclc definitions at all ?<br><br></div><div>If it is not, any idea how the correct conversion will look like ? <br><br></div><div>Thanks,<br><br></div></div>
</blockquote></div><br></div>