Dear All,<br><br>I run into some problems when I was configuring llvm/clang/libclc to compile openCL files into ptx code. I followed the instructions on Justin Holewinski's slides after I finished installing llvm, clang, and libclc, which was originally:<br>
<br>clang -ccc-host-triple ptx32 \<br> -Xclang -target-feature -Xclang +ptx23 \<br> -Xclang -target-feature -Xclang +sm20 \<br> -I$LIBCLC/include/generic -I$LIBCLC/include/ptx \<br> -include clc/clc.h -Dcl_clang_storage_class_specifiers \<br>
 -O3 SOURCE.cl -S<br><br>I installed clang 3.2 and there is no option ccc-host-triple, I found the option triple, so I did:<br><br>clang -triple ptx32 \<br> -Xclang -target-feature -Xclang +ptx23 \<br> -Xclang -target-feature -Xclang +sm20 \<br>
 -I$LIBCLC/include/generic -I$LIBCLC/include/ptx \<br> -include clc/clc.h -Dcl_clang_storage_class_specifiers \<br> -O3 SOURCE.cl -S<br><br>Then I got this error:<br> error: invalid target feature '+ptx23'<br>error: invalid target feature '+sm20'<br>
<br>I removed these two features, and I saw error messages like this after I compile the matrix multiply example in nvidia opencl sdk<br><br>error: use of undeclared identifier 'BLOCK_SIZE'<br><br>Also there is this warning that: option '-triple ptx32' not used <br>
<br>I am not sure if I am missing anything here or the information I got is simply out-of-date. I think I have installed all the necessary packages and configured them. Can anyone help me and point me to the right direction?<br>
<br>Thanks a lot!<br><br>Zheng<br>