<div dir="ltr"><div class="gmail_quote"><div dir="ltr">On Mon, Mar 28, 2016 at 10:12 AM Mehdi Amini <<a href="mailto:mehdi.amini@apple.com">mehdi.amini@apple.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word">Hi Jason,<div><br></div><div>This is probably because I'm not aware of the details, but it was claimed in this thread that liboffload can target Xeon Phi and Nvidia GPUs. Adding a new library that the compiler has to be aware of has to bring significant benefit.</div><div>So it is not clear to me yet why the compiler should target two different runtime libraries that seems to have large chunk of overlapping functionalities.</div><div>On a high-level view, these libraries seems to have the same goals with respect to what they provide to the compiler.</div></div></blockquote><div><br></div><div>I think there are at least two issues:</div><div><br></div><div>1) Provide a high level C++ stream-based API that integrates cleanly with compiler-generated kernel dispatch (CUDA or OpenCL, or...)</div><div><br></div><div>2) Support the necessary APIs for being a runtime backend for CUDA code.</div><div><br></div><div>I think both of these are really important and not really covered at all by liboffload in its current form.</div></div></div>