<div dir="ltr">Chandler,<div><br></div><div>Thank you for getting it up to ML top. </div><div><br></div><div>I believe we have to move broader than that you just mentioned. The natural separation of the infrastructure into different parts can be across the following lines:</div><div><br></div><div>- the parallel model of programming - these can be OpenMP, OpenACC, CilkPlus, OpenCL, StreamExecutor, CUDA, C++ parallel extensions, etc.</div><div>- the offloading machinery to be used by any of those above and providing unified interfaces across all targets to be supported</div><div>- the performance libraries collection that can be re-used in different programming models and be targeting different host/targets planforms</div><div><br></div><div>I would like to touch the 2nd bullet, since I had most exerience with it.There should be a single interface for all offloading players that are willing to take part. Those are not limited to StreamExecutor and the OpenMP already published in LLVM. There are number of solutions from Intel, not saying of others, - it would be reasonable to become a platform for all of them, and I got positive feedback on the idea within.</div><div>To name a few (don't take it as an ad): <br></div><div><br> - Hetero Streams Library, <a href="https://01.org/hetero-streams-library">https://01.org/hetero-streams-library</a><br> - <span style="font-size:13px;color:rgb(0,0,0);font-family:IntelClear-Bold,tahoma,Helvetica,helvetica,Arial,sans-serif;line-height:20px">Beignet Project, </span><font color="#000000" face="IntelClear-Bold, tahoma, Helvetica, helvetica, Arial, sans-serif"><span style="line-height:20px"><a href="https://01.org/beignet">https://01.org/beignet</a></span></font><br> - Math Kernel Libraries, <a href="https://software.intel.com/en-us/intel-mkl">https://software.intel.com/en-us/intel-mkl</a><br><div> - Intel Compiler, <a href="https://software.intel.com/en-us/intel-compilers">https://software.intel.com/en-us/intel-compilers</a></div></div><div><br></div><div>I believe we shouldn't make any difference between StreamExecutor and other projects and to try to plug one into the other or vice versa. The better would be to reuse the same ground level I/O machinery that will provide efficiency to all of these and the newcomers. The machinery should have some specific attributes, such as support of multitude of languages currently employed by LLVM project and beyond. Also we have to take into account different application of the compiler and infrastructure: there can be server solutions where we are free to use full-featured C++ and there can be embedded solutions, such as automotive, where customers are tend to have as few runtime support as possible and like C the most. </div><div><br></div><div><br></div><div><br></div><div>Regards,</div><div>Sergos</div><div>Intel Compilers</div><div><br></div><div><br></div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Sat, Apr 23, 2016 at 1:24 AM, Chandler Carruth via Openmp-dev <span dir="ltr"><<a href="mailto:openmp-dev@lists.llvm.org" target="_blank">openmp-dev@lists.llvm.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div class="gmail_quote"><span class=""><div dir="ltr">On Fri, Apr 22, 2016 at 3:05 PM Mehdi Amini <<a href="mailto:mehdi.amini@apple.com" target="_blank">mehdi.amini@apple.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
> On Apr 22, 2016, at 3:01 PM, Chandler Carruth <<a href="mailto:chandlerc@gmail.com" target="_blank">chandlerc@gmail.com</a>> wrote:<br>
><br>
> I feel like this thread got a bit stalled. I'd like to pick it up and try to suggest a path forward.<br>
><br>
> I don't hear any real objections to the overall idea of having an LLVM subproject for parallelism runtimes and support libraries. I think we should get that created.<br>
<br>
I think it should be clarified if "parallelism runtimes and support libraries" are intended to expose user-level APIs or if these are intended to expose APIs for the compiler generated code (this may be part of your point about "writing up its charter, scope" but I also think it shouldn't be underestimated as a task so I called it out).<br></blockquote><div><br></div></span><div>Absolutely. I think that needs to be clearly spelled out.</div><div><br></div><div>Personally, I'd like to see the subproject open to *both*. Here are some libraries I would love to see (but don't necessarily have concrete plans around):</div><div>- A nice vectorized math library</div><div>- Linear algebra libraries like BLAS implementations or such</div><div>- Highly tuned FFT or other domain specific libraries for GPUs. Essentially the same is the vectorized math libraries but for GPUs and slightly higher level.</div><div>- Stream executor </div><div>- Any generic components of the OpenMP libraries.</div><div><br></div><div>Clearly each of these would need to be discussed on a case by case basis, but there seems to be a healthy mixture of both user-level APIs and compiler-level APIs. I would suggest criteria for being here along the lines of:</div><div><br></div><div>- Includes compiler-targeted APIs (maybe in addition to user-level APIs, maybe even with overlap), or</div><div>- Leverages compiler details for its implementation (for example, using vector extensions we know LLVM supports), or</div><div>- Wants to use compiler-specific packaging techniques or other integration techniques (for example shipping as bitcode), or</div><div>- Helps support compiler or programming language functionality</div><div><br></div><div>The first three here seem clear cut to me. If any part of the library is intended to be callable by the compiler, its a good fit. SE has such interfaces. Vectorized math libraries do too, etc. If the implementation of th elibrary really wants to use compiler internals like our vector math extensions, again, I think it makes sense to keep it reasonably co-located with the compiler.</div><div><br></div><div>The last seems a bit tricky, but I think its really important. Currently, CUDA provides a pretty big programming surface, and having a well tuned BLAS or FFT implementation for example that integrates with CUDA is pretty important. Similarly in the future, we expect C++ to get lots of parallel standard library interfaces, potentially even BLAS-looking ones and we might want a good parallel BLAS implementation or other very fundamental parallel library implementation to use when implementing it.</div><div><br></div><div>But at the same time, I think its really important to have a clear place where any library here ties back into the compiler ecosystem and/or the programming language ecosystem that are the core of LLVM.</div><div><br></div><div>Does this seem like its going in the right direction? (Jason can probably take on the non-trivial task of writing this up more formally and make sure it is clearly documented.)</div><span class=""><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
Otherwise you plan sounds good to me.<br>
<br>
--<br>
Mehdi<br>
<br>
<br>
<br>
><br>
> I don't actually see any real objections to StreamExecutor being one of the runtimes. There are some interesting questions however:<br>
> - Is there common code in the OpenMP runtime that could be unified with this?<br>
> - Could OpenMP end up using SE or some common shared library between them as a basis for offloading?<br>
> - Would instead it make more sense to have the OpenMP offload library be a plugin for StreamExecutor?<br>
><br>
> I don't know the answer to any of these really, but I also don't think that they should prevent us from making progress here. And I think if anything, they'll become easier to answer if we do.<br>
><br>
> So my suggestion would be:<br>
> 1) Create the broader scoped LLVM subproject, including writing up its charter, scope, plans, etc.<br>
><br>
> 2) Add stream executor to it<br>
><br>
> 3) Initially, leave the OpenMP offloading stuff targeted at OpenMP. Then, as it evolves, consider moving it to be another runtime in the broad project if and when it makes sense.<br>
><br>
> 4) As both OpenMP and SE evolve and are used some in the project, evaluate whether there is a common core that makes sense to extract. If so, do it and rebase them appropriately.<br>
><br>
><br>
> Does this make sense? Are there objections to moving forward here?<br>
<br>
</blockquote></span></div></div>
<br>_______________________________________________<br>
Openmp-dev mailing list<br>
<a href="mailto:Openmp-dev@lists.llvm.org">Openmp-dev@lists.llvm.org</a><br>
<a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/openmp-dev" rel="noreferrer" target="_blank">http://lists.llvm.org/cgi-bin/mailman/listinfo/openmp-dev</a><br>
<br></blockquote></div><br></div>