<div dir="ltr"><div dir="ltr"><br></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Jan 7, 2021 at 2:40 PM Tom Stellard <<a href="mailto:tstellar@redhat.com">tstellar@redhat.com</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">On 1/7/21 10:55 AM, Stella Laurenzo via llvm-dev wrote:<br>
> Hi folks, I would like to propose that we create a new top-level repo in <br>
> the LLVM organization for organizing the Python MLIR Releases (both <br>
> daily and official numbered releases, whenever we are ready for such a <br>
> thing) and corresponding pushes to package repositories, etc.<br>
> <br>
<br>
For those of use that are unfamiliar, can you explain what the "Python <br>
MLIR Releases" are?<br></blockquote><div><br></div><div>Sure: They are the python wheels and source distributions for the [MLIR Python Bindings](<a href="https://mlir.llvm.org/docs/Bindings/Python/">https://mlir.llvm.org/docs/Bindings/Python/</a>). The key is that we do them in concordance with how Python packages get released and push them through standard channels for deployment, and this involves some gymnastics (of which, what I have will grow in some complexity as we do this, based on the experience of other projects). They basically include everything such that if you do a "pip install mlir" you get a working package that is able to build and compile MLIR based IR in a variety of forms. An ancillary function of them is to enable downstream Python based projects to extend the system, so it entails distributing enough headers and libraries to make this feasible.</div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
> I have prototyped such a release process in a personal repo: <br>
> <a href="https://github.com/stellaraccident/mlir-py-release" rel="noreferrer" target="_blank">https://github.com/stellaraccident/mlir-py-release</a><br>
> <br>
> Additional development on that release process is currently blocked on <br>
> more work on the shared library organization in LLVM (discussed here <br>
> <a href="https://lists.llvm.org/pipermail/llvm-dev/2021-January/147567.html" rel="noreferrer" target="_blank">https://lists.llvm.org/pipermail/llvm-dev/2021-January/147567.html</a> and <br>
> being worked on independently) but it is useful as is and a reasonable <br>
> starting point for further work.<br>
> <br>
> I would propose that we just fork my current repo into a new one in the <br>
> LLVM organization and then take the necessary steps to get <br>
> credentials/permissions/secrets set up in the new context.<br>
> <br>
> Some answers to questions that may come up:<br>
> <br>
>   * *Why should this be a repo separate from llvm-project? *These kind<br>
>     of automation repos tend to have a lot of "garbage" commits that I<br>
>     think is best if they do not pollute the main repo (and also don't<br>
>     face contention on automatic jobs bumping things, etc). They also<br>
>     tend to require special permissions and secrets that we will want to<br>
>     more tightly control. They also make use of other GitHub features<br>
>     that it seems like we would like not polluting the main development<br>
>     flow ("Releases" tab, Actions, etc). Also, this is the kind of thing<br>
>     that tends to get revised en-masse periodically, and again, it would<br>
>     be good to not pollute the monorepo.<br>
<br>
There really aren't many files in this repo, do you anticipate it <br>
growing significantly?<br></blockquote><div><br></div><div>Not terribly so. Just from some personal experience, the ways things are done for Python packaging are somewhat... esoteric... from a normal C++ build flow and necessitate certain directory layouts and such that I felt were better left to their own thing (it is something that you want to do exactly as everyone else does it).</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
>   * *Why not land this in llvm-zorg? *llvm-zorg claims to be for "LLVM<br>
>     Testing Infrastructure" and seems well scoped to that statement.<br>
>     What I am managing above is periodic, automated release tooling<br>
>     based on open-source CI systems (currently GitHub Actions), which<br>
>     are fairly standardized across the Python releasing community, easy<br>
>     to set up, etc.<br>
<br>
llvm-zorg also handles generating the websites.  My personal opinion is <br>
that it would be OK to try to do this in llvm-zorg, but you're probably <br>
better off asking Galina about that.  I guess the downside of using <br>
llvm-zorg is you don't get the releases tab.<br></blockquote><div><br></div><div>That is a good reason to put it there. One of the actions that is not implemented yet is for generating API docs (which is done post build/install for the Python side, because it introspects a running system).</div><div><br></div><div>The releases page is actually pretty important. For snapshot builds, python's pip can just scrape it directly for published, installable artifacts and without it, we would need to roll our own place to stash such things.</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
Why did you choose to write the checkout_repo.py script in python rather <br>
than using the GitHub checkout action, or writing your own custom action?<br></blockquote><div><br></div><div>Good question - that was a limitation in my knowledge at the time (need to source the version from a file). Consider that a TODO to eliminate.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
>   * *What ultimately will the code in this repo do?*<br>
>       o Have periodic GitHub actions to select new LLVM revisions and<br>
>         schedule daily/snapshot releases.<br>
<br>
Do you have any idea of much of the GitHub actions resources this would <br>
use?  e.g. how many hours per week per Operating System?<br></blockquote><div><br></div><div>Currently, each snapshot builds for about 30m on the free 2-core setups per OS. However, this isn't presently compiling as much of LLVM that will ultimately be needed. I have automation for another project where we do build more/most of the backends as well, and that builds for 1.25-1.5 hours per snapshot (and builds a fair bit more things unrelated to LLVM, so just an upper bound estimate). On my other project, I found that each minor python version added (of which, there are probably ~4 LTS at any given time) added about 1min to each build.</div><div><br></div><div>So if we are doing 2 snapshots a day and being conservative, 28 hours/week/OS? </div><div><br></div><div>I'm not running tests yet, so that will come with some costs. We will probably choose to run just the python bindings tests per python version (which are really cheap) and then run the full regression suite once per OS.</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
>       o Have manual actions for triggering official, numbered releases.<br>
>       o Facilities for building Python wheels for PyPi and house any<br>
>         additional metadata/automation needed for anaconda.<br>
>       o Builds releases for all supported operating systems (currently<br>
>         Linux/CentOS7/manylinux2014, MacOS, and Windows) and supported<br>
>         Python versions (currently 3.6, 3.7, 3.8, 3.9).<br>
>       o Publish release artifacts on the Releases tab for daily/snapshot<br>
>         releases.<br>
>       o Provide a stable reference point for downstream projects that<br>
>         extend MLIR-Python and need to produce version-matched artifacts<br>
>         of their own.<br>
>   * *Could this graduate to be more than "MLIR" python?* Maybe. I chose<br>
>     the name because that is what I am focused on and didn't want to<br>
>     grab too much land. But there is nothing stopping this from becoming<br>
>     automation for general LLVM monorepo+incubator Python releasing.<br>
<br>
I think it would be great to generalize this.  I would also like to <br>
automate parts the main LLVM release, and there seems to be some overlap <br>
with what you are doing.<br></blockquote><div><br></div><div>Agreed. I actually found this quite easy to prototype. I think I spent a grand total of ~a day on what is there (which isn't done yet, but isn't super far off). It then took me ~3 days to adapt it to IREE (<a href="https://github.com/google/iree">https://github.com/google/iree</a>), which is much more complicated (as it has to build LLVM, a bunch of deps and TensorFlow).</div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
-Tom<br>
<br>
>   * *What if we don't do this?*<br>
>       o *Option A:* We keep running this in a private repo with the<br>
>         disclaimer that is currently at the top: "Note that this is a<br>
>         prototype of a real MLIR release process being run by a member<br>
>         of the community. These are not official releases of the LLVM<br>
>         Foundation in any way, and they are likely only going to be<br>
>         useful to people actually working on LLVM/MLIR until we get<br>
>         things productionized." We would miss opportunities for<br>
>         convergence with other projects and would cause things to fragment.<br>
>       o *Option B: *We only publish Python bindings in official LLVM<br>
>         release packages, and only for the Python version they are built<br>
>         with. We don't release Python binaries through normal package<br>
>         management channels.<br>
<br>
<br>
> <br>
> Opinions?<br>
> - Stella<br>
> <br>
> _______________________________________________<br>
> LLVM Developers mailing list<br>
> <a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a><br>
> <a href="https://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">https://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev</a><br>
> <br>
<br>
</blockquote></div></div>