<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="EN-US" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal">Just to be clear, I’m still not in love with this plan. However, it’s being done in accordance with the new policy on this sort of thing, and I’m going to have faith that the policy has teeth if it becomes any sort of issue.<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal">Thanks,<o:p></o:p></p>
<p class="MsoNormal">   Christopher Tetreault<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><b>From:</b> Geoffrey Martin-Noble <gcmn@google.com> <br>
<b>Sent:</b> Thursday, December 3, 2020 4:27 PM<br>
<b>To:</b> LLVM Dev <llvm-dev@lists.llvm.org><br>
<b>Cc:</b> tstellar@redhat.com; Renato Golin <rengolin@gmail.com>; Chris Tetreault <ctetreau@quicinc.com><br>
<b>Subject:</b> [EXT] Re: [llvm-dev] RFC: Contributing Bazel BUILD files in the "peripheral" support tier<o:p></o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div>
<p class="MsoNormal">Apologies for the delayed response here. I was out of the "office".<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Thanks for taking another look :-)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal">I want to respond first to the process question of pitch vs RFC. My impression was that the pitch process should be used in the case that an RFC couldn't reach consensus. I asked a few times in the last thread (<a href="https://groups.google.com/g/llvm-dev/c/u07o3QREVUg/m/uVlV3pMTBAAJ" target="_blank">https://groups.google.com/g/llvm-dev/c/u07o3QREVUg/m/uVlV3pMTBAAJ</a>
 and <a href="https://groups.google.com/g/llvm-dev/c/u07o3QREVUg/m/wF5mu-dpBAAJ" target="_blank">
https://groups.google.com/g/llvm-dev/c/u07o3QREVUg/m/wF5mu-dpBAAJ</a>) whether I should move this to a pitch, but feel like there wasn't a clear response in the context of Renato's support tiers RFC.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">It seems like Tom and Renato still disagree about whether I should move this to a pitch. I would appreciate some consensus on that point at least :-D I do see the appeal of a living document for this sort of thing, so definitely see the
 appeal there, but also it seems like the pitch process is a heavier-weight and more unusual one, so I was hesitant. My inclination is to continue this as an RFC unless we are unable to reach consensus on the issue as outlined in the pitch process description.
 It does feel like this is really not quite as big a decision as you seem to be suggesting. It's also an easily reversible one since there are no build dependencies and everything is contained.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">On Mon, Nov 16, 2020 at 9:41 PM Tom Stellard <<a href="mailto:tstellar@redhat.com" target="_blank">tstellar@redhat.com</a>> wrote:<o:p></o:p></p>
</div>
</div>
<div>
<div>
<div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<p class="MsoNormal" style="margin-bottom:12.0pt">> This should have approximately the same impact on the community as the
<br>
> current GN build in `llvm/utils/gn` does today. That is, it should not <br>
> affect anyone who doesn't care.<br>
> <br>
<br>
I want to push back on this a little bit, because having the code in <br>
tree does impact everyone, even people who don't care about it.  It <br>
increases disk usage, commit traffic, checkout times, bugzilla / issue <br>
traffic, and CI builds to name a few things.  There are costs to having <br>
this in tree, the question (as always) is do the benefits outweigh the <br>
costs?<o:p></o:p></p>
</blockquote>
<div>
<p class="MsoNormal">Yes my apologies that this was poorly phrased. I was aiming for a pithy summary and a clear statement that our goal here is not to significantly impact contributors uninterested in Bazel. My impression is that the GN build has achieved
 that goal. I definitely agree that any addition to the monorepo should have a clear weighing of costs vs benefits and that the costs are never actually zero. I do think the costs here are really quite low however. I am happy to address your concerns and also
 think that it is important to note that if additional issues arise we are still agreeing to be on the hook for addressing them (e.g. if in practice this causes some unforseen issue with the release) and deleting this contribution if we cannot do so in a timely
 manner (`rm -rf utils/bazel` is all it requires).<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<p class="MsoNormal" style="margin-bottom:12.0pt">Personally, I do not think we should have alternative build systems in<br>
tree.  However, I still think you should try to propose this as a pitch.<br>
I would much rather this go through a fair process and land than for it <br>
to be rejected based on a contentious thread.<br>
<br>
Here is why I'm not convinced this should be in tree:<br>
<br>
To me it's not clear why having the build files in-tree is better than <br>
having a separate repo with an llvm-project sub-module.  The in tree <br>
bazel files will be broken from time to time, since most developers will<br>
not be updating them, however, with the sub-module approach you can <br>
ensure that the build will always work by pinning the llvm-bazel repo to <br>
a known-working commit of llvm-project.  Can you expand on the pros/cons <br>
of in-tree vs out-of-tree with sub-modules.<o:p></o:p></p>
</blockquote>
<div>
<p class="MsoNormal">Out-of-tree with a submodule is the current approach we have with <a href="https://github.com/google/llvm-bazel" target="_blank">https://github.com/google/llvm-bazel</a>. It's certainly doable, but involves quite a bit of bookkeeping to
 track which version corresponds to a given version of LLVM such that someone can fetch the correct configuration (you'll note that the repository has about 7k tags at the moment). To make things somewhat more complicated, the typical way to fetch something
 for use in Bazel is with an <a href="https://docs.bazel.build/versions/master/repo/http.html#http_archive" target="_blank">
http_archive</a> which requires one to specify the archive digest to avoid refetching on each build. This doesn't work particularly well with tags that change which commit they point to. I'm not saying these issues aren't solvable, but they add quite a bit
 of complexity.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">The other point is that I think this makes contributing to the Bazel configuration quite a bit more complex because you have to apply patches across multiple repositories to also be kept in sync. Given that LLVM has a monorepo, it still
 seems like the logical place for a build configuration of LLVM used by multiple projects.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<p class="MsoNormal" style="margin-bottom:12.0pt">Other concerns I have from reviewing the patch:<o:p></o:p></p>
</blockquote>
<div>
<p class="MsoNormal">It seems like these are mostly concerns with the specific implementation. Would you be alright with saving the specific details for an eventual review on the patch if this moves forward? I've made brief responses below.<o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<p class="MsoNormal">* It looks like there is a build configuration for at least one external
<br>
project (zlib) and possibly another (vulkan-headers?).  Do we really <br>
want to have build configurations for non-LLVM projects in our tree?  Is <br>
there any limit to the number of external projects that can and will be <br>
added?<o:p></o:p></p>
</blockquote>
<div>
<p class="MsoNormal">These are dependencies of the LLVM Project and LLVM keeps its dependencies pretty tightly managed AFAIU. These configurations are also pretty trivial, "here are the source files", type things, so I think it's even a bit generous to call
 them configurations: we're just informing Bazel where the files are located.<o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<p class="MsoNormal"><br>
* There are 3 files (abi-breaking.h.cmake, config.h.cmake, <br>
llvm-config.h.cmake) that have been copied from the llvm tree into <br>
utils/bazel/, is there some way we can avoid carrying multiple copies of <br>
the same file in tree?<o:p></o:p></p>
</blockquote>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<p class="MsoNormal" style="margin-bottom:12.0pt"><br>
* Similarly, there are some files that are normally generated at build <br>
time clang/Config/config.h, llvm/Config/config.h, <br>
llvm/Config/llvm-config.h that have been copied into utils/bazel.  Is it <br>
really necessary<br>
to have these in tree?  Especially since some of the templates, like <br>
llvm-config.h.cmake, are also in utils/bazel?<o:p></o:p></p>
</blockquote>
<div>
<p class="MsoNormal">The copy here is pretty much orthogonal to the actual build configuration. The intent is to have a literal change detector test for changes to these cmake configurations, since they would invalidate assumptions in the Bazel configuration.
 Chandler and I went back and forth on a few different ways to do this. We can certainly look at other options. The issue is that I don't think there's actually a useful way to interpret the .cmake template files since changes to them are also made as changes
 to the cmake configuration and without these being in sync the files just drift. Happy to discuss other options for how to handle this. We could, for instance, have some other process that just looks at the git diff/log for these files.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"> <o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<p class="MsoNormal" style="margin-bottom:12.0pt">* I still worry about the bazel files causing merging conflicts when
<br>
backported to the stable branch.  If these are added to tree, could we<br>
have a rule where commits to utils/bazel/ cannot include changes to<br>
other files?<o:p></o:p></p>
</blockquote>
<div>
<p class="MsoNormal">I'd certainly be open to discussing restrictions that would avoid additional burden on release managers. I think that one makes contributing to the Bazel configuration more difficult because you cannot do it as part of a patch that requires
 a change, but if it's something that would cause issues with the release then we can avoid it. My intuition is that this wouldn't actually come up often, however. For example, just looking at the gn directory I see several commits in the last week that touch
 this and other files. Have you actually run into issues? Since this is unsupported the conflicts could also be resolved pretty much however you wanted (e.g. delete the conflict markers, delete the file), so they seem pretty trivial to deal with if they only
 happen occasionally. My preference would therefore be to see if this is actually a problem in practice before putting rules in place.<o:p></o:p></p>
</div>
<div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<div>
<p class="MsoNormal">On Tue, Nov 17, 2020 at 2:27 AM Renato Golin <<a href="mailto:rengolin@gmail.com" target="_blank">rengolin@gmail.com</a>> wrote:<o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<p class="MsoNormal">Hi Geoffrey,<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Thanks for the re-submission. <o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">I have some comments below that may sound negative, but they're probably just a reflection of my own ignorance. I want to make sure the submission is clear, so it can be accepted on its own right.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">On Tue, 17 Nov 2020 at 03:02, Geoffrey Martin-Noble via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a>> wrote:<o:p></o:p></p>
</div>
<div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<p class="MsoNormal"> This should not affect development of core tier components. One reason we propose adding this to the root utils/ directory instead of under llvm/utils (where GN is located) is to avoid unnecessarily sending messages to llvm-commits. Others
 have raised the concern that the existence of an alternative build system might lead to lack of maintenance for the CMake build system. Given that supporting CMake will remain a requirement and maintenance of a Bazel build system will continue to happen regardless,
 we do not expect any significant impact in this way.<o:p></o:p></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">I was under the impression that "utils" was actually "llvm/utils", which would be in the same place as GN. I don't think we should treat GN and Bazel as different and I really wouldn't like to have a different quality control (for post
 commit reviews).<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">If the Bazel commits are too verbose (for example, committing auto-generated code), then we should really clean that up and commit the script that generates them and make that part of the build.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">I understand the need to move the noise away, but move it too far away and it's no better than in a separate repo.<o:p></o:p></p>
</div>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal">I am happy to put this in either location and agree it should be in the same place as GN. If we were to decide that it should go `utils/` then I would also propose we move GN to there as well. I believe the GN files were contributed prior
 to the existence of the monorepo, so a top-level `utils/` wouldn't have been an option. I think living under the root `utils/` directory makes more sense because these are not configurations for only the LLVM subproject (we also build MLIR and Clang with perhaps
 more to come). I believe it was Mehdi's suggestion that this would help mitigate some of the costs to having it in the monorepo because Tom mentioned commit list traffic as a concern. I don't think I agree that one directory up is akin to a separate repo though
 :-D<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">That said, this is a really minor point for me. I'm happy to put this wherever people prefer :-)<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<p class="MsoNormal">A number of people raised the question of "why not a separate repository". This is indeed possible: It's what we've done with <a href="https://github.com/google/llvm-bazel" target="_blank">https://github.com/google/llvm-bazel</a>, which
 is currently used by <a href="https://github.com/google/iree" target="_blank">https://github.com/google/iree</a>. It is significantly more infrastructure, coordination, and complexity for something that is specifically a configuration for the LLVM project
 itself, not its own dependent or adjacent project.<o:p></o:p></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">I was also under the impression that one of the big reasons why we needed it to be in LLVM is that, like CMake, it needed files all over the place. This would indeed be a major infrastructure undertaking.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">But given that it's all being hosted in a single directory, and outside of the LLVM tree, I really can't see what's so much harder about an extra checkout in the same tree.<o:p></o:p></p>
</div>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal">Bazel *wants* the build files to be all over the place, but I've tricked it with some repository rule symlinking. That's also true of the LLVM GN configuration, I believe. My assumption is that having BUILD files actually throughout the
 repository would be something that would receive quite a bit of pushback and would be confusing for people who would naturally expect these BUILD files to be maintained as a supported build system. I would happily put a BUILD.bazel file at the root of each
 subproject and drop the symlinking madness, but I suspect this would not be embraced as a solution ;-P<o:p></o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<blockquote style="border:none;border-left:solid #CCCCCC 1.0pt;padding:0in 0in 0in 6.0pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<p class="MsoNormal">I believe this contribution will significantly improve the situation for downstream users that use Bazel while having minimal impact on the community at large.<o:p></o:p></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">It's not clear to me yet if LLVM/Bazel is only used in Google projects or any other non-Google project. All that you listed so far seem to be exclusive to Google.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">This is not a problem per se, but it does promote the idea that Google could common it up internally instead.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">The main reasons why it would be upstream are that it's either a product by or requirement to the project itself, or it helps unite cross-industry collaboration that wouldn't be possible otherwise.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">It's clearly not the former (and why it's in the periphery tier), but it's also not clear it's in the latter either.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal">I can really only speak for Google projects. I have also noticed several other Bazel build configurations in the wild, e.g. <a href="https://github.com/plaidml/plaidml/blob/master/vendor/llvm/llvm.BUILD" target="_blank"><span style="background:#1F1F1F">PlaidML</span></a> (Intel)
 or this <a href="https://github.com/ChrisCummins/bazel_llvm">bazel_llvm</a> project that I found after someone contributed a doc fix. I believe in the last thread someone from Facebook mentioned that Bazel build files would also be relatively easily translatable
 to their internal Bazel-derived build system, Buck. Someone from Lyft also expressed interest in using a Bazel build configuration if it was in-tree. But I can't really speak to the motivations, road maps, etc. for any of these people, companies, or projects
 (if you're reading, please chime in ;-P).<o:p></o:p></p>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</div>
</body>
</html>