<div dir="ltr"><div dir="ltr">On Tue, Sep 21, 2021 at 6:30 AM <<a href="mailto:paul.robinson@sony.com">paul.robinson@sony.com</a>> wrote:<br></div><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">





<div lang="EN-US" style="overflow-wrap: break-word;">
<div class="gmail-m_4759569569501773392WordSection1">
<p class="MsoNormal">Drive-by thought, debug-info-for-profiling retains source info, maybe that could be unconditionally on and Rpass could use it?</p></div></div></blockquote><div><br>I think -fdebug-info-for-profiling tweaks the DWARF output to include some more info (like mangled names for inlined functions even in gmlt, start of function line numbers so sample profiles can be robust to certain amounts of code change, etc)<br><br>But yeah - we do have the <a href="https://reviews.llvm.org/D4234">https://reviews.llvm.org/D4234</a> "LocTrackingOnly" mode which looks like it could be used for Rpass diagnostics, for instance. (& removing use of the AST from the LLVM diagnostic system might help make it more consistent behavior even when doing LTO or other separations between AST parsing and IR transformations)<br> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div lang="EN-US" style="overflow-wrap: break-word;"><div class="gmail-m_4759569569501773392WordSection1"><p class="MsoNormal"><u></u><u></u></p>
<p class="MsoNormal">--paulr<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<div style="border-top:none;border-right:none;border-bottom:none;border-left:1.5pt solid blue;padding:0in 0in 0in 4pt">
<div>
<div style="border-right:none;border-bottom:none;border-left:none;border-top:1pt solid rgb(225,225,225);padding:3pt 0in 0in">
<p class="MsoNormal"><b>From:</b> cfe-dev <<a href="mailto:cfe-dev-bounces@lists.llvm.org" target="_blank">cfe-dev-bounces@lists.llvm.org</a>> <b>On Behalf Of
</b>David Blaikie via cfe-dev<br>
<b>Sent:</b> Monday, September 20, 2021 8:19 PM<br>
<b>To:</b> Arthur Eubanks <<a href="mailto:aeubanks@google.com" target="_blank">aeubanks@google.com</a>><br>
<b>Cc:</b> Clang Dev <<a href="mailto:cfe-dev@lists.llvm.org" target="_blank">cfe-dev@lists.llvm.org</a>><br>
<b>Subject:</b> Re: [cfe-dev] [RFC] Clearing Clang AST before running backend optimizations/codegen to save memory<u></u><u></u></p>
</div>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<p class="MsoNormal">On Mon, Sep 20, 2021 at 3:04 PM Arthur Eubanks <<a href="mailto:aeubanks@google.com" target="_blank">aeubanks@google.com</a>> wrote:<u></u><u></u></p>
</div>
<div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0in 0in 0in 6pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<p class="MsoNormal">Looking at -Rpass (and various things like warnings for inability to vectorize when we specifically request it with #pragma clang loop vectorize(enable)), it does end up using objects from the AST to approximate the source location (BackendConsumer::getBestLocationFromDebugLoc())
 if it can't find the source location from debug info. So this would affect users who don't build with debug info. Without debug info or the AST, clang will print a warning/remark without a source location. This is a tradeoff we'd have to decide on.<u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Ah, the AST lookup is only to retrieve the location of a function by name - if we made a mapping/record of all those locations (shouldn't take up much space, I'd think) then we could use that instead and not need the AST for that callback?<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0in 0in 0in 6pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<p class="MsoNormal">There's a similar issue with backend warnings but those don't even pass debug info to the diagnostic handler (clang/test/Misc/backend-stack-frame-diagnostics.cpp). Perhaps it could be extended to do that though.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">I haven't looked too much into the -disable-free stuff, but the reason it mitigates crashes is because if we clear AST objects we still have dangling references to them that we later attempt to clean up unless we -disable-free.<u></u><u></u></p>
</div>
</div>
</blockquote>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">So disabling free is keeping more things alive - perhaps then the RAM savings aren't as much as they could be if freeing was enabled? But yeah, more to look into.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"> <u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0in 0in 0in 6pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Updated <a href="https://urldefense.com/v3/__https:/reviews.llvm.org/D109781__;!!JmoZiZGBv3RvKRSx!u5xov9_zHGWKWsFWg-FlBBUrKZWcBw4KyfXq4eY9dQRAIJUNxoTfDwD40IYGep3Mdg$" target="_blank">
https://reviews.llvm.org/D109781</a><u></u><u></u></p>
</div>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<p class="MsoNormal">On Fri, Sep 17, 2021 at 4:41 PM David Blaikie <<a href="mailto:dblaikie@gmail.com" target="_blank">dblaikie@gmail.com</a>> wrote:<u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0in 0in 0in 6pt;margin-left:4.8pt;margin-right:0in">
<div>
<p class="MsoNormal">I think it'd be unfortunate if certain features don't work in this mode, unless we understand why/are pretty sure that's a fairly fundamental limitation. For instance, at Google we've got memory limitations (hence the motivation for this
 work) and I think we created, or at least have some interest in -Rpass - if -Rpass couldn't be composed with this feature, then we'd make it harder to investigate performance issues (because -Rpass wouldn't be available) in larger compiles that need this memory
 savings to fit into the memory limits we have. I'd guess the issue is that -Rpass I think traffics in Clang source locations. So it's possible the source location infrastructure/data structures would have to be kept, even though the AST/semantic pieces could
 be torn down. (unless that source location stuff can refer into ASTs for differentiating template specializations, etc - that'd be the tipping point for me in "OK, it may be worth the benefit to make these incompatible, or reduce the quality of -Rpass diagnostics
 when using this memory saving technique" - wonder if it's only the -Rpass diagnostics, or other backend diagnostics that use that infrastructure)<br>
<br>
Which is to say I'd be /slightly/ averse to adding this feature as a Clang default or driver flag (& similarly averse to leaving it as a cc1 off-by-default flag indefinitely) without a pretty good answer to those crashing/non-functioning tests.<br>
<br>
(lower priority, but fairly nice-to-have would be some answer to the cleaning up issues, -disable-free, etc - sort of weird that we'd have to /disable-free/ to enable freeing things earlier... that seems pretty suspicious)<u></u><u></u></p>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">but if those issues can be resolved<u></u><u></u></p>
</div>
</div>
<p class="MsoNormal"><u></u> <u></u></p>
<div>
<div>
<p class="MsoNormal">On Fri, Sep 17, 2021 at 2:30 PM Arthur Eubanks via cfe-dev <<a href="mailto:cfe-dev@lists.llvm.org" target="_blank">cfe-dev@lists.llvm.org</a>> wrote:<u></u><u></u></p>
</div>
<blockquote style="border-top:none;border-right:none;border-bottom:none;border-left:1pt solid rgb(204,204,204);padding:0in 0in 0in 6pt;margin-left:4.8pt;margin-right:0in">
<div>
<div>
<p class="MsoNormal">We keep around the Clang AST when we do backend optimizations on the IR. This causes the peak memory usage to be more than necessary since (I believe) generally we don't need the Clang AST when running optimizations. This gives us more
 room to work with things like caching analyses, at least for frontend compilations.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Measuring the effects of this when building LLVM's PassBuilder.cpp (longest LLVM file to compile), I measured a drop of peak memory usage (/usr/bin/time's max rss) from ~1.3-1.4G to ~1.0G.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">There are still a couple issues I haven't dug too deeply into yet, mostly to do with cleaning things up when freeing memory, so right now it's only enabled with -disable-free which works around those issues. Most clang tests pass with this
 patch; there are a couple things that crash (e.g. -Rpass, clang interpreter) where we can investigate further or just disable this feature.<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Prototype: <a href="https://urldefense.com/v3/__https:/reviews.llvm.org/D109781__;!!JmoZiZGBv3RvKRSx!u5xov9_zHGWKWsFWg-FlBBUrKZWcBw4KyfXq4eY9dQRAIJUNxoTfDwD40IYGep3Mdg$" target="_blank">
https://reviews.llvm.org/D109781</a><u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><a href="https://urldefense.com/v3/__https:/llvm-compile-time-tracker.com/compare.php?from=167ff5280d7fcad731810d5d2bf10561ed2adacc&to=b08fcae3a02d5ebe58afd8f8658d798b62ff8eb7&stat=max-rss__;!!JmoZiZGBv3RvKRSx!u5xov9_zHGWKWsFWg-FlBBUrKZWcBw4KyfXq4eY9dQRAIJUNxoTfDwD40IbggPFwHQ$" target="_blank">llvm-compile-time-tracker</a> memory
 metrics<u></u><u></u></p>
</div>
<div>
<p class="MsoNormal"><u></u> <u></u></p>
</div>
<div>
<p class="MsoNormal">Any concerns with this?<u></u><u></u></p>
</div>
</div>
<p class="MsoNormal">_______________________________________________<br>
cfe-dev mailing list<br>
<a href="mailto:cfe-dev@lists.llvm.org" target="_blank">cfe-dev@lists.llvm.org</a><br>
<a href="https://urldefense.com/v3/__https:/lists.llvm.org/cgi-bin/mailman/listinfo/cfe-dev__;!!JmoZiZGBv3RvKRSx!u5xov9_zHGWKWsFWg-FlBBUrKZWcBw4KyfXq4eY9dQRAIJUNxoTfDwD40IZRLUF5mg$" target="_blank">https://lists.llvm.org/cgi-bin/mailman/listinfo/cfe-dev</a><u></u><u></u></p>
</blockquote>
</div>
</blockquote>
</div>
</blockquote>
</div>
</div>
</div>
</div>
</div>

</blockquote></div></div>