<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Fri, Feb 5, 2016 at 5:56 PM, Mehdi Amini via llvm-dev <span dir="ltr"><<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div style="word-wrap:break-word"><br><div><span class=""><blockquote type="cite"><div>On Feb 5, 2016, at 5:53 PM, Eric Christopher <<a href="mailto:echristo@gmail.com" target="_blank">echristo@gmail.com</a>> wrote:</div><br><div><div dir="ltr" style="font-family:Helvetica;font-size:12px;font-style:normal;font-variant:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px"><br><br><div class="gmail_quote"><div dir="ltr">On Fri, Feb 5, 2016 at 5:51 PM Mehdi Amini via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><br>> On Feb 5, 2016, at 5:40 PM, Peter Collingbourne <<a href="mailto:peter@pcc.me.uk" target="_blank">peter@pcc.me.uk</a>> wrote:<br>><br>> On Fri, Feb 05, 2016 at 04:58:45PM -0800, Mehdi Amini wrote:<br>>><br>>>> On Feb 5, 2016, at 3:17 PM, Peter Collingbourne via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a>> wrote:<br>>>><br>>>> Hi all,<br>>>><br>>>> We have profiled [1] the memory usage in LLVM when LTO'ing Chromium, and<br>>>> we've found that one of the top consumers of memory is the DWARF emitter in<br>>>> lib/CodeGen/AsmPrinter/Dwarf*.<br>>><br>>> I'm staring at the profile attached to the post #15 on the link you posted, can you confirm that the Dwarf emitter accounts for 6.7%+15.6%=22.3% of the the total allocated memory?<br>>> If I understand correctly the numbers, this does not tell anything about how much the Dwarf emitter accounts on the *peak memory* usage (could be more, could be nothing...).<br>><br>> I think these nodes represent allocations from the DWARF emitter:<br>><br>> DwarfDebug::DwarfDebug 9.5%<br>> DwarfDebug::endFunction 15.6%<br>> DIEValueList::addValue 9.1%<br>> total 34.2%<br>><br>> I believe they are totals, but my reading of the code is that the DWARF<br>> emitter does not deallocate its memory until the end of code generation,<br><br>That's sad :(<br><br>> so total ~= peak in this case.<br><br>Assuming the peak occurs during CodeGen (which is what I on my profile), that sounds pretty reasonable!<br><br>Thanks for the information (and the work!).<br><br>Another question I have, is how worse the split codegen make the situation? Naively there will be a lot of redundancy in the split modules, for ThinLTO Teresa has to proceed with care to limit the amount of duplication.<br><br></blockquote><div><br></div><div>Hmm? Can you reword this slightly? I'm not sure what you're asking here.</div></div></div></div></blockquote><div><br></div></span><div>The parallel split codegen will take the big LTO module with all the debug info and produce multiple modules.</div><div>When splitting in multiple modules, you may have functions from the same DICompileUnit ending up in multiple modules.  All the retained types would be pulled in.</div></div></div></blockquote><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div style="word-wrap:break-word"><div><div>(this is assuming you are already taking care of not pulling the DICompileUnit when no functions referencing it is in the split module).</div><div>Then each thread would do redundant work processing this type hierarchy (and other debug info).</div><div><br></div><div>For ThinLTO, Teresa is taking care (review waiting here: <a href="http://reviews.llvm.org/D16440" target="_blank">http://reviews.llvm.org/D16440</a> ) to try to import as little as possible, and turn type definition into declaration when possible.</div></div></div></blockquote><div><br></div><div><div>Right - I don't think we'd ever need to import a definition - just rely on the fact that we will produce a type definition somewhere in the output (this may present problems for LLDB - it's certainly had issues with type declarations appearing where it would expect a definition (eg: a type that inherits from a declaration instead of a definition) not sure if that problem extends to the case of by-value function parameters)<br><br>So the impact of that cross-module importuing should be pretty low for ThinLTO. But the benefit of any work Peter does should be equally beneficial to ThinLTO, since it still has to emit the types, build all the DIEs, etc, etc.<br><br>- Dave</div></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex"><div style="word-wrap:break-word"><div><span class=""><font color="#888888"><div><br></div><div>-- </div><div>Mehdi</div><div><br></div></font></span></div></div><br>_______________________________________________<br>
LLVM Developers mailing list<br>
<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a><br>
<a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev</a><br>
<br></blockquote></div><br></div></div>