<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On Tue, Nov 12, 2013 at 3:42 PM, Manman Ren <span dir="ltr"><<a href="mailto:manman.ren@gmail.com" target="_blank">manman.ren@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><br><div>Hi All,</div><div><br></div><div>Type uniquing for C++ is in. Some data for Xalan with -flto -g:</div>
<div><div>9.9MB raw dwarf size, peak memory usage at 2.8GB</div><div>The raw dwarf size was 58MB, memory usage was 7GB back in May, 2013.</div>
<div>Other efforts at size reduction helped, and type uniquing improved on top of those.</div></div><div><br></div><div><div>Data on building clang with "-flto -g" after type uniquing:</div><div>  3.4GB MDNodes after parsing all bc files, 7GB MDNodes after linking all bc files</div>

<div>  4.6GB DIEs</div><div>  4G MCContext</div></div><div>  --> The memory usage is still too big.</div></div></blockquote><div><br></div><div>What fraction of the memory space occupied by MDNodes is just pointers? (IIRC our whole scheme for metadata is the epitome of "sea of linked nodes"). Do you have any statistics of how often the flexibility offered by links is used? (e.g. how often the links are changed). If huge swaths of these nodes are read-mostly, then it may be much more efficient to use a representation where the links are implicit.</div>
<div><br></div><div>More generally, can you gather some statistics about the relative distribution of different operations on MDNodes that we do? (what is the most called method? are there a couple of methods that account for >90% of calls? How often do we mutate this data? etc.)</div>
<div><br></div><div>-- Sean Silva</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div><br></div><div>So how to reduce the memory footprint at MDNode level:<br>
</div><div><div>  1> Combine integers into MDString and further combining MDStrings (see PR17891)</div>
<div>       A partial implementation on the important debug info nodes can reduce the MDNodes from 7GB to 5.7GB</div><div>  2> Release MDNodes that are only used by source modules (I will send out a proposal)</div><div>

        An estimation based on partial implementation: this will reduce MDNodes from 5.7GB to 3.9GB</div></div><div><br></div><div>Thanks,</div><div>Manman</div><div><br></div><div> </div><div><br></div><div><br></div></div>

<br>_______________________________________________<br>
LLVM Developers mailing list<br>
<a href="mailto:LLVMdev@cs.uiuc.edu">LLVMdev@cs.uiuc.edu</a>         <a href="http://llvm.cs.uiuc.edu" target="_blank">http://llvm.cs.uiuc.edu</a><br>
<a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev</a><br>
<br></blockquote></div><br></div></div>