<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
<meta name="Generator" content="Microsoft Word 14 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:Helvetica;
        panose-1:2 11 6 4 2 2 2 2 2 4;}
@font-face
        {font-family:Helvetica;
        panose-1:2 11 6 4 2 2 2 2 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.apple-tab-span
        {mso-style-name:apple-tab-span;}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:612.0pt 792.0pt;
        margin:70.85pt 70.85pt 2.0cm 70.85pt;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang="DE" link="blue" vlink="purple">
<div class="WordSection1">
<p class="MsoNormal"><span lang="EN-US">It is likely that the patch does not provide an ideal overall design for computation of live ranges. My interest is to resolve the compile-time regression in some of our large examples, which we experience since LLVM
 3.3. I basically contribute a patch, which we currently apply locally, and as such it is designed to be a minimal change to resolve the regression. It preserves the original design and the algorithms, just reapplying them on a collection with a better sorted
 insert performance. On request of reviewers, I tried to further minimize the change by using templates to share the algorithm among set and vector-based implementations.
<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">I think, however, that better design could be achieved by changing the overall design of LiveRangeCalc. Maybe it would be better to manipulate the segment set directly in in the LiveRangeCalc and create the LiveRange
 only as the last step of the computation. Also, it can be that the use of the LiveRangeUpdater in LiveRangeCalc is now obsolete, because it useless in combination with the segment set, but am not sure I am the right person to answer such questions.
<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">Regards,<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US">Vaidas<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:11.0pt;font-family:"Calibri","sans-serif";color:#1F497D">               
<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US"><o:p> </o:p></span></p>
<div>
<div style="border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm">
<p class="MsoNormal"><b><span lang="EN-US" style="font-size:10.0pt;font-family:"Tahoma","sans-serif"">From:</span></b><span lang="EN-US" style="font-size:10.0pt;font-family:"Tahoma","sans-serif""> Matthias Braun [mailto:mbraun@apple.com]
<br>
<b>Sent:</b> Freitag, 19. Dezember 2014 00:31<br>
<b>To:</b> Quentin Colombet<br>
<b>Cc:</b> reviews+D6013+public+9ac3b9c10aa200c1@reviews.llvm.org; Gasiunas, Vaidas; ghoflehner@apple.com; atrick@apple.com; llvm-commits@cs.uiuc.edu<br>
<b>Subject:</b> Re: [PATCH] Speed up creation of live ranges for physical registers by using a segment set<o:p></o:p></span></p>
</div>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<p class="MsoNormal">On Dec 18, 2014, at 3:18 PM, Quentin Colombet <<a href="mailto:qcolombet@apple.com">qcolombet@apple.com</a>> wrote:<o:p></o:p></p>
</div>
<p class="MsoNormal"><o:p> </o:p></p>
<div>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif""><br>
On Dec 18, 2014, at 3:05 PM, Matthias Braun <</span><a href="mailto:mbraun@apple.com"><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif"">mbraun@apple.com</span></a><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif"">> wrote:<br>
<br style="orphans: auto;text-align:start;widows: auto;-webkit-text-stroke-width: 0px;word-spacing:0px">
<br>
</span><o:p></o:p></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif"">As I said: Don't let my comments stop you from committing, fixing the performance regressions right now is important, cleaning the code up/avoiding the extra pointer can
 be dealt with later I guess.<br>
<br>
<br>
<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif"">On Dec 18, 2014, at 9:32 AM, Quentin Colombet <<a href="mailto:qcolombet@apple.com">qcolombet@apple.com</a>> wrote:<br>
<br>
Hi all,<br>
<br>
I agree with Vaidas that moving the set outside of the LiveRange may not be that easy.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif"">Nonetheless we should revisit the code later, I'm still quiet sure that LiveRangeCalc is not used with multiple LiveRanges at the same time as it will break down if you
 don't reset() it before using it on a new LiveRange…<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif""><br>
But the point is that LiveRangeCalc is not the only user of that API, isn’t it?</span><o:p></o:p></p>
</div>
</blockquote>
<div>
<p class="MsoNormal">From what I see in the patch you must call flushLiveRangeSet() eventually after using the set. And the only point where that happens is right after LiveRangeCalc was used to calculate new live ranges for the register units.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<blockquote style="margin-top:5.0pt;margin-bottom:5.0pt">
<div>
<p class="MsoNormal"><span lang="EN-US" style="font-size:9.0pt;font-family:"Helvetica","sans-serif""><br style="orphans: auto;text-align:start;widows: auto;-webkit-text-stroke-width: 0px;word-spacing:0px">
<br>
</span><span lang="EN-US"><o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:9.0pt;font-family:"Helvetica","sans-serif""><br>
<br>
<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:9.0pt;font-family:"Helvetica","sans-serif""><br>
Regarding the complexity improvements:<br>
<br>
<br>
<o:p></o:p></span></p>
<p class="MsoNormal"><span lang="EN-US" style="font-size:9.0pt;font-family:"Helvetica","sans-serif"">for the createDeadDefs() part it may be interesting to simply append the new segment</span><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif"">s
 to the vector in any order and later run a sorting algorithm which also eliminates duplicates on the vector. This should reduce the O(n**2) complexity to O(n log n) and I'd imagine it to perform well in the case where only a few segments are used.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif""><br>
<br>
I am not so sure that would be beneficial, indeed, we would have to do this sorting for each live range, i.e., O(m n log n) and I suspect that the (log n) factor will be bigger than the cost of the set for the cases we try to optimize.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif"">So currently we add segments in a random order. As the LiveRange segments sector is kept sorted, this results in an insertion-sort style O(n**2) algorithm for createDeadDefs(),
 that's why using a set instead of the vector brings this down to O(n log n). However this complicates the code as you suddenly have two datastructures and switch forward and backward between them. I'd guess that is also the reason why using this style for
 vregs is not beneficial.<br>
Adding the segments in a random fashion to the vector and sorting the complete vector later would give you the same complexity without having to maintain a second datastructure on the side. However this is probably a bigger rewrite as the current LiveRange
 datastructure does not allow this, I'm also not sure if we have a sorting algorithm that eliminates duplicates at the same time. So this is more of an add to the TODO list proposal.<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:9.0pt;font-family:"Helvetica","sans-serif""><br>
I am not sure I quite follow the arguments here.<br>
Yes, we do have two data structures, but, unless I am mistaken, we do not switch between them and in particular do not maintain them at the same time.<br>
1. We use the set for the initial creation.<br>
2. We flush the set into the vector.<br>
3. We use the vector.<br>
<br>
After #2 the set is not used anymore.<br>
<br>
That being said, there is certainly something we can do to improve the complexity of the current code and you may have a better opinion than me on this, since you dug into that recently. Feel free to file PRs with the proposal so that we do not forget about
 them.</span><o:p></o:p></p>
</div>
</blockquote>
<div>
<p class="MsoNormal">Just having two different datastructures in LiveRange already makes you wonder constantly which of the two is relevant at a certain point in the code.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">And yes the current code (before the patch) already feels too complicated for what it actually does, part of the problem is that bits and pieces are reused for live range splitting logic... I'll file a PR once the patch is in.<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
<div>
<p class="MsoNormal">Greetings<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><span class="apple-tab-span">            </span>Matthias<o:p></o:p></p>
</div>
<div>
<p class="MsoNormal"><o:p> </o:p></p>
</div>
</div>
</div>
</body>
</html>