<div dir="ltr">:-)<div><br></div><div>I was actually about to just post the following -</div><div><br></div><div>Any complete code folding algorithm should be able to determine the following functions can all be folded together - i'm just using full functions because it's easier as they only have one output, feel free to make them partial.</div><div>All of these provably compute the same thing (assume proper data types, blah blah blah).<br><br></div><div>1. </div><div><br></div><div>a = b + c</div><div>d = e + f</div><div>return a + d</div><div><br></div><div>2.</div><div><br></div><div><div>a = b + c</div><div>d = e + f</div><div>g = a + 0</div><div>h = d + 0</div><div>return g + h</div></div><div><br></div><div>3.</div><div><br></div><div><div><div>a = b + c</div><div>d = e + f</div><div>g = a + 1</div><div>h = d - 1</div><div>return g + h</div></div></div><div><br></div><div>4.</div><div><div><br></div><div>if (arg1)</div><div>{<br>  a = b + c</div><div>  d = e + f</div><div>}</div><div>else</div><div>{<br>  a = e + f</div><div>  d = b + c</div><div>}</div><div>return a + d</div><div><br></div></div><div>5. </div><div><br></div><div>data[] = {e, f, b, c};</div><div>for (i = 0; i < 4; ++i)<br></div><div> sum += data[i];<br></div><div>return sum;</div><div><br></div><div>etc</div><div><br></div><div>You can go on forever.</div><div><br></div><div>I cannot see how it is possible to make a complete code folding algorithm that catches even the above cases, and is not based on a VN algorithm to either generate dags that look the same for each function / part of the function, or determine that two dags that don't look like they compute the same operation, do in fact, compute the same operation. </div><div>(or to canonicalize the function itself).</div><div><br></div><div>Maybe it's possible. I'm definitely not smart enough to see it :)</div><div><br></div><div>Can you make code folding algorithms that get less? Sure.</div><div>Might you want to do that anyway because it's easier/faster/whatever? Again, sure.</div><div><br></div><div>But at some point, as your thing is extended to catch more and more cases, i do not see how it does not either rely on a complete VN analysis, or become a complete VN analysis itself. </div><div><br></div><div class="gmail_extra"><div class="gmail_quote">On Thu, Sep 1, 2016 at 4:08 AM, Andrey Bokhanko <span dir="ltr"><<a href="mailto:andreybokhanko@gmail.com" target="_blank">andreybokhanko@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr">Hi Daniel,<div><br></div><div>Consider me convinced (not sure you care, but still... :-))</div><div><br></div><div>What confused me is that this is not VN in a traditional sense -- it's more like using VN's infrastructure to compute something different. But one can use VN's code for this, indeed.</div><div><br></div><div>Thank you for the explanation!</div><div><br></div><div>Yours,<br>Andrey</div><div><br></div></div><div class="gmail-HOEnZb"><div class="gmail-h5"><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Sep 1, 2016 at 4:24 AM, Daniel Berlin <span dir="ltr"><<a href="mailto:dberlin@dberlin.org" target="_blank">dberlin@dberlin.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div dir="ltr"><br><div class="gmail_extra"><span><br><div class="gmail_quote">On Wed, Aug 31, 2016 at 5:36 PM, Hal Finkel <span dir="ltr"><<a href="mailto:hfinkel@anl.gov" target="_blank">hfinkel@anl.gov</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div style="font-family:arial,helvetica,sans-serif;font-size:10pt;color:rgb(0,0,0)"><br><hr><blockquote style="border-left:2px solid rgb(16,16,255);margin-left:5px;padding-left:5px;color:rgb(0,0,0);font-weight:normal;font-style:normal;text-decoration:none;font-family:helvetica,arial,sans-serif;font-size:12pt"><b>From: </b>"Daniel Berlin" <<a href="mailto:dberlin@dberlin.org" target="_blank">dberlin@dberlin.org</a>><br><b>To: </b>"Hal Finkel" <<a href="mailto:hfinkel@anl.gov" target="_blank">hfinkel@anl.gov</a>><br><b>Cc: </b>"Andrey Bokhanko" <<a href="mailto:andreybokhanko@gmail.com" target="_blank">andreybokhanko@gmail.com</a>>, "llvm-dev" <<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a>><br><b>Sent: </b>Wednesday, August 31, 2016 7:02:57 PM<span><br><b>Subject: </b>Re: [llvm-dev] [RFC] Interprocedural MIR-level outlining pass<br><br></span><span><div dir="ltr">(and in particular, the definition of equivalence used by code folding to make the dags is STH like  "two VNDAG expressions are equivalent if their operands come from VNDAG expressions with the same opcode")<div><br></div><div>Thus,</div><div><br></div><div>VN2 = VN0 + VN1</div><div>VN3 = VN1 + VN2<br></div><div><br></div><div>is considered equivalent to</div><div><br></div><div>VN2 = VN0 + VN5</div><div>VN3 = VN1 + VN2</div><div><br></div><div>Despite the fact that this is completely illegal for straight redundancy elimination.</div><div><br></div><div><br></div><div>But again, as I said if y'all want to make a pass that basically generates a new type of expression DAG, have fun :)</div></div></span></blockquote>I don't think that anyone wants to do anything unnecessary, or re-invent any wheels. I'm just trying to understand what you're saying.<br><br>Regarding you example above, I certainly see how you might do this simply by defining an equivalence class over all "external" inputs. I don't think this is sufficient, however, for what is needed here. The problem is that we need to recognize maximal structurally-similar subgraphs, and I don't see how what you're proposing does that (even if you have some scheme where you don't hash every part of each instruction). Maybe if you had some stream-based similarity-preserving hash function, but that's another matter.<span style="font-family:arial,sans-serif;font-size:small;color:rgb(34,34,34)"> </span></div></div></blockquote><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div style="font-family:arial,helvetica,sans-serif;font-size:10pt;color:rgb(0,0,0)"><br></div></div></blockquote></div></span><div class="gmail_quote"><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div style="font-family:arial,helvetica,sans-serif;font-size:10pt;color:rgb(0,0,0)">Now, what I want to recognize is that the latter two instructions in each group are structurally similar. Even if I define an equivalence class over external inputs, in this case, E = { a, b, c, d, e, f, g, h}, then I have:<span><br><br>q = E + E<br>
r = E + E<br>
s = q + r<span style="font-family:arial,sans-serif;font-size:small;color:rgb(34,34,34)"> </span></span></div></div></blockquote><span><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div style="font-family:arial,helvetica,sans-serif;font-size:10pt;color:rgb(0,0,0)">t = q - r<br><br></div></div></blockquote></span><div>Doing literally nothing but building a standard VN dag (IE with normal equivalence),  </div><div>The dag here will contain:</div><div> <br></div><div>V1 = VN Expression of E + E</div><div>V2 = V1</div><div>s = VN expression of V1 + V2 (you can substitute V1 if you like or not)</div><div>x = VN expression of V1 - V2 (ditto)</div><span><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div style="font-family:arial,helvetica,sans-serif;font-size:10pt;color:rgb(0,0,0)">and:<br><br>u = E + E<br>
v = E - E<br>
w = u + v<br>
x = u - v</div></div></blockquote><div><br></div><div><br></div></span><div>The dag here would contain</div><div>V1 = E + E</div><div>V2 = E - E</div><div>w = VN expression of V1 + V2</div><div>x = VN expression of V1 - V2</div><div><br></div><div><br></div><div>So what's the issue you are worried about here, precisely?</div><div><br></div><div>If you extend this example to be longer, the answer does not change.</div><div><br></div><div>If you make it so one example is longer than the other, you can still discover this by normal graph isomorphism algorithms.</div><div>If you literally only care about the operation being performed, you can make that work too.</div><span><div><br></div><div><br></div><div><br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div style="font-family:arial,helvetica,sans-serif;font-size:10pt;color:rgb(0,0,0)">but then r and v are still different, so how to we find that {s, t} can be abstracted into a function, because we've found the isomorphism { s -> w, t -> x }, and then thus reuse that function to evaluate {w, x}?<br></div></div></blockquote><div><br></div></span><div>So let's back up. In your scheme, how do you think you do that now, precisely?</div><div>What is the algorithm you use to discover the property you are trying to find?<br></div><div><br></div></div></div></div>
</blockquote></div><br></div>
</div></div></blockquote></div><br></div></div>