<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><br class=""><div><blockquote type="cite" class=""><div class="">On Jul 24, 2017, at 4:09 PM, Andrey Bokhanko <<a href="mailto:andreybokhanko@gmail.com" class="">andreybokhanko@gmail.com</a>> wrote:</div><br class="Apple-interchange-newline"><div class="">Hi Quentin,<div class=""><br class=""></div><div class="">I really don't have a dog in this race, but... we can theoritize on strengths and weaknesses of different approaches ad infinitum -- or just accept that "the proof is in the pudding", or so they say.</div></div></blockquote><div><br class=""></div><div>I agree.</div><br class=""><blockquote type="cite" class=""><div class=""><div class=""><br class=""></div><div class="">And the proof is here! -- look at the numbers.</div></div></blockquote><div><br class=""></div><div>That I somewhat agree, IMO you can tell a lot of different things with numbers. But that’s a different story.</div><br class=""><blockquote type="cite" class=""><div class=""><div class=""><br class=""></div><div class="">If anything, I believe it makes sense to at least accept Riddle's phase to the trunk and let two approaches evolve in parallel.</div></div></blockquote><div><br class=""></div><div>Well if that’s the way we want to move with this, fine. I tend to prefer more focused effort. As long as we are making this a consciousness decision that works for me.</div><br class=""><blockquote type="cite" class=""><div class=""><div class=""> It probably silly to have both enabled at the same time, so one that currently provides a greater benefit should work on -Os/-Oz. With time, evolution will decide which one should survive -- as it always does.</div></div></blockquote><div><br class=""></div><div>Sure.</div><br class=""><blockquote type="cite" class=""><div class=""><div class=""><br class=""></div><div class="">Yours,</div><div class="">Andrey</div><div class="">===</div><div class="">Compiler Architect</div><div class="">NXP<br class=""><br class="">On Monday, July 24, 2017, Quentin Colombet via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org" class="">llvm-dev@lists.llvm.org</a>> wrote:<br class=""><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word" class="">Hi River,<div class=""><br class=""><div class=""><blockquote type="cite" class=""><div class="">On Jul 24, 2017, at 11:55 AM, River Riddle via llvm-dev <<a href="javascript:_e(%7B%7D,'cvml','llvm-dev@lists.llvm.org');" target="_blank" class="">llvm-dev@lists.llvm.org</a>> wrote:</div><br class=""><div class=""><div dir="ltr" class=""><div class="">Hi Jessica,</div><div class=""> The comparison to the inliner is an interesting one but we think it's important to note the difference in the use of heuristics. The inliner is juggling many different tasks at the same time, execution speed, code size, etc. which can cause the parameters to be very sensitive depending on the benchmark/platform/etc. The outliners heuristics are focused solely on the potential code size savings from outlining, and is thus only sensitive to the current platform. This only creates a problem when we are over estimating the potential cost of a set of instructions for a particular target. The cost model parameters are only minimums: instruction sequence length, estimated benefit, occurrence amount. The heuristics themselves are conservative and based upon all of the target information available at the IR level, the parameters are just setting a lower bound to weed out any outliers. You are correct in that being at the machine level, before or after RA, will give the most accurate heuristics but we feel there's an advantage to being at the IR level. At the IR level we can do so many more things that are either too difficult/complex for the machine level(e.g parameterization/outputs/etc). Not only can we do these things but they are available on all targets immediately, without the need for target hooks. The caution on the use of heuristics is understandable, but there comes a point when trade offs need to be made. We made the trade off for a loss in exact cost modeling to gain flexibility, coverage, and potential for further features. This trade off is the same made for quite a few IR level optimizations, including inlining. As for the worry about code size regressions, so far the results seem to support our hypothesis.</div></div></div></blockquote><div class=""><br class=""></div><div class="">Would still be interesting to see how well this could perform on some exact model (i.e., at the Machine level), IMO. Target hooks are cheap and choosing an implementation because it is simpler might not be the right long term solution.</div><div class="">At the very least, to know what trade-off we are making, having prototypes with the different approaches sounds sensible.</div><div class="">In particular, all the heuristics about cost for parameter passing (haven’t checked how you did it) sounds already complex enough and would require target hooks. Therefore, I am not seeing a clear win with an IR approach here.</div><div class=""><br class=""></div><div class="">Finally, having heuristics solely focused on code size do not seem realistic. Indeed, I am guessing you have some thresholds to avoid outlining some piece of code too small that would end up adding a whole lot of indirections and I don’t like magic numbers in general :).</div><div class=""><br class=""></div><div class="">To summarize, I wanted to point out that an IR approach is not as a clear win as you describe and would thus deserve more discussion.</div><div class=""><br class=""></div><div class="">Cheers,</div><div class="">-Quentin</div><br class=""><blockquote type="cite" class=""><div class=""><div dir="ltr" class=""><div class=""> Thanks,</div><div class="">River Riddle</div></div><div class="gmail_extra"><br class=""><div class="gmail_quote">On Mon, Jul 24, 2017 at 11:12 AM, Jessica Paquette <span dir="ltr" class=""><<a href="javascript:_e(%7B%7D,'cvml','jpaquette@apple.com');" target="_blank" class="">jpaquette@apple.com</a>></span> wrote:<br class=""><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word;line-break:after-white-space" class=""><br class=""><div class="">Hi River,</div><div class=""><br class=""></div><div class="">I’m working on the MachineOutliner pass at the MIR level. Working at the IR level sounds interesting! It also seems like our algorithms are similar. I was thinking of taking the suffix array route with the MachineOutliner in the future. </div><div class=""><br class=""></div><div class="">Anyway, I’d like to ask about this:</div><span class=""><div class=""><br class=""><blockquote type="cite" class=""><div class="">On Jul 20, 2017, at 3:47 PM, River Riddle via llvm-dev <<a href="javascript:_e(%7B%7D,'cvml','llvm-dev@lists.llvm.org');" target="_blank" class="">llvm-dev@lists.llvm.org</a>> wrote:</div><br class=""><div class=""><span style="font-family:Arial;font-size:14.666666984558105px;font-style:normal;font-weight:normal;letter-spacing:normal;text-align:start;text-indent:0px;text-transform:none;white-space:pre-wrap;word-spacing:0px;float:none;display:inline!important" class="">The downside to having this type of transformation be at the IR level is it means there will be less accuracy in the cost model -  we can somewhat accurately model the cost per instruction but we can’t get information on how a window of instructions may lower. This can cause regressions depending on the platform/codebase, therefore to help alleviate this there are several tunable parameters for the cost model.</span><br class=""></div></blockquote><br class=""></div></span><div class="">The inliner is threshold-based and it can be rather unpredictable how it will impact the code size of a program. Do you have any idea as to how heuristics/thresholds/paramete<wbr class="">rs could be tuned to prevent this? In my experience, making good code size decisions with these sorts of passes requires a lot of knowledge about what instructions you’re dealing with exactly. I’ve seen the inliner cause some pretty serious code size regressions in projects due to small changes to the cost model/parameters which cause improvements in other projects. I’m a little worried that an IR-level outliner for code size would be doomed to a similar fate.</div><div class=""><br class=""></div><div class="">Perhaps it would be interesting to run this sort of pass pre-register allocation? This would help pull you away from having to use heuristics, but give you some more opportunities for finding repeated instruction sequences. I’ve thought of doing something like this in the future with the MachineOutliner and seeing how it goes.</div><span class=""><font color="#888888" class=""><div class=""><br class=""></div><div class="">- Jessica</div><br class=""></font></span></div></blockquote></div><br class=""></div>
______________________________<wbr class="">_________________<br class="">LLVM Developers mailing list<br class=""><a href="javascript:_e(%7B%7D,'cvml','llvm-dev@lists.llvm.org');" target="_blank" class="">llvm-dev@lists.llvm.org</a><br class=""><a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" target="_blank" class="">http://lists.llvm.org/cgi-bin/<wbr class="">mailman/listinfo/llvm-dev</a><br class=""></div></blockquote></div><br class=""></div></div></blockquote></div>
</div></blockquote></div><br class=""></body></html>