<div dir="ltr">Hi Peter,<div><br></div><div>Undef is certainly useful for vector operations in the back end. It allows shorter instruction sequences for vectors which have some, but not all, elements marked as undef. Lowering vector shuffle as swap, combining arithmetic and similar.</div><div><br></div><div>For example, in slightly lispy notation, folding</div><div>(+ x (vector i32 undef 5))</div><div>and</div><div>(+ x (vector i32 4 undef))</div><div>to</div><div>(+ x (vector i32 4 5))</div><div><br></div><div>There should also be optimisations available for bitwise operations on machine words that are partially undef, but I haven't written any yet.</div><div><br></div><div>Working with variables that are entirely undef is of less interest to me. For example, folding (add 5 undef) to undef leads to less code, but it's still not code that does anything useful.<br></div><div><br></div><div>Cheers,</div><div><br></div><div>Jon</div><div><br></div><div><div class="gmail_extra"><div class="gmail_quote">On Sat, Jun 17, 2017 at 1:02 AM, via llvm-dev <span dir="ltr"><<a href="mailto:llvm-dev@lists.llvm.org" target="_blank">llvm-dev@lists.llvm.org</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">Send llvm-dev mailing list submissions to<br>
        <a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a><br>
<br>
To subscribe or unsubscribe via the World Wide Web, visit<br>
        <a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">http://lists.llvm.org/cgi-bin/<wbr>mailman/listinfo/llvm-dev</a><br>
or, via email, send a message with subject or body 'help' to<br>
        <a href="mailto:llvm-dev-request@lists.llvm.org">llvm-dev-request@lists.llvm.<wbr>org</a><br>
<br>
You can reach the person managing the list at<br>
        <a href="mailto:llvm-dev-owner@lists.llvm.org">llvm-dev-owner@lists.llvm.org</a><br>
<br>
When replying, please edit your Subject line so it is more specific<br>
than "Re: Contents of llvm-dev digest..."<br>
<br>
<br>
Today's Topics:<br>
<br>
   1. beneficial optimization of undef examples needed<br>
      (Peter Lawrence via llvm-dev)<br>
   2. Re: [GlobalISel][AArch64] Toward flipping the switch for O0:<br>
      Please give it a try! (Quentin Colombet via llvm-dev)<br>
   3. Re: beneficial optimization of undef examples needed<br>
      (John Regehr via llvm-dev)<br>
   4. Re: How does sanitizers in compiler-rt work?<br>
      (Dipanjan Das via llvm-dev)<br>
   5. Re: LLC does not do proper copy propagation (or copy<br>
      coalescing) (Alex Susu via llvm-dev)<br>
   6. Re: [GlobalISel][AArch64] Toward flipping the switch for O0:<br>
      Please give it a try! (Quentin Colombet via llvm-dev)<br>
   7. Re: beneficial optimization of undef examples needed<br>
      (Matthias Braun via llvm-dev)<br>
   8. Re: [GlobalISel][AArch64] Toward flipping the switch for O0:<br>
      Please give it a try! (Eric Christopher via llvm-dev)<br>
   9. Re: Wide load/store optimization question<br>
      (Matthias Braun via llvm-dev)<br>
<br>
<br>
------------------------------<wbr>------------------------------<wbr>----------<br>
<br>
Message: 1<br>
Date: Fri, 16 Jun 2017 15:03:32 -0700<br>
From: Peter Lawrence via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
To: llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
Subject: [llvm-dev] beneficial optimization of undef examples needed<br>
Message-ID: <<a href="mailto:E4E7669D-0308-4F85-B58E-87863717CD85@sbcglobal.net">E4E7669D-0308-4F85-B58E-<wbr>87863717CD85@sbcglobal.net</a>><br>
Content-Type: text/plain; charset=utf-8<br>
<br>
All,<br>
     These discussions seem to be based on the premise that there is a<br>
need for the compiler to exploit undefined behavior for performance<br>
optimization reasons.<br>
<br>
So far the only beneficial optimization I am aware of that relies on some<br>
form of “undefined” is Dan Gohman’s original project for LP64 targets of<br>
promoting i32 induction variables to i64 and hoisting sign-extension out<br>
of the loop.<br>
<br>
But “undef” / “poison” never appears in either the original or the transformed<br>
IR for these types of loops, instead properties of “+nsw” are used to<br>
justify the transformation.  The transformation does not just fall out because<br>
we’ve done a good job at defining “undef” / “poison” IR nodes.<br>
<br>
So I’d like to see some concrete examples of where the compiler can<br>
do useful optimization based on “undef” / “poison” appearing explicitly<br>
In the IR,  finding some would surely advance this discussion.<br>
<br>
<br>
<br>
Peter Lawrence.<br>
<br>
<br>
<br>
<br>
------------------------------<br>
<br>
Message: 2<br>
Date: Fri, 16 Jun 2017 15:06:36 -0700<br>
From: Quentin Colombet via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
To: Diana Picus <<a href="mailto:diana.picus@linaro.org">diana.picus@linaro.org</a>><br>
Cc: llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>>, Justin Bogner<br>
        <<a href="mailto:jbogner@apple.com">jbogner@apple.com</a>>, Ahmed Bougacha <<a href="mailto:abougacha@apple.com">abougacha@apple.com</a>>, Aditya<br>
        Nandakumar <<a href="mailto:aditya_nandakumar@apple.com">aditya_nandakumar@apple.com</a>>, nd <<a href="mailto:nd@arm.com">nd@arm.com</a>><br>
Subject: Re: [llvm-dev] [GlobalISel][AArch64] Toward flipping the<br>
        switch for O0: Please give it a try!<br>
Message-ID: <<a href="mailto:7923B567-B229-4FD8-8791-F9083A006FDE@apple.com">7923B567-B229-4FD8-8791-<wbr>F9083A006FDE@apple.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
<br>
> On Jun 14, 2017, at 7:27 AM, Diana Picus <<a href="mailto:diana.picus@linaro.org">diana.picus@linaro.org</a>> wrote:<br>
><br>
> On 12 June 2017 at 18:54, Diana Picus <<a href="mailto:diana.picus@linaro.org">diana.picus@linaro.org</a> <mailto:<a href="mailto:diana.picus@linaro.org">diana.picus@linaro.org</a><wbr>>> wrote:<br>
> Hi all,<br>
><br>
> I added a buildbot [1] running the test-suite with -O0 -global-isel. It runs into the same 2 timeouts that I reported previously on this thread (paq8p and scimark2). It would be nice to make it green before flipping the switch.<br>
><br>
><br>
> I did some more investigations on a machine similar to the one running the buildbot. For paq8p and scimark2, I get these results for O0:<br>
><br>
> PAQ8p:<br>
> Fast isel: 666.344<br>
> Global isel: 731.384<br>
><br>
> SciMark2-C:<br>
> Fast isel: 463.908<br>
> Global isel: 496.22<br>
><br>
> The current timeout is 500s (so in this particular case we didn't hit it for scimark2, and it ran successfully to completion). I don't think the difference between FastISel and GlobalISel is too atrocious, so I would propose increasing the timeout for these 2 benchmarks. I'm not sure if we can do this on a per-bot basis, but I see some precedent for setting custom timeout thresholds for various benchmarks on different architectures (sometimes with comments that it's done so we can run O0 on that particular benchmark).<br>
><br>
> Something along these lines works:<br>
> <a href="https://reviews.llvm.org/differential/diff/102547/" rel="noreferrer" target="_blank">https://reviews.llvm.org/<wbr>differential/diff/102547/</a> <<a href="https://reviews.llvm.org/differential/diff/102547/" rel="noreferrer" target="_blank">https://reviews.llvm.org/<wbr>differential/diff/102547/</a>><br>
><br>
> What do you guys think about this approach?<br>
<br>
Looks reasonable to me.<br>
<br>
><br>
> Thanks,<br>
> Diana<br>
><br>
> PS: The buildbot is using the Makefiles because that's what our other AArch64 test-suite bots use. Moving all of them to CMake is a transition for another time.<br>
><br>
> At the moment, it lives in an internal buildmaster that I've setup for this purpose. If we fix it and it proves to be stable for a week or two, I'll move it to the public master.<br>
><br>
> Cheers,<br>
> Diana<br>
><br>
> [1] <a href="http://master2.llvm.validation.linaro.org/builders/clang-cmake-aarch64-global-isel" rel="noreferrer" target="_blank">http://master2.llvm.<wbr>validation.linaro.org/<wbr>builders/clang-cmake-aarch64-<wbr>global-isel</a> <<a href="http://master2.llvm.validation.linaro.org/builders/clang-cmake-aarch64-global-isel" rel="noreferrer" target="_blank">http://master2.llvm.<wbr>validation.linaro.org/<wbr>builders/clang-cmake-aarch64-<wbr>global-isel</a>><br>
><br>
><br>
> On 6 June 2017 at 19:11, Quentin Colombet <<a href="mailto:qcolombet@apple.com">qcolombet@apple.com</a> <mailto:<a href="mailto:qcolombet@apple.com">qcolombet@apple.com</a>>> wrote:<br>
> Thanks Kristof.<br>
><br>
> Sounds like we'll need to investigate though I'd say it is not blocking the switch.<br>
><br>
> At this point I think everybody is on board to flip the switch.<br>
> @Eric, how does that sound to you?<br>
><br>
> Thanks,<br>
> Q<br>
><br>
> Le 1 juin 2017 à 07:46, Kristof Beyls <<a href="mailto:Kristof.Beyls@arm.com">Kristof.Beyls@arm.com</a> <mailto:<a href="mailto:Kristof.Beyls@arm.com">Kristof.Beyls@arm.com</a>><wbr>> a écrit :<br>
><br>
>><br>
>>> On 31 May 2017, at 17:07, Quentin Colombet <<a href="mailto:qcolombet@apple.com">qcolombet@apple.com</a> <mailto:<a href="mailto:qcolombet@apple.com">qcolombet@apple.com</a>>> wrote:<br>
>>>><br>
>>>> Latest comparisons on my side, after picking up r304244, i.e. the correct Localizer pass.<br>
>>>> * CTMark compile time, comparing "-O0 -g" vs '-O0 -g -mllvm -global-isel=true -mllvm -global-isel-abort=0': about 6% increase with globalisel. This was about 3.5% before the Localizer pass landed.<br>
>>><br>
>>> That one is surprising too. I wouldn’t have expected this pass to show up in the compile time profile. At least not to this extend.<br>
>>> What is the biggest offender?<br>
>><br>
>> Hmmm. So I took the 3.5% compile time overhead from my last measurement before the localizer landed, from around 24th of May.<br>
>> When using -ftime-report, I see the Localizer pass typically taking very roughly about 1% of compile time.<br>
>> Maybe another part of GlobalISel became a bit slower since I did that 3.5% measurement?<br>
>> Or maybe the Localizer pass changes the structure of the program so that another later pass gets a different compile time profile?<br>
>> Basically, I'd have to do more experiments to figure that one out.<br>
>><br>
>> As far as where time is spent in the gisel-passes itself, on average, I saw the following on the latest CTMark experiment I ran:<br>
>> Avg compile time spent in IRTranslator: 4.61%<br>
>> Avg compile time spent in InstructionSelect: 7.51%<br>
>> Avg compile time spent in Legalizer: 1.06%<br>
>> Avg compile time spent in Localizer: 0.76%<br>
>> Avg compile time spent in RegBankSelect: 2.12%<br>
>><br>
>>><br>
>>>> * My usual performance benchmarking run: 8.5% slow-down. This was about 9.5% before the Localizer pass landed, so a slight improvement.<br>
>>>> * Code size: 3.14% larger. This was about 2.8% before the Localizer pass landed, so a slight regression.<br>
>>><br>
>>> That one is surprising. Do you have an idea of what is happening?<br>
>>> Alternatively if you can point me to the biggest offender, I can have a look.<br>
>><br>
>> So the biggest offenders on the mem_bytes metric in LNT are:<br>
>> O0 -g        O0 -g gisel-with-localizer      O0 -g gisel-without-localizer<br>
>> SingleSource/Benchmarks/Misc/<wbr>perlin  14272   14640   18344   25.95%<br>
>> SingleSource/Benchmarks/<wbr>Dhrystone/dry        16560   17144   20160   18.21%<br>
>> SingleSource/Benchmarks/<wbr>Stanford/QueensProfile       13912   14192   15136   6.79%<br>
>> MultiSource/Benchmarks/<wbr>Trimaran/netbench-url/<wbr>netbench-url    71400   72272   75504   4.53%<br>
>><br>
>> I haven't had time to investigate what exact changes make the code size go up that much with the localizer pass in those cases...<br>
>><br>
>>><br>
>>> The only thing I can think of is that we duplicate constants that are expensive to materialize. If that’s the case, we were discussing with Ahmed an alternative to the localizer pass that would operate during InstructionSelect so may be worth pursuing.<br>
>><br>
><br>
><br>
<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://lists.llvm.org/pipermail/llvm-dev/attachments/20170616/e2843584/attachment-0001.html" rel="noreferrer" target="_blank">http://lists.llvm.org/<wbr>pipermail/llvm-dev/<wbr>attachments/20170616/e2843584/<wbr>attachment-0001.html</a>><br>
<br>
------------------------------<br>
<br>
Message: 3<br>
Date: Fri, 16 Jun 2017 16:19:09 -0600<br>
From: John Regehr via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
To: <a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a><br>
Subject: Re: [llvm-dev] beneficial optimization of undef examples<br>
        needed<br>
Message-ID: <<a href="mailto:4caa44fc-9bb7-58e7-9f44-f711edce1f5e@cs.utah.edu">4caa44fc-9bb7-58e7-9f44-<wbr>f711edce1f5e@cs.utah.edu</a>><br>
Content-Type: text/plain; charset=utf-8; format=flowed<br>
<br>
I'll repeat that open-ended requests would that end up generating lots<br>
of work for other people probably aren't going to get great results here.<br>
<br>
John<br>
<br>
<br>
<br>
On 6/16/17 4:03 PM, Peter Lawrence via llvm-dev wrote:<br>
> All,<br>
>      These discussions seem to be based on the premise that there is a<br>
> need for the compiler to exploit undefined behavior for performance<br>
> optimization reasons.<br>
><br>
> So far the only beneficial optimization I am aware of that relies on some<br>
> form of “undefined” is Dan Gohman’s original project for LP64 targets of<br>
> promoting i32 induction variables to i64 and hoisting sign-extension out<br>
> of the loop.<br>
><br>
> But “undef” / “poison” never appears in either the original or the transformed<br>
> IR for these types of loops, instead properties of “+nsw” are used to<br>
> justify the transformation.  The transformation does not just fall out because<br>
> we’ve done a good job at defining “undef” / “poison” IR nodes.<br>
><br>
> So I’d like to see some concrete examples of where the compiler can<br>
> do useful optimization based on “undef” / “poison” appearing explicitly<br>
> In the IR,  finding some would surely advance this discussion.<br>
><br>
><br>
><br>
> Peter Lawrence.<br>
><br>
><br>
> ______________________________<wbr>_________________<br>
> LLVM Developers mailing list<br>
> <a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a><br>
> <a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">http://lists.llvm.org/cgi-bin/<wbr>mailman/listinfo/llvm-dev</a><br>
><br>
<br>
<br>
------------------------------<br>
<br>
Message: 4<br>
Date: Fri, 16 Jun 2017 15:23:06 -0700<br>
From: Dipanjan Das via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
To: llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
Subject: Re: [llvm-dev] How does sanitizers in compiler-rt work?<br>
Message-ID:<br>
        <CAEK-7JLpnet2zF82z5v-<wbr>RvUKaYrbmZRGtHpc-=<a href="mailto:dTTQuVKwDosg@mail.gmail.com">dTTQuVKwDosg<wbr>@mail.gmail.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
Hi Vedant,<br>
<br>
Thanks for the pointers. Please find my replies inline.<br>
<br>
On 16 June 2017 at 14:48, Vedant Kumar <<a href="mailto:vsk@apple.com">vsk@apple.com</a>> wrote:<br>
<br>
><br>
> On Jun 16, 2017, at 4:11 AM, Dipanjan Das via llvm-dev <<br>
> <a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>> wrote:<br>
><br>
><br>
> Can anybody give me any pointer on how compiler-rt, especially the<br>
> sanitizers work? Do they operate on IR as any other LLVM pass? Or are they<br>
> integral part of the frontend itself? I couldn't spot any documentation on<br>
> the internals of compiler-rt project? What happens (sequence of actions)<br>
> when I pass -fsanitizer=dataflow to clang?<br>
><br>
><br>
> Passing -fsanitize=dataflow tells clang to insert the dataflow sanitizer's<br>
> instrumentation pass into the normal compilation pipeline. The<br>
> instrumentation occurs at the LLVM IR level. The pass may insert calls into<br>
> runtime functions which are provided by compiler-rt. Therefore, in order to<br>
> link a program compiled with -fsanitize=dataflow, the appropriate runtime<br>
> library from compiler-rt is required.<br>
><br>
><br>
> Precisely, I intend to alter the behaviour of DFSan to suit my need.<br>
><br>
><br>
> What is your need, exactly?<br>
><br>
><br>
Instead of manually inserting the dfsan_create_label() and<br>
dfsan_set_label() calls in the source, I want to automatically insert those<br>
calls in the IR for all the input variables in scanf(). I intend to run the<br>
DFsan pass afterwards, thus instrumenting the IR further as required.<br>
<br>
<br>
> Therefore, I need to know how it gets integrated in the tool-chain.<br>
> Initially, my idea was to insert the dfsan_set_label() calls to the IR and<br>
> pass it to DFSan. However, I am not sure if it's designed to run on the<br>
> source only, not on IR.<br>
><br>
><br>
> You should take a look at lib/Transforms/<wbr>Instrumentation/<wbr>DataFlowSanitizer.cpp.<br>
> There doesn't appear to be much done at the source level.<br>
><br>
> best,<br>
> vedant<br>
><br>
><br>
> --<br>
><br>
> Thanks & Regards,<br>
> Dipanjan<br>
> ______________________________<wbr>_________________<br>
> LLVM Developers mailing list<br>
> <a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a><br>
> <a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">http://lists.llvm.org/cgi-bin/<wbr>mailman/listinfo/llvm-dev</a><br>
><br>
><br>
><br>
<br>
<br>
--<br>
<br>
Thanks & Regards,<br>
Dipanjan<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://lists.llvm.org/pipermail/llvm-dev/attachments/20170616/b7325d95/attachment-0001.html" rel="noreferrer" target="_blank">http://lists.llvm.org/<wbr>pipermail/llvm-dev/<wbr>attachments/20170616/b7325d95/<wbr>attachment-0001.html</a>><br>
<br>
------------------------------<br>
<br>
Message: 5<br>
Date: Sat, 17 Jun 2017 02:28:22 +0300<br>
From: Alex Susu via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
To: llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
Subject: Re: [llvm-dev] LLC does not do proper copy propagation (or<br>
        copy coalescing)<br>
Message-ID: <<a href="mailto:87cb1d9f-55ed-c9a6-489c-3d87c6a0aaf1@gmail.com">87cb1d9f-55ed-c9a6-489c-<wbr>3d87c6a0aaf1@gmail.com</a>><br>
Content-Type: text/plain; charset=utf-8; format=flowed<br>
<br>
   Hello.<br>
     Wei-Ren, as I've pointed out in the previous email: the piece of code below has the<br>
deficiency that it uses register R5 instead of using R0 - this happens because in LLVM IR<br>
I created 2 variables, varIndexInner and varIndexOuter, since I have 2 loops and the<br>
variable has to be iterated in the inner loop and I need to preserve its value when going<br>
to the next iteration for the outer loop.<br>
       // NOTE: my processor accepts loops in the form of REPEAT(num_times)..END_REPEAT<br>
       R0 = ...<br>
       REPEAT(256)<br>
         R5 = R0; // basically unnecessary reg. copy<br>
         REPEAT(256)<br>
           R10 = LS[R4];<br>
           R2 = LS[R5];<br>
           R4 = R4 + R1;<br>
           R5 = R5 + R1; // should be R0 = R0 + R1<br>
           R10 = R2 * R10;<br>
           R3 = R3 + R10;<br>
         END_REPEAT;<br>
         REDUCE R3;<br>
         R0 = R5; // basically unnecessary reg. copy<br>
       END_REPEAT;<br>
<br>
<br>
     The reason the RegisterCoalescer.cpp is not able to optimize this problem I mentioned<br>
about is that R0 and R5 have interfering live intervals.<br>
<br>
     I'm trying to implement a case to handle this optimization I want in<br>
RegisterCoalescer.cpp, but it seems a bit complicated. (However, it seems more natural to<br>
do a standard copy propagation with Data Flow Analysis on the MachineBasicBlocks with<br>
virtual registers, after coming out of SSA form. Muchnick's book from 1997 talks in detail<br>
about this in Section 12.5.)<br>
<br>
     More exactly the registers and copies concerned for the above ASM code (copying text<br>
from the stderr of llc) are:<br>
       BB#0:<br>
         vreg99 = 0 // IMPORTANT: this instruction is dead and I guess if it is DCE-ed<br>
RegisterCoalescer.cpp would be able to optimize my code<br>
<br>
       BB#1:<br>
         vreg94 = some_data_offset<br>
<br>
       BB#3:<br>
         vreg99 = COPY vreg94 // This copy does propagate<br>
<br>
       BB#4:<br>
         vreg61 = LOAD vreg99<br>
         vreg99 = ADD vreg99, 1<br>
         jmp_cond BB#4, BB#9<br>
<br>
       BB#9:<br>
         vreg94 = COPY vreg99 // This copy does NOT propagate<br>
         jmp_cond BB#3<br>
<br>
     Can somebody tell me how can I run the Dead Code Elimination and then<br>
RegisterCoalescer again in LLC in order to see if I can maybe optimize this piece of code?<br>
<br>
     I'm interested in doing this optimization since the code runs on a very wide SIMD<br>
processor and every instruction counts.<br>
<br>
   Thank you very much,<br>
     Alex<br>
<br>
<br>
<br>
On 6/15/2017 11:41 PM, 陳韋任 wrote:<br>
>         I see 3 options to address my problem:<br>
>           - implement a case that handles this in PHI elimination (PHIElimination.cpp);<br>
>           - create a new pass that does copy propagation (based on DFA) on machine<br>
>     instructions before Register Allocation;<br>
>           - optimize copy coalescing such as the standard one or the one activated by<br>
>     -pbqp-coalescing in lib/CodeGen/RegAllocPBQP.cpp (there is an email also about PBQP<br>
>     coalescing at <a href="http://lists.llvm.org/pipermail/llvm-dev/2016-June/100523.html" rel="noreferrer" target="_blank">http://lists.llvm.org/<wbr>pipermail/llvm-dev/2016-June/<wbr>100523.html</a><br>
>     <<a href="http://lists.llvm.org/pipermail/llvm-dev/2016-June/100523.html" rel="noreferrer" target="_blank">http://lists.llvm.org/<wbr>pipermail/llvm-dev/2016-June/<wbr>100523.html</a>>).<br>
><br>
><br>
> Usually this is done by copy coalescing, do you know why yours cannot be eliminated, is<br>
> your case not be handled well in existing copy coalescing (RegisterCoalescer.cpp for<br>
> example)?<br>
><br>
> ​HTH,<br>
> chenwj​<br>
><br>
> --<br>
> Wei-Ren Chen (陳韋任)<br>
> Homepage: <a href="https://people.cs.nctu.edu.tw/~chenwj" rel="noreferrer" target="_blank">https://people.cs.nctu.edu.tw/<wbr>~chenwj</a><br>
<br>
<br>
------------------------------<br>
<br>
Message: 6<br>
Date: Fri, 16 Jun 2017 16:43:35 -0700<br>
From: Quentin Colombet via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
To: Quentin Colombet <<a href="mailto:qcolombet@apple.com">qcolombet@apple.com</a>><br>
Cc: llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>>, Justin Bogner<br>
        <<a href="mailto:jbogner@apple.com">jbogner@apple.com</a>>, Ahmed Bougacha <<a href="mailto:abougacha@apple.com">abougacha@apple.com</a>>, Aditya<br>
        Nandakumar <<a href="mailto:aditya_nandakumar@apple.com">aditya_nandakumar@apple.com</a>>, nd <<a href="mailto:nd@arm.com">nd@arm.com</a>><br>
Subject: Re: [llvm-dev] [GlobalISel][AArch64] Toward flipping the<br>
        switch for O0: Please give it a try!<br>
Message-ID: <<a href="mailto:71BBA103-3C49-4AFD-92E2-A8C9EABCE242@apple.com">71BBA103-3C49-4AFD-92E2-<wbr>A8C9EABCE242@apple.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
Hi all,<br>
<br>
We had some internal discussions about flipping the default for O0 and we concluded that we wanted to postpone it.<br>
<br>
<br>
*** Why Is That? ***<br>
<br>
We don’t want to send the wrong message that GlobalISel’s design is set in stone and ready for broader adoption.<br>
In particular,<br>
1. The APIs are still evolving and can still possibly change significantly<br>
2. The TableGen backend to reuse the existing SD patterns is still at its early stage<br>
3. We want to investigate closely the performance of global-isel (compile-time, runtime, code size, fallbacks)<br>
<br>
The rationale behind those items is that we want to minimize the pain of moving forward for everybody. We also want the out-of-the-box experience to be pleasant (like all/most of the tablegen patterns just work, we have documentation on how to target a new backend, etc.) Finally, we want to gain confidence we are going to be able to address the performance issues we have with the current design and if not, derive a plan for that.<br>
<br>
We purposely left out of the conversation what will be the right time and requirements to flip the switch. We want to gather more data first. Your help would be appreciated!<br>
<br>
<br>
*** Short-Term Proposal ***<br>
<br>
What we would like to do instead short-term is:<br>
A. Repurpose or create an option “-aarch64-enable-global-isel-<wbr>at-O” to enable GISel with fallbacks and warnings enables (i.e., equivalent of -global-isel -global-isel-abort=2)<br>
B. Advertise this option in the next open source release to allow compiler enthusiastic to try it and report problems<br>
C. Have GISel always built so we can push thing in the right place, MachineVerifier in mind, and stop doing some weird gymnastic<br>
<br>
What do people think?<br>
<br>
<br>
*** Your Help Is Needed ***<br>
<br>
- Please share your experience in using the GISel APIs and how we can make them better. Moving forward we’ll have those conversations on open source instead of internally/with a narrower audience.<br>
- Report any performance problem you identify<br>
- Propose patches!<br>
<br>
Cheers,<br>
-Quentin<br>
<br>
<br>
<br>
> On Jun 16, 2017, at 3:06 PM, Quentin Colombet via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>> wrote:<br>
><br>
>><br>
>> On Jun 14, 2017, at 7:27 AM, Diana Picus <<a href="mailto:diana.picus@linaro.org">diana.picus@linaro.org</a> <mailto:<a href="mailto:diana.picus@linaro.org">diana.picus@linaro.org</a><wbr>>> wrote:<br>
>><br>
>> On 12 June 2017 at 18:54, Diana Picus <<a href="mailto:diana.picus@linaro.org">diana.picus@linaro.org</a> <mailto:<a href="mailto:diana.picus@linaro.org">diana.picus@linaro.org</a><wbr>>> wrote:<br>
>> Hi all,<br>
>><br>
>> I added a buildbot [1] running the test-suite with -O0 -global-isel. It runs into the same 2 timeouts that I reported previously on this thread (paq8p and scimark2). It would be nice to make it green before flipping the switch.<br>
>><br>
>><br>
>> I did some more investigations on a machine similar to the one running the buildbot. For paq8p and scimark2, I get these results for O0:<br>
>><br>
>> PAQ8p:<br>
>> Fast isel: 666.344<br>
>> Global isel: 731.384<br>
>><br>
>> SciMark2-C:<br>
>> Fast isel: 463.908<br>
>> Global isel: 496.22<br>
>><br>
>> The current timeout is 500s (so in this particular case we didn't hit it for scimark2, and it ran successfully to completion). I don't think the difference between FastISel and GlobalISel is too atrocious, so I would propose increasing the timeout for these 2 benchmarks. I'm not sure if we can do this on a per-bot basis, but I see some precedent for setting custom timeout thresholds for various benchmarks on different architectures (sometimes with comments that it's done so we can run O0 on that particular benchmark).<br>
>><br>
>> Something along these lines works:<br>
>> <a href="https://reviews.llvm.org/differential/diff/102547/" rel="noreferrer" target="_blank">https://reviews.llvm.org/<wbr>differential/diff/102547/</a> <<a href="https://reviews.llvm.org/differential/diff/102547/" rel="noreferrer" target="_blank">https://reviews.llvm.org/<wbr>differential/diff/102547/</a>><br>
>><br>
>> What do you guys think about this approach?<br>
><br>
> Looks reasonable to me.<br>
><br>
>><br>
>> Thanks,<br>
>> Diana<br>
>><br>
>> PS: The buildbot is using the Makefiles because that's what our other AArch64 test-suite bots use. Moving all of them to CMake is a transition for another time.<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://lists.llvm.org/pipermail/llvm-dev/attachments/20170616/fb1dc279/attachment-0001.html" rel="noreferrer" target="_blank">http://lists.llvm.org/<wbr>pipermail/llvm-dev/<wbr>attachments/20170616/fb1dc279/<wbr>attachment-0001.html</a>><br>
<br>
------------------------------<br>
<br>
Message: 7<br>
Date: Fri, 16 Jun 2017 16:48:15 -0700<br>
From: Matthias Braun via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
To: John Regehr <<a href="mailto:regehr@cs.utah.edu">regehr@cs.utah.edu</a>><br>
Cc: <a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a><br>
Subject: Re: [llvm-dev] beneficial optimization of undef examples<br>
        needed<br>
Message-ID: <<a href="mailto:C94F7BAB-BC74-49FA-9F2B-3104736EDA7C@apple.com">C94F7BAB-BC74-49FA-9F2B-<wbr>3104736EDA7C@apple.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
Luckily someone already did the work writing a bunch of examples down:<br>
<a href="http://blog.llvm.org/2011/05/what-every-c-programmer-should-know.html" rel="noreferrer" target="_blank">http://blog.llvm.org/2011/05/<wbr>what-every-c-programmer-<wbr>should-know.html</a> <<a href="http://blog.llvm.org/2011/05/what-every-c-programmer-should-know.html" rel="noreferrer" target="_blank">http://blog.llvm.org/2011/05/<wbr>what-every-c-programmer-<wbr>should-know.html</a>><br>
<br>
And +1 for keeping this on-topic on how to implement poison.<br>
<br>
- Matthias<br>
<br>
> On Jun 16, 2017, at 3:19 PM, John Regehr via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>> wrote:<br>
><br>
> I'll repeat that open-ended requests would that end up generating lots of work for other people probably aren't going to get great results here.<br>
><br>
> John<br>
><br>
><br>
><br>
> On 6/16/17 4:03 PM, Peter Lawrence via llvm-dev wrote:<br>
>> All,<br>
>>     These discussions seem to be based on the premise that there is a<br>
>> need for the compiler to exploit undefined behavior for performance<br>
>> optimization reasons.<br>
>><br>
>> So far the only beneficial optimization I am aware of that relies on some<br>
>> form of “undefined” is Dan Gohman’s original project for LP64 targets of<br>
>> promoting i32 induction variables to i64 and hoisting sign-extension out<br>
>> of the loop.<br>
>><br>
>> But “undef” / “poison” never appears in either the original or the transformed<br>
>> IR for these types of loops, instead properties of “+nsw” are used to<br>
>> justify the transformation.  The transformation does not just fall out because<br>
>> we’ve done a good job at defining “undef” / “poison” IR nodes.<br>
>><br>
>> So I’d like to see some concrete examples of where the compiler can<br>
>> do useful optimization based on “undef” / “poison” appearing explicitly<br>
>> In the IR,  finding some would surely advance this discussion.<br>
>><br>
>><br>
>><br>
>> Peter Lawrence.<br>
>><br>
>><br>
>> ______________________________<wbr>_________________<br>
>> LLVM Developers mailing list<br>
>> <a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a><br>
>> <a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">http://lists.llvm.org/cgi-bin/<wbr>mailman/listinfo/llvm-dev</a><br>
>><br>
> ______________________________<wbr>_________________<br>
> LLVM Developers mailing list<br>
> <a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a><br>
> <a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">http://lists.llvm.org/cgi-bin/<wbr>mailman/listinfo/llvm-dev</a><br>
<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://lists.llvm.org/pipermail/llvm-dev/attachments/20170616/98f258f4/attachment-0001.html" rel="noreferrer" target="_blank">http://lists.llvm.org/<wbr>pipermail/llvm-dev/<wbr>attachments/20170616/98f258f4/<wbr>attachment-0001.html</a>><br>
<br>
------------------------------<br>
<br>
Message: 8<br>
Date: Fri, 16 Jun 2017 23:58:21 +0000<br>
From: Eric Christopher via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
To: Quentin Colombet <<a href="mailto:qcolombet@apple.com">qcolombet@apple.com</a>><br>
Cc: llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>>, Justin Bogner<br>
        <<a href="mailto:jbogner@apple.com">jbogner@apple.com</a>>, Ahmed Bougacha <<a href="mailto:abougacha@apple.com">abougacha@apple.com</a>>, Aditya<br>
        Nandakumar <<a href="mailto:aditya_nandakumar@apple.com">aditya_nandakumar@apple.com</a>>, nd <<a href="mailto:nd@arm.com">nd@arm.com</a>><br>
Subject: Re: [llvm-dev] [GlobalISel][AArch64] Toward flipping the<br>
        switch for O0: Please give it a try!<br>
Message-ID:<br>
        <CALehDX5M=+<a href="mailto:G3LJ4q4b-P0WN3D5WqiYPK%2Bj3zGRJVANNMfHRsWg@mail.gmail.com">G3LJ4q4b-<wbr>P0WN3D5WqiYPK+<wbr>j3zGRJVANNMfHRsWg@mail.gmail.<wbr>com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
On Fri, Jun 16, 2017 at 4:43 PM Quentin Colombet <<a href="mailto:qcolombet@apple.com">qcolombet@apple.com</a>><br>
wrote:<br>
<br>
> Hi all,<br>
><br>
> We had some internal discussions about flipping the default for O0 and we<br>
> concluded that we wanted to postpone it.<br>
><br>
><br>
> *** Why Is That? ***<br>
><br>
> We don’t want to send the wrong message that GlobalISel’s design is set in<br>
> stone and ready for broader adoption.<br>
> In particular,<br>
> 1. The APIs are still evolving and can still possibly change significantly<br>
> 2. The TableGen backend to reuse the existing SD patterns is still at its<br>
> early stage<br>
> 3. We want to investigate closely the performance of global-isel<br>
> (compile-time, runtime, code size, fallbacks)<br>
><br>
> The rationale behind those items is that we want to minimize the pain of<br>
> moving forward for everybody. We also want the out-of-the-box experience to<br>
> be pleasant (like all/most of the tablegen patterns just work, we have<br>
> documentation on how to target a new backend, etc.) Finally, we want to<br>
> gain confidence we are going to be able to address the performance issues<br>
> we have with the current design and if not, derive a plan for that.<br>
><br>
> We purposely left out of the conversation what will be the right time and<br>
> requirements to flip the switch. We want to gather more data first. Your<br>
> help would be appreciated!<br>
><br>
><br>
> *** Short-Term Proposal ***<br>
><br>
> What we would like to do instead short-term is:<br>
> A. Repurpose or create an option “-aarch64-enable-global-isel-<wbr>at-O” to<br>
> enable GISel with fallbacks and warnings enables (i.e., equivalent of<br>
> -global-isel -global-isel-abort=2)<br>
> B. Advertise this option in the next open source release to allow compiler<br>
> enthusiastic to try it and report problems<br>
> C. Have GISel always built so we can push thing in the right place,<br>
> MachineVerifier in mind, and stop doing some weird gymnastic<br>
><br>
> What do people think?<br>
><br>
><br>
How about -fexperimental-global-isel as a flag to clang?<br>
<br>
-eric<br>
<br>
<br>
><br>
> *** Your Help Is Needed ***<br>
><br>
> - Please share your experience in using the GISel APIs and how we can make<br>
> them better. Moving forward we’ll have those conversations on open source<br>
> instead of internally/with a narrower audience.<br>
> - Report any performance problem you identify<br>
> - Propose patches!<br>
><br>
> Cheers,<br>
> -Quentin<br>
><br>
><br>
><br>
> On Jun 16, 2017, at 3:06 PM, Quentin Colombet via llvm-dev <<br>
> <a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>> wrote:<br>
><br>
><br>
> On Jun 14, 2017, at 7:27 AM, Diana Picus <<a href="mailto:diana.picus@linaro.org">diana.picus@linaro.org</a>> wrote:<br>
><br>
> On 12 June 2017 at 18:54, Diana Picus <<a href="mailto:diana.picus@linaro.org">diana.picus@linaro.org</a>> wrote:<br>
><br>
>> Hi all,<br>
>><br>
>> I added a buildbot [1] running the test-suite with -O0 -global-isel. It<br>
>> runs into the same 2 timeouts that I reported previously on this thread<br>
>> (paq8p and scimark2). It would be nice to make it green before flipping the<br>
>> switch.<br>
>><br>
>><br>
> I did some more investigations on a machine similar to the one running the<br>
> buildbot. For paq8p and scimark2, I get these results for O0:<br>
><br>
> PAQ8p:<br>
> Fast isel: 666.344<br>
> Global isel: 731.384<br>
><br>
> SciMark2-C:<br>
> Fast isel: 463.908<br>
> Global isel: 496.22<br>
><br>
> The current timeout is 500s (so in this particular case we didn't hit it<br>
> for scimark2, and it ran successfully to completion). I don't think the<br>
> difference between FastISel and GlobalISel is too atrocious, so I would<br>
> propose increasing the timeout for these 2 benchmarks. I'm not sure if we<br>
> can do this on a per-bot basis, but I see some precedent for setting custom<br>
> timeout thresholds for various benchmarks on different architectures<br>
> (sometimes with comments that it's done so we can run O0 on that particular<br>
> benchmark).<br>
><br>
> Something along these lines works:<br>
> <a href="https://reviews.llvm.org/differential/diff/102547/" rel="noreferrer" target="_blank">https://reviews.llvm.org/<wbr>differential/diff/102547/</a><br>
><br>
> What do you guys think about this approach?<br>
><br>
><br>
> Looks reasonable to me.<br>
><br>
><br>
> Thanks,<br>
> Diana<br>
><br>
> PS: The buildbot is using the Makefiles because that's what our other<br>
> AArch64 test-suite bots use. Moving all of them to CMake is a transition<br>
> for another time.<br>
><br>
><br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://lists.llvm.org/pipermail/llvm-dev/attachments/20170616/76b429ee/attachment-0001.html" rel="noreferrer" target="_blank">http://lists.llvm.org/<wbr>pipermail/llvm-dev/<wbr>attachments/20170616/76b429ee/<wbr>attachment-0001.html</a>><br>
<br>
------------------------------<br>
<br>
Message: 9<br>
Date: Fri, 16 Jun 2017 17:05:46 -0700<br>
From: Matthias Braun via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>><br>
To: 陳韋任 <<a href="mailto:chenwj.cs97g@g2.nctu.edu.tw">chenwj.cs97g@g2.nctu.edu.tw</a>><br>
Cc: LLVM Developers Mailing List <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>>, upcfrost<br>
        <<a href="mailto:upcfrost@gmail.com">upcfrost@gmail.com</a>><br>
Subject: Re: [llvm-dev] Wide load/store optimization question<br>
Message-ID: <<a href="mailto:5517D905-C871-45AB-A985-73DEF2C23B58@apple.com">5517D905-C871-45AB-A985-<wbr>73DEF2C23B58@apple.com</a>><br>
Content-Type: text/plain; charset="utf-8"<br>
<br>
<br>
> On Jun 16, 2017, at 2:43 PM, 陳韋任 via llvm-dev <<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a>> wrote:<br>
><br>
><br>
><br>
> 2017-06-17 4:36 GMT+08:00 upcfrost <<a href="mailto:upcfrost@gmail.com">upcfrost@gmail.com</a> <mailto:<a href="mailto:upcfrost@gmail.com">upcfrost@gmail.com</a>>>:<br>
> Hi,<br>
><br>
> Same here, my backend only has 64bit load/store. But i still use 64bit virt regs and expand/declare missing instructions by myself.<br>
><br>
> I'll try looking into sparc backend, thanks. Also, only after writing this post I found a bunch of built-in transforms. Still trying to understand how to use those.<br>
><br>
> By the way, constraint-wise (alignment), is there any difference between virt regclass and regtuple?<br>
<br>
That question makes no sense.<br>
- Every virtual register has a register class assigned.<br>
- You can construct special register classes that represent register tuples so that when the allocator chooses an entry from that register class it really has choosen a tuple of machine registers (even though it looks like a single register with funny aliasing as far as llvm codegen is concerned).<br>
<br>
- Matthias<br>
-------------- next part --------------<br>
An HTML attachment was scrubbed...<br>
URL: <<a href="http://lists.llvm.org/pipermail/llvm-dev/attachments/20170616/30f9fd06/attachment.html" rel="noreferrer" target="_blank">http://lists.llvm.org/<wbr>pipermail/llvm-dev/<wbr>attachments/20170616/30f9fd06/<wbr>attachment.html</a>><br>
<br>
------------------------------<br>
<br>
Subject: Digest Footer<br>
<br>
______________________________<wbr>_________________<br>
llvm-dev mailing list<br>
<a href="mailto:llvm-dev@lists.llvm.org">llvm-dev@lists.llvm.org</a><br>
<a href="http://lists.llvm.org/cgi-bin/mailman/listinfo/llvm-dev" rel="noreferrer" target="_blank">http://lists.llvm.org/cgi-bin/<wbr>mailman/listinfo/llvm-dev</a><br>
<br>
<br>
------------------------------<br>
<br>
End of llvm-dev Digest, Vol 156, Issue 97<br>
******************************<wbr>***********<br>
</blockquote></div><br></div></div></div>