<div><div dir="auto">__builtin_parity uses setnp on older x86 and popcnt with sse4.2</div></div><div><div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Sun, Sep 6, 2020 at 1:32 PM Stefan Kanthak <<a href="mailto:stefan.kanthak@nexgo.de" target="_blank">stefan.kanthak@nexgo.de</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-style:solid;padding-left:1ex;border-left-color:rgb(204,204,204)">"Craig Topper" <<a href="mailto:craig.topper@gmail.com" target="_blank">craig.topper@gmail.com</a>> wrote;<br><br><br><br>> Clang never generates calls to ___paritysi2, ___paritydi2, ___cmpdi2, or<br><br>> ___ucmpdi2 on X86 so its not clear the performance of this matters at all.<br><br><br><br>So you can safely remove them for X86 and all the other targets where such<br><br>unoptimized code is never called!<br><br>But fix these routines for targets where they are called.<br><br><br><br>The statement does NOT make any exceptions, and it does not say<br><br>| ships unoptimized routines the compiler never calls<br><br>but<br><br>| optimized target-independent implementations<br><br><br><br>Stefan<br><br><br><br>BTW: do builtins like __builtin_*parity* exist?<br><br>     If yes: do they generate the same bad code?<br><br><br><br>> On Sun, Sep 6, 2020 at 12:31 PM Stefan Kanthak via cfe-dev <<br><br>> <a href="mailto:cfe-dev@lists.llvm.org" target="_blank">cfe-dev@lists.llvm.org</a>> wrote:<br><br>> <br><br>>> <<a href="https://compiler-rt.llvm.org/index.html" rel="noreferrer" target="_blank">https://compiler-rt.llvm.org/index.html</a>> boasts:<br><br>>><br><br>>> | The builtins library provides optimized implementations of this<br><br>>> | and other low-level routines, either in target-independent C form,<br><br>>> | or as a heavily-optimized assembly.<br><br>>><br><br>>> Really?<br><br>>><br><br>>> Left: inperformant code shipped in    # Right: slightly improved code,<br><br>>>       clang_rt.builtins-*             #        which the optimiser REALLY<br><br>>>                                       #        should have generated<br><br>>><br><br>>> ___cmpdi2:<br><br>>>         mov     ecx, [esp+16]         #       mov     ecx, [esp+16]<br><br>>>         xor     eax, eax              #       xor     eax, eax<br><br>>>         cmp     [esp+8], ecx          #       cmp     ecx, [esp+8]<br><br>>>         jl      @f                    #       jg      @f<br><br>>>         mov     eax, 2                #       mov     eax, 2<br><br>>>         jg      @f                    #       jl      @f<br><br>>>         mov     ecx, [esp+4]          #<br><br>>>         mov     edx, [esp+12]         #       mov     ecx, [esp+12]<br><br>>>         mov     eax, 0                #       xor     eax, eax<br><br>>>         cmp     ecx, edx              #       cmp     ecx, [esp+4]<br><br>>>         jb      @f                    #       ja      @f<br><br>>>         cmp     edx, ecx              #<br><br>>>         mov     eax, 1                #<br><br>>>         adc     eax, 0                #       adc     eax, 1<br><br>>> @@:                                   # @@:<br><br>>>         ret                           #       ret<br><br>>><br><br>>>                                       # 3 instructions less, 10 bytes saved<br><br>>><br><br>>> ___ucmpdi2:<br><br>>>         mov     ecx, [esp+16]         #       mov     ecx, [esp+16]<br><br>>>         xor     eax, eax              #       xor     eax, eax<br><br>>>         cmp     [esp+8], ecx          #       cmp     ecx, [esp+8]<br><br>>>         jb      @f                    #       ja      @f<br><br>>>         mov     eax, 2                #       mov     eax, 2<br><br>>>         ja      @f                    #       jb      @f<br><br>>>         mov     ecx, [esp+4]          #<br><br>>>         mov     edx, [esp+12]         #       mov     ecx, [esp+12]<br><br>>>         mov     eax, 0                #       xor     eax, eax<br><br>>>         cmp     ecx, edx              #       cmp     ecx, [esp+4]<br><br>>>         jb      @f                    #       ja      @f<br><br>>>         cmp     edx, ecx              #<br><br>>>         mov     eax, 1                #<br><br>>>         adc     eax, 0                #       adc     eax, 1<br><br>>> @@:                                   # @@:<br><br>>>         ret                           #       ret<br><br>>><br><br>>>                                       # 3 instructions less, 10 bytes saved<br><br>>><br><br>>><br><br>>> Now properly written code, of course branch-free, faster and shorter:<br><br>>><br><br>>> # Copyright (C) 2004-2020, Stefan Kanthak <<a href="mailto:stefan.kanthak@nexgo.de" target="_blank">stefan.kanthak@nexgo.de</a>><br><br>>><br><br>>> ___cmpdi2:<br><br>>>         mov     ecx, [esp+4]<br><br>>>         mov     edx, [esp+12]<br><br>>>         cmp     ecx, edx<br><br>>>         mov     eax, [esp+8]<br><br>>>         sbb     eax, [esp+16]<br><br>>>         setl    ah<br><br>>>         cmp     edx, ecx<br><br>>>         mov     edx, [esp+16]<br><br>>>         sbb     edx, [esp+8]<br><br>>>         setl    al<br><br>>>         sub     al, ah<br><br>>>         movsx   eax, al<br><br>>>         inc     eax<br><br>>>         ret<br><br>>><br><br>>> ___ucmpdi2:<br><br>>>         mov     ecx, [esp+4]<br><br>>>         mov     edx, [esp+12]<br><br>>>         cmp     ecx, edx<br><br>>>         mov     eax, [esp+8]<br><br>>>         sbb     eax, [esp+16]<br><br>>>         sbb     eax, eax<br><br>>>         cmp     edx, ecx<br><br>>>         mov     edx, [esp+16]<br><br>>>         sbb     edx, [esp+8]<br><br>>>         adc     eax, 1<br><br>>>         ret<br><br>>><br><br>>><br><br>>> AGAIN:<br><br>>> Remove every occurance of the word "optimized" on the above web page.<br><br>>><br><br>>> 'nuff said<br><br>>> Stefan<br><br>>> _______________________________________________<br><br>>> cfe-dev mailing list<br><br>>> <a href="mailto:cfe-dev@lists.llvm.org" target="_blank">cfe-dev@lists.llvm.org</a><br><br>>> <a href="https://lists.llvm.org/cgi-bin/mailman/listinfo/cfe-dev" rel="noreferrer" target="_blank">https://lists.llvm.org/cgi-bin/mailman/listinfo/cfe-dev</a><br><br>>><br><br></blockquote></div></div><br><br></div>-- <br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature">~Craig</div>