<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Sun, Oct 19, 2014 at 1:23 PM, Rafael Espíndola <span dir="ltr"><<a href="mailto:rafael.espindola@gmail.com" target="_blank">rafael.espindola@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span class="">>> The attached patch makes clang use comdats for linkonce_odr structors.<br>
>> This matches the gcc behavior and there are two potential advantages<br>
>> that I can think off<br>
>><br>
>> * Avoid a bit of code bloat when mixing gcc and clang compiled code<br>
>> since they will have the same COMDATs.<br>
><br>
><br>
> Can you say a bit more about the cases where this reduces code bloat? Either<br>
> way, we'll end up with exactly one definition of each Dn variant that is<br>
> used, won't we?<br>
<br>
</span>We end up resolving the symbol to one of the definitions, but if gcc<br>
and clang put them in different COMDATS we can end up with a bit of<br>
dead code in the final binary if not using -ffunction-sections and GC<br>
in the linker. What happens is that during initial read in the linker<br>
will only see two different comdats (D5 from GCC, D1/D2 from clang)<br>
and keep both. With matching comdats the linker doesn't even need to<br>
read the duplicated entries.<br>
<span class=""><br>
>> * Avoid pain to users that developed a dependency on the gcc behavior,<br>
>> but it might be a bit late for that<br>
>> (<a href="http://llvm.org/devmtg/2014-04/PDFs/Talks/NickRefactoring.pdf" target="_blank">http://llvm.org/devmtg/2014-04/PDFs/Talks/NickRefactoring.pdf</a>).<br>
><br>
><br>
> I don't think making broken code work better has a lot of value; I think<br>
> it's better to focus our efforts on making it easier to detect that code is<br>
> broken.<br>
<br>
</span>I agree. I did start working on this because of a similar problem, but<br>
I don't see it as a strong argument for upstream.<br>
<span class=""><br>
>> I was hoping this wouldn't have a noticeable code quality impact, but<br>
>> I have seen at least two issues<br>
>><br>
>> * Putting D0 in the D5 comdat is an ABI bug IMHO since it is never<br>
>> equal to D1 or D2 and doing so with linkonce_odr can bloat the code a<br>
>> bit by causing us to keep more functions then we need (keep D1/D2 if<br>
>> they get inlined into D0 for example).<br>
><br>
><br>
> It will cause us to emit more IR, but I don't see that it will cause us to<br>
> keep more functions; the D0 will still be discardable if it ends up unused,<br>
> right? (It looks like GNU ld's --gc-sections will keep sections that are<br>
> within a used COMDAT, but gold's --gc-sections will remove them.)<br>
<br>
</span>That is correct. All the references about bloat in my email assume a<br>
plain ELF linker, without using GC. With GC instead of bloat we just<br>
get a bit more work in LLVM and the linker.<br>
<span class=""><br>
>> * Using a COMDAT for the destructors of a class bar prevents D2 from<br>
>> being replaced with D2 of the base class. That means we end up with<br>
>><br>
>> define linkonce_odr void @_ZN3fooIiED2Ev(%struct.foo* %this)<br>
>> unnamed_addr #1 comdat $_ZN3fooIiED5Ev align 2 {<br>
>> entry:<br>
>>   %0 = bitcast %struct.foo* %this to %struct.bar*<br>
>>   tail call void @_ZN3barD2Ev(%struct.bar* %0)<br>
>>   ret void<br>
>> }<br>
>><br>
>> Instead of rauw of _ZN3fooIiED2Ev with _ZN3barD2Ev. We could teach<br>
>> LLVM to do this, but we are not there yet.<br>
><br>
><br>
> I think you can still RAUW; you just need to leave the derived dtor behind<br>
> if you leave any part of its comdat behind.<br>
<br>
</span>Yes. Clang could be made a bit cleaver to do a RAUW of _ZN3fooIiED2Ev<br>
and _ZN3fooIiED1Ev with _ZN3barD2Ev. It would require a bit more<br>
refactoring. I will give it a try to see if it gets too complex.<br>
<span class=""><br>
>> So it is not clear if this is worth it having it upstream. What do you<br>
>> guys think?<br>
><br>
><br>
> Not sure yet.</span></blockquote><div><br></div><div>I think on the whole I'm in favor of this change. It seems like the "morally" right thing to do, and it opens up the door to us getting other things right that we currently get wrong (such as address-of-label in a variadic constructor for a class with virtual bases).</div></div></div></div>