<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Feb 1, 2016 at 12:27 PM, Rui Ueyama <span dir="ltr"><<a href="mailto:ruiu@google.com" target="_blank">ruiu@google.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Even if a file is technically sane, you can craft a malicious one; for example, you can probably crash the linker by OOM by setting a very large number as an alignment requirement for each section so that the size of output becomes huge. It is easily doable using assembly. So my answer is "any clang or gcc produced .o not including inline asm". (It does not mean that we do not try to recover from errors caused by bad assembly code, but we don't/can't guarantee 100% recovery.)</div></blockquote><div><br></div><div>You can probably find some way to set the alignment using an attribute or whatever even from clang (and without inlineasm).</div><div><br></div><div>I don't think there is a platonically-ideal answer for this. It's more about goals:</div><div>- as a command line tool, we don't want legitimate users to see us crashing during normal use (if a user is intentionally trying to kill LLD, it is not as embarrassing though, so we don't need to worry much about that case).</div><div>- we want to be useful (someday) as a library that can be safely used in-process, so we need to provide certain guarantees (but these are not hugely constraining, because we can assume that the calling code is programmatically generating the file in good faith).</div><div><br></div><div>-- Sean Silva</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Feb 1, 2016 at 12:11 PM, Rafael Espíndola <span dir="ltr"><<a href="mailto:rafael.espindola@gmail.com" target="_blank">rafael.espindola@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div>On 1 February 2016 at 15:06, Rui Ueyama <<a href="mailto:ruiu@google.com" target="_blank">ruiu@google.com</a>> wrote:<br>
> On Mon, Feb 1, 2016 at 11:57 AM, Rafael Espíndola<br>
> <<a href="mailto:rafael.espindola@gmail.com" target="_blank">rafael.espindola@gmail.com</a>> wrote:<br>
>><br>
>> On 1 February 2016 at 14:46, Sean Silva <<a href="mailto:chisophugis@gmail.com" target="_blank">chisophugis@gmail.com</a>> wrote:<br>
>> > I think one of the main use cases that has been requested is to be able<br>
>> > to<br>
>> > programmatically call the linker with "known good" object files (i.e.<br>
>> > produced by the compiler). That simplifies things a lot. Rui's recent<br>
>> > patches that are thread_local'izing existing globals seems like a<br>
>> > satisfactory approach. Or am I missing something?<br>
>><br>
>> Yes, known good files are a lot easier to handle. We just have to be<br>
>> clear what "known good" is.<br>
>><br>
>> > The R_X86_64_REX_GOTPCRELX situation can probably be likened to someone<br>
>> > giving clang a piece of source code with an inline asm that has:<br>
>> ><br>
>> > .text<br>
>> > .byte <some garbage><br>
>> ><br>
>> > in it. We don't guarantee that the output "makes sense" because there's<br>
>> > really no way for us to know what "makes sense" in a precise way (i.e.,<br>
>> > a<br>
>> > way that we can program).<br>
>><br>
>> Would we still be required to check the offsets so we don't crash? An<br>
>> assembly file can contain<br>
>><br>
>> .reloc 0, R_X86_64_REX_GOTPCRELX, foo<br>
>> .long 4<br>
>><br>
>> which would put that relocation in an invalid location. In general, is<br>
>> an arbitrary assembly file to be considered "known good"? Is that true<br>
>> even for things like<br>
>><br>
>> .section .eh_frame, ....<br>
>> garbage<br>
>><br>
>> that the linker has to parse?<br>
><br>
><br>
> I think the answer is case-by-case, but I don't think we have to guarantee<br>
> to recover from errors caused by carefully-crafted malicious object files.<br>
> (Is there anyone who disagrees with that?)<br>
<br>
</div></div>It is definitely not a use case *I* have an interest in. I just want<br>
to be an agreement on what use case we want to support at the moment.<br>
Is it "any .o file", "any llvm-mc or gas produced .o", "any clang or<br>
gcc produced .o not including inline asm"?<br>
<br>
Cheers,<br>
Rafael<br>
</blockquote></div><br></div>
</div></div></blockquote></div><br></div></div>