<div dir="ltr">Hi Eli,<div><br></div><div>I'm not sure if this is the answer you're looking for, but the alloca, store and load can be removed by the mem2reg pass, which isn't run by codegen prepare in llc. If you invoke clang with -O1 or above it will run mem2reg, producing IR that contains only the gep, and that produces the assembly you're looking for:</div>
<div><br></div><div>$ clang -cc1 -emit-llvm -O1 takeaddr.c<br></div><div style>$ cat takeaddr.ll</div><div style><br></div><div><div>define i32* @bar(i32* %table) nounwind readnone {</div><div>entry:</div><div>  %arrayidx = getelementptr inbounds i32* %table, i64 2</div>
<div>  ret i32* %arrayidx</div><div>}</div></div><div><br></div><div style>$ llc takeaddr.ll</div><div style>$ cat takeaddr.s</div><div style><div style><snip></div><div>_bar:                                   ## @bar</div>
<div>## BB#0:                                ## %entry</div><div>        leaq    8(%rdi), %rax</div><div>        ret</div><div><br></div></div><div style>Cheers,</div><div style>Lang.</div><div style><br></div></div><div class="gmail_extra">
<br><br><div class="gmail_quote">On Fri, Feb 1, 2013 at 12:14 PM, Eli Bendersky <span dir="ltr"><<a href="mailto:eliben@google.com" target="_blank">eliben@google.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<div class="HOEnZb"><div class="h5">On Fri, Feb 1, 2013 at 12:11 PM, Eli Bendersky <<a href="mailto:eliben@google.com">eliben@google.com</a>> wrote:<br>
> Hello,<br>
><br>
> I'm playing around with some LEA-related code generation on x86-64<br>
> (trunk LLVM & Clang), and I run into a case I don't understand:<br>
><br>
> $ cat takeaddr.c<br>
> int* bar(int table[10]) {<br>
>   return &table[2];<br>
> }<br>
><br>
> $ clang -cc1 -emit-llvm takeaddr.c<br>
> $ cat takeaddr.ll<br>
> ; ModuleID = 'takeaddr.c'<br>
> target datalayout =<br>
> "e-p:64:64:64-i1:8:8-i8:8:8-i16:16:16-i32:32:32-i64:64:64-f32:32:32-f64:64:64-v64:64:64-v128:128:128-a0:0:64-s0:64:64-f80:128:128-n8:16:32:64-S128"<br>
> target triple = "x86_64-unknown-linux-gnu"<br>
><br>
> define i32* @bar(i32* %table) nounwind {<br>
> entry:<br>
>   %table.addr = alloca i32*, align 8<br>
>   store i32* %table, i32** %table.addr, align 8<br>
>   %0 = load i32** %table.addr, align 8<br>
>   %arrayidx = getelementptr inbounds i32* %0, i64 2<br>
>   ret i32* %arrayidx<br>
> }<br>
><br>
> $ llc -O3 takeaddr.ll -o -<br>
> .file "takeaddr.ll"<br>
> .text<br>
> .globl bar<br>
> .align 16, 0x90<br>
> .type bar,@function<br>
> bar:                                    # @bar<br>
> # BB#0:                                 # %entry<br>
> movq %rdi, -8(%rsp)<br>
> leaq 8(%rdi), %rax<br>
> ret<br>
> .Ltmp0:<br>
> .size bar, .Ltmp0-bar<br>
><br>
><br>
> .section ".note.GNU-stack","",@progbits<br>
><br>
> The first instruction in "bar" is not clear. Why is it needed? It<br>
> seems harmless, but does it serve any purpose? Alignment? ISTM that<br>
> the leaq suffices to pefrorm the actual task of the function. Is this<br>
> a missed optimization of some sort?<br>
><br>
<br>
</div></div>I should add that if I manually hack takeaddr.ll to avoid the alloca<br>
and store, instead using %table directly in the GEP, the movq goes<br>
away and only leaq remains.<br>
<div class="HOEnZb"><div class="h5"><br>
Eli<br>
_______________________________________________<br>
LLVM Developers mailing list<br>
<a href="mailto:LLVMdev@cs.uiuc.edu">LLVMdev@cs.uiuc.edu</a>         <a href="http://llvm.cs.uiuc.edu" target="_blank">http://llvm.cs.uiuc.edu</a><br>
<a href="http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev" target="_blank">http://lists.cs.uiuc.edu/mailman/listinfo/llvmdev</a><br>
</div></div></blockquote></div><br></div>