<div dir="ltr">Thanks Tim, that really helped in understanding the difference!<div><br></div><div>Thanks,</div><div>Rahul</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sat, Jul 13, 2013 at 6:30 PM, Tim Northover <span dir="ltr"><<a href="mailto:t.p.northover@gmail.com" target="_blank">t.p.northover@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="im">> clang version- clang version 3.4 (trunk 186087)<br>
> On compiling it with clang the output is:<br>
> sp1 points at 0xbf87d30f<br>
> sp2 points at 0xbf87d30e<br>
<br>
</div>Interestingly, it doesn't if -O3 is used.<br>
<br>
There's potential interactions with C++'s rule that each object has a<br>
unique pointer, though since C++11 doesn't mention alloca at all (it's<br>
POSIX) that's a bit of a shaky connection.<br>
<div class="im"><br>
> Would be really helpful if someone could throw some light on how stack<br>
> allocation and alignment takes place in clang?<br>
<br>
</div>Well, Clang just produces one of LLVM's "alloca" instructions for the<br>
code. The LLVM language reference at<br>
<a href="http://llvm.org/docs/LangRef.html#alloca-instruction" target="_blank">http://llvm.org/docs/LangRef.html#alloca-instruction</a> says: "allocating<br>
zero bytes is legal, but the result is undefined".<br>
<br>
More generally, all local variables get an LLVM "alloca" instruction,<br>
which can specify size and alignment. Various LLVM passes know how to<br>
optimise these (hence the difference between -O0 and -O3), and then<br>
they eventually get assigned to stack slots with the appropriate size<br>
and alignment during CodeGen.<br>
<br>
To understand what Clang does to your code, it's very helpful to give<br>
it the "-emit-llvm" option (I usually use "-S -o-" as well to actually<br>
see it). At "-O0" that'll be directly what Clang itself creates; at<br>
"-O3" it'll be the code after the LLVM passes have gone to work.<br>
<br>
What's happening here (at -O3) is that some pass ("InstCombine" by the<br>
looks of it) is combining the two "alloca 0" instructions into just<br>
one.<br>
<span class="HOEnZb"><font color="#888888"><br>
Tim.<br>
</font></span></blockquote></div><br></div>